函数型数据的聚类分析 ——老年人健康状况分类

时间:2021-10-08

1.研究背景

老年人由于心脏血管老化、冠脉血流量下降、心肌收缩性及兴奋性恢复延 迟、心搏出量减少等,出现中医"宗气虚"表现。在此基础上若增加心脏负荷, 使宗气下陷,升举无力,失于温煦推动,血滞心脉,则导致老年充血性心力衰 竭的发生。宗气下陷与老年充血性心力衰竭在发病基础、临床表现上有高度的 一致性,是老年充血性心力衰竭发病的重要病机,升补宗气是老年充血性心力 衰竭的重要治法。 在医学上,心率和呼吸之间从不同的方面反映了老年人的身体特征,二者 之间有密不可分的关系。如果老年人通过佩戴仪器监测心率和呼吸频率的变 化,是否可以利用这些观测采集的数据对老年人健康状况进行聚类,进一步验 证说明心率和呼吸频率变化不同的老年人是“宗气”表现程度不同的人群,是 本研究要解决的问题。

2.研究目标

某医院对 58 位老年人通过可穿戴仪器测量了某天下午 1 点至 6 点的心率和 呼吸频率数据,这些数据是连续监测得到,如果将其平均得到一个或几个数值 进行分析,会损失很多信息。若能假定心率和呼吸频率的变化是一个连续且平 滑的过程,可以将每个指标的变化用函数进行刻画,采用双变量函数型数据聚 类方法,对老年人进行聚类分析。通过聚类分析,回答心率和呼吸频率变化不 同的老年人是否为宗气程度不同的人群。

3. 研究结果及意义

仪器测量的心率和呼吸频率是某天下午 1 点到 6 点的监测结果,图 1 是某 位老年人的心率和呼吸频率观测数据与函数曲线拟合图,可以看出,其变化可 以是连续并光滑,且表现为非周期性,采用 B 样条构建基函数。最终选用 8 个 基函数,建立与类别相关的双变量降秩模型,将 58 位老年人聚成三类。聚类结 果如图 2 和图 3 所示。

20211008/ba890a4c237441ef92ea3beb9a5cfc41.png


由图 2 可以看出三类老年人的心率变化。第二类老年人群的心率波动明显高于第一类和第三类,最低点为下午两点左右,最高点为下午五点至六点之间,从每分钟 60 次到 110 次左右,最低点与最高点大约相差 50。第三类老年人的心率变化较为平缓,最低点也是下午两点左右,最高点为下午一点略高于70,其它时间基本都在每分钟 70 次以下,最低点与最高点差值略高于 10。第一类老年人的心率变化最为平缓,在下午四点左右达到最低值 70,最高值在下午一点半左右略小于 80,其它时间基本在每分钟 70 到 80 之间,最低点与最高点差值略低于 10。医学理论提出正常人每分钟心率在 60 至 100 次之间,健康人每分钟心率一般在 55 至 70 之间。因此从心率的变化可以看出第一类和第三类老年人的心率变化比较正常,而第二类老年人的心率水平变化最大,最高值高于 100,说明第三类老年人的心率状况相对最好,第二类老年人的心率状况相对最差。

20211008/1d2f6fca20e04c5ed3193f8287ff5f03.png

从图 3 可以看出三类老年人的呼吸频率变化。第二类老年人群的呼吸频率变化幅度明显高于第一类和第三类老年人,在下午四点半达到最低值,下午三点半达到最高值,波动范围约为 40。第一类老年人波动较为平缓,在下午一点半达到最高值 26,在下午两点左右达到最低值 20,两点之后该类老年人的呼吸频率没有明显变化。第三类老年人波动也较平缓,在下午两点半达到最低值,不到 20,下午一点和四点达到最高值,不到 25,平均水平略低于第一类老年人。医学上认为正常人的呼吸频率为每分钟 12-20 次,呼吸频率的变化可以表明第三类老年人非常健康,第二类老年人的健康状况较差。同时根据与类别有关的双变量降秩模型,可以计算出不同类别人群中两个变量之间的相关性。第三类人群在心率和呼吸频率上的相关系数为 0.93,说明健康的老年人心率和呼吸频率具有高度的正相关性;第二类人群在心率和呼吸频率上的相关系数为 0.48,说明不太健康的老年人心率和呼吸频率相关性不强,变化不同步。总的来说,第三类老年人属于老年人中健康的人群,是“宗气”足的一类;第二类属于老年人中健康状况较差的人群,是“宗气”不足的一类;第一类老年人是介于第三类与第二类之间的较为健康的人群。

北京市海淀区中关村大街59号 电话:(86)10-62511318 传真:(86)10-62515246 邮编:100872

版权所有 © 中国人民大学统计学院