基于不均衡样本的脉象信号分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:onepieceeee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脉诊是中医四诊之一,是中医诊断疾病常用的方式。脉诊包含丰富的病理信息,且是一种无痛无创的诊断方式。“脉为医之关键,医不察脉,则无以别证,证不别,则无以措治”(徐春甫《古今医统》),由此可以看出脉诊在中医中的地位。随着近几年人工智能的兴起,机器学习与医学诊断逐渐的结合,在中医方面也促进了脉象诊断的发展。在实际场景中,脉象数据存在着严重的数据不均衡问题。直接基于不均衡的脉象数据训练分类器,容易导致分类器对少数类脉象信号样本分类效果不佳。然而,在现实社会中,人们倾向于关注少数类脉象信号样本所对应的疾病,例如健康和癌症两类样本,癌症更加受人们重视。如果分类器不能很好地识别少数类疾病样本,将其误分为多数类样本将导致很大的损失。基于以上问题,本文通过分析脉象信号的特点,从特征选择、脉象信号不均衡处理、特征融合、脉象信号多分类等方面进行研究。在脉象信号特征选择方面,利用PCA算法对脉象信号进行降维,然后利用类别可分性准则对脉象信号进行特征选择,以此得出最优的特征集。在不均衡脉象信号的处理方面,主要从数据层面和算法层面两个角度解决。在数据层面,本文对基于遗传算法的下采样方法进行了改进,将遗传算法中衡量染色体适应度值的弱分类器改进为适合脉象信号的强分类器。为了选择信息丰富的多数类脉象信号样本,改进后的算法试图最大化原分类器的性能,最小化原始多数类脉象信号样本与下采样后多数类脉象信号样本间的损失。在算法层面,本文对固定近邻引力算法进行了改进,改进后的算法的主要思想是将训练集中的脉象信号样本看成有质量的实体,实体之间具有引力作用。通过利用脉象信号测试样本的K近邻点对其的引力总和来判定测试样本的标签。通过本文实验验证,这两种改进后的算法能够在一定程度上提升不均衡脉象样本的分类性能。利用多重集典型相关性分析方法将脉象信号的Gabor特征、STFT特征、脉象二维矩阵特征和wavelet特征进行融合,并通过一对一多分类法、基于无向图的多分类法和基于纠错编码的多分类法完成了脉象信号样本的多分类实验。
其他文献
品味自然的味道——与芒果、石榴、香蕉、江鱼结缘生活气息浓郁到可以下肚;
结晶聚合物的结晶动力学影响其形态结构,而形态结构的变化对材料的性能有着重要的影响[1].成核剂能有效地降低聚合物的球晶尺寸,提高材料的性能[2],因此被广泛地应用于工业生
计算机产业已经成为影响国民经济发展的重要因素,但从经济学角度对计算机产业的研究却与其发展速度明显不相称。本文从计算机硬件市场入手,运用产业组织理论的SCP分析方法对
本文基于网络外部性环境,研究一个制造商和两个零售商的收益共享契约博弈模型。首先分析分散决策和集中决策下网络外部性因素对供应链成员决策的影响,并在此基础上建立了收益
企业的固定资产投入使用后,为了适应新技术发展的需要,或者为维护或提高固定资产的合用效能,往往需要对现有固定资产进行维护、改建、扩建或者改良。这项支出增强了固定资产获取
在半经典近似下将动力学李代数方法和中间绘景结合应用于原子-双原子分子(非谐振子)共线碰撞中的平动-振动传能的研究,在群参量的一级下求解群参量的运动方程,进而确定时间演化算符
目的 评价氩氦刀低温冷冻治疗前列腺癌的临床效果。方法 采用美国ENDOCARE公司制造的CRYDCARE低温手术系统进行手术。26例前列腺癌患者在腰麻或硬膜外麻醉下,经直肠超声或腹部
随着城市现代化建筑的快速发展,在城区内呈现出古建筑与新住宅并存的局面,这对房产物业管理部门来说,如何加强房产管理,优化服务,不仅是提出一系列管理服务的新课题,也面临着新的日
微米和纳米尺度的图案化表面的制备在微电子、光学、生物、化学和材料科学等领域具有重要的科学意义和应用价值[1~3]. 由于需要复杂昂贵的设备和苛刻的工作环境, 光刻技术难以
心源性休克是急性心肌梗死的严重并发症之一,老年急性ST段抬高心肌梗死(ST—elevatedmyocardialinfarction,STEMI)合并心源性休克是临床上的高危人群,内科药物治疗效果差,病死率通