基于中医临床数据的疾病分类关键方法研究

来源 :西南石油大学 | 被引量 : 0次 | 上传用户:JockWang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中医信息化发展,中医诊断的客观化研究日益受到国内外重视。如何充分利用宝贵的中医临床数据资源来为中医学诊疗提供科学决策支持,促进中医学进一步发展,已成为研究的重点。数据挖掘是解决这些问题的一个新方法,而分类作为数据挖掘的主要研究内容之一,在中医临床辅助诊断中日益受到重视。特征选择可以提高分类性能,同时也为寻找中医特征和疾病之间的关系提供一种新思路。本文结合已收集中医临床数据的实际情况,从不均衡数据分类、多标记分类、特征选择对分类的影响这三个关键方面,对临床数据进行疾病分类研究。期望通过提高分类性能,进而提高计算机辅助诊断能力。主要工作有:第一,不均衡数据疾病分类方面。从数据层面入手,结合中医临床数据的实际情况,在欠采样的基础上进行改进。结合改进的抽样方式、Asymmetric Bagging提出改进算法FPUSAB。实验结果表明,与Asymmetric Bagging相比,FPUSAB算法在AUC上平均提升了 10.5%,在Bacc上平均提升为8.4%。第二,多标记数据疾病分类方面。针对中医临床数据存在的类别不均衡以及ML-kNN在寻找近邻的缺点,在WML-kNN的基础上引入粒计算提出了改进算法WM4LG-GkNN。实验结果表明,与改进前的算法相比,WML-GkNN在Hammin Loss上平均提升11.2%,在Avg precision上平均提升5.3%,Coverage上平均提升2.1%,One-Error上平均提升5.1%Ranking loss上平均提升7.6%。第三,特征选择对分类的影响。中医临床数据特征较多,不利于计算机辅助诊断。针对不均衡数据疾病分类的特征选择,引入预测风险标准,基于FPUSAB算法提出了PRFS-FPUSAB算法,实验表明特征选择后AUC平均提升了 7.4%;对于多标记疾病分类,使用在冠心病具有很好选择性能的HOML算法对多标记数据进行特征选择,实验表明特征选择后分类指标Hamming Loss平均提升17.77%、Avg precision平均均提升6.28%、Coverage 平均提升 15.73%、One-Error 平均提升 10.21%、Ranking Loss、平均提升25.22%,并且选择出的特征符合中医学相关疾病理论。
其他文献
通过对独立学院英语专业学生的日语教学采用日本动漫资源辅助教学进行试验及调查,结果显示:日本动漫资源辅助日语教学能较大程度地激发学生学习日语的热情,能拓展学生的视野;在输
无症状性脑梗塞(ACI)又称静止性脑梗塞(SCI),是近年来在脑卒中病人和正常人神经影像检查时发现的一类脑梗塞。按美国1990年脑血管病新的分类标准,ACI被列为第1种脑血管损害。但到目
目的探讨结肠损伤诊治。方法对2012年1月~2014年3月收治的20例结肠损伤的临床处理资料进行分析。结果闭合性损伤17例,开放性损伤3例。手术确诊18例,术前确诊2例。经修补治愈18
建筑工程的质量直接关系到工程的寿命及使用功能,同时也关系着人们群众的生命财产安全,影响企业的经营效益,下文就结合具体的工作情况分析建筑工程质量管理的情况,提出有效的管理
白细胞介素-17(IL-17)是由辅助性T细胞17(Th17细胞)分泌的特征性细胞因子;在固有免疫反应和宿主对病原体的防御过程中,IL-17发挥了必不可少的作用[1-2],被称为强大的致炎因子。其
本论文旨在研究基于心理时-空模型的教学方法对中学生英语时态学习的影响。本研究所探讨的研究问题如下:1.基于心理时-空模型的教学方法是否影响中学生对英语动词时态的学习
近年来,我们自制化积液治疗子宫肌瘤,在B超检测下观察其对子宫肌瘤体积的影响,并与对照组比较,报道如下。
依据生态足迹模型,计算了苏州市2004—2008年开展循环经济期间的生态足迹,并对其生态足迹多样性指数和可持续发展能力指标等进行分析。分析结果表明,自2004年推进循环经济以
目的探讨肛周脓肿患者的临床护理方法。方法将28例周脓肿患者随机分成两组,对照组和试验组,每组14例,对照组予以常规护理,试验组针对性护理,观察两组并发症发生情况及临床护
<正>~~
期刊