基于距离度量学习的医疗数据挖掘研究与应用

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:memeshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗可穿戴设备等智能科技设备地涌现和普及,医疗健康数据爆发性增长,人类不断重视自身的健康,从更智能化的角度关注自己的身体状况,却又不可避免被重大疾病所困扰。人工智能和大数据技术在医疗健康领域研究蓬勃发展,为海量健康数据的充分使用提供了新的思路和方法,更为人类享受更好的医疗健康服务和免受疾病困扰提供无限可能。癌症、心血管疾病等不仅对人类身体带来伤害,更是给心理蒙上沉重的阴影,故借助数据挖掘技术进行疾病早期诊断预防是十分必要的。因此,本文将基于医疗健康体检数据,提出基于余弦度量和大边界近邻度量LMNN算法的局部簇距离度量学习COS-SUBLMNN算法,提高分类器精度,并构造疾病早期筛查和高危人群识别模型,融合患者的诊断反馈,最终实现疾病诊断系统的设计。论文主要研究距离度量学习算法、癌症早期筛查模型、模型优化评估和疾病风险诊断系统。首先,融合余弦度量和LMNN提出能够改善分类器性能的COS-SUBLMNN算法。接着提出适用于医疗健康体检数据的预处理和特征选择方案。然后,以癌症早期筛查为应用场景,LMNN建立模型,并与传统数据挖掘算法对比,选择合适评价指标验证距离度量学习算法的优势性。最后,本文以COS-SUBLMNN距离度量学习算法为核心,根据模型效果反馈不断优化算法性能,最终实现疾病风险诊断系统,并以癌症和心血管疾病加以验证。论文设计并完成了基于距离度量学习算法的疾病风险诊断系统和验证了改进算法COS-SUBLMNN性能的优势性。验证了包含距离度量思想的支持向量机和距离度量学习算法LMNN对癌症的预测比RF和ANN表现更好。与KNN和LMNN算法对比,本文提出的COS-SUBLMNN算法在癌症和心血管疾病诊断中效果更好,实现了利用距离度量学习算法对重大疾病诊断和患病高危人群识别的目的。本文研究成果在医疗健康数据挖掘领域具有现实意义。
其他文献
随着物联网技术在工业应用中的越来越深入,将热处理生产与物联网技术相结合,开发基于物联网技术的热处理智能监控系统,能够极大的促进我国热处理行业的信息化和自动化发展。
南京商业学校倡导"学业争优"的目的就是形成积极竞争的良好风气,提升学生学业水平。深入调研专业发展状况并合理设置课程、强化教师专业建设且不断提高业务素质、建立学业发
目的研究橙皮苷对刀豆蛋白A(Con A)致小鼠急性肝损伤的保护作用及其对肿瘤坏死因子-α(TNF-α)和干扰素-γ(IFN-γ)表达的影响。方法 72只SPF级C57BL/6雄性小鼠,随机均分为正
目的观察诺和平、诺和灵N分别联合诺和锐药物在治疗2型糖尿病疾病方面的效果和安全性。方法50例患者随机分为A、B两组,均于三餐之前皮下注射诺和锐。A组患者睡前皮下注射诺和
从山西石灰性土壤作物根际分离筛选出多株溶磷细菌,经过多次分离纯化得到一株溶磷能力较强的菌株W25,通过菌落形态、生理生化特性和16S rRNA序列分析,确定溶磷菌W25为拉恩式
目的了解成年居民血脂水平及其影响因素,为制定防治措施提供依据。方法采用多阶段分层整群随机抽样法抽取桐乡市≥18岁成年居民进行问卷调查、体格检查和血脂检测,采用单因素
目的探讨微创血肿清除术与小骨窗开颅术治疗高血压脑出血的临床疗效。方法将82例高血压脑出血患者分为观察组和对照组,各41例。观察组给予微创血肿清除术,对照组给予小骨窗开
目的比较老年Ⅱ、Ⅲ期直肠癌患者放疗后同未行放疗治疗,全系膜切除术后吻合口瘘发生率的差异,探讨老年Ⅱ、Ⅲ期直肠癌患者术前放疗导致吻合口瘘发生的危险因素,总结其预防措
<正>《三戒》作为柳宗元寓言散文的名篇,向被人视为讽刺小品的典范。但是,参考作品的写作背景及文本本身,笔者以为《三戒》的讽刺意图当远逊于其寓理、寓识之处。与其将《三