数据挖掘技术在区域死因登记数据中的应用研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:www0908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卫生计生系统的死因登记数据存在巨大的价值,如何有效的挖掘出区域死因登记数据中的价值值得研究。本文主要研究如何将数据挖掘技术应用于死因登记数据,包括探索性研究、传统方法改进和验证性研究等三方面,主要工作如下:1.依据数据挖掘通用流程,对死因登记数据展开探索性研究。通过对死因分布的分析挖掘,发现癌症、脑血管病以及心血管病死亡占比较高,进而对于高死亡占比的重大疾病的死亡情况进行时间序列建模,并对模型的预测应用进行了讨论。2.死因登记数据同时包含有序型分类变量和无序型分类变量,属于混合型分类数据。针对传统K-modes聚类算法不足,提出一种适用于混合型分类数据的K-modes聚类改进算法。改进算法对于有序型分类变量和无序型分类变量分别采用不同的距离度量,并用平均熵给变量赋予相应权重。实验表明改进算法在聚类正确率和聚类距离指标上表现更优。3.基于死因登记数据开展验证性挖掘,研究出生日期的启示性。研究表明“生日即忌日”现象广泛存在于多种划分的子人群中,利用随机森林算法选择影响该现象的重要特征变量发现最高诊断医院、死因、受教育程度这三个重要性排在最前。关联规则挖掘的结果也验证了这一结果。
其他文献
<正> 谈起Internet我们已经不再陌生,它已成为最热门的话题。它自1969年创建于美国至今,逐渐步入商业化,取得了惊人的成绩,并以极快的速度在全球扩展。做为世界上最大的计算
为探析高原湖泊所集成的小尺度自然流域景观空间变化及其对景观生态风险的影响,以云南洱海流域3期(1995年、2005年和2015年)Landsat遥感影像解译数据为基础,利用GIS空间分析
同步辐射X射线显微成像技术由于光源穿透深度大,衬度来源丰富(吸收、荧光、化学态、自旋、相位等都可能用来成像),可以分析物体中的各种亚结构,适合对聚合物核壳结构微球的内部
盾叶薯蓣是用来生产甾体激素类药物前体薯蓣皂苷元的重要植物资源,其根茎中不仅含有1.1~16.5%的甾体皂苷,还含有40-50%的淀粉和40-50%的木质纤维素,传统酸水解法生产薯蓣皂苷
<正> 今年以来,一个令大多数中国人还十分陌生的名词——"中国黄页",被国内外众多报刊介绍,为了使广大读者详细了解有关"中国黄页"的情况,本刊特约记者采访了"中国黄页"创始
注射压缩成型是将传统注射成型和压制成型相结合并吸取两种工艺成型优点的一种成型工艺。与传统注射成型相比,注射压缩成型可以降低注射压力的要求,减少塑件内应力和翘曲,减
目的探讨河南省大学生对不同途径艾滋病感染患者的社会歧视状况,为艾滋病防治工作提供参考依据。方法采用社会距离量表,对整群抽取的河南省3所大学的849名学生进行问卷调查。
目的研究橙皮苷(HDN)对非酒精性脂肪肝大鼠的保护作用及其机制。方法脂肪乳剂灌胃﹑饮用蔗糖溶液制备大鼠非酒精性脂肪肝模型。于9周末处死大鼠,测定血清肿瘤坏死因子-α(TNF-
目的:探讨葛根素(puerarin,Pue)在心肌细胞氧化应激损伤中的保护作用。方法:利用H2O2处理心肌H9c2细胞,建立氧化应激损伤模型。采用激光扫描共聚焦显微镜成像法测定线粒体膜
P2P网络贷款行业近几年发展迅猛,各项指标的增长速度与贷款规模大大超出了人们的想象。这是互联网金融的伟大创新,也是我国民间借贷市场的蜕变与升华。P2P网络贷款不同于传统