属性约简与加权方法的研究及其应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:wxjct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着海量数据的指数级增长,数据挖掘作为处理海量数据的技术,有着广泛的应用前景。在海量数据挖掘中,属性约简方法的研究是研究者们关注的热点话题,如何有效的且最大限度的从高维数据中筛选出重要属性,是进行数据分析的重中之重。在进行决策分析过程中,属性加权方法的研究也是不可避免的环节,如何合理的分配属性权重对最终决策的重要性大小,是提高决策准确性和水平的关键。本文着重研究属性约简算法和属性加权算法,分别对已有的不同算法进行改进,并将其应用于肝癌微血管侵犯的预测中。一是针对基于邻域粗糙集的属性约简算法中未考虑相关属性之间的相互影响问题,提出了一种基于卡方检验的邻域粗糙集属性约简算法。首先利用卡方检验方法计算各个属性间的相关性的大小,在属性约简时考虑相关属性之间的影响,即计算单个属性和其相关属性的重要度之和,使得筛选结果更加准确和有效。实验表明该算法表现出了较好的效果。二是针对基于层次分析法的属性加权算法在构造判断矩阵时过于主观的问题,提出了一种主客观相结合的属性加权算法。首先利用皮尔逊相关系数计算两两属性间的系数大小,然后根据系数大小构造出成对比较矩阵,计算属性的权重值,再与熵权客观分析法求出的权重值组合得到最终的属性权重值。相对于完全主观的矩阵构造,该方法在一定程度上避免不确定性,既能体现出主观的经验知识判断,又能挖掘出客观数据的潜在价值。将本文提出的属性约简算法和属性加权算法应用于肝癌微血管侵犯的预测中,首先利用本文提出的属性约简算法对肝癌微血管侵犯数据降维处理,然后用本文提出的属性加权算法计算降维后的各个属性的权重值,最后将其与梯度提升树分类模型进行结合,构造肝癌微血管侵犯预测模型。从预测模型的准确性、灵敏性、特异性和受试者操作曲线结果来看,本文提出的算法与分类模型的结合效果较好,各方面指标都达到了较优的效果。
其他文献
随着人类社会的不断发展和生态环境的日益恶化,太阳能、氢能等清洁可再生能源得到全球的重视。过渡金属硫族化合物作为新型半导体材料,因其优异的光电化学性能及理化性质,在太阳能电池、光催化等领域引起了研究人员的关注。铜钡锡硫硒作为新一代过渡金属硫族化合物,不仅具有原料储量丰富、成本低、吸收系数高、带隙可调的优点,还克服了其他金属硫族化合物(如铜锌硒硫等)反位缺陷的问题。基于铜钡锡硫的单结太阳能电池转换效率
目的1本研究的目的是对胃食管反流合并哮喘病人给予质子泵抑制剂(proton pump inhibitors,PPI)治疗的不同方案进行系统评价,首先对其有效性做出评价,其次研究与安慰剂相比PPI能否改善哮喘症状和肺功能,从而为其临床应用提供科学的合理化的循证依据。2本研究的目的是随着PPI在肾移植患者中越来越多地使用,PPI的不良反应对肾移植患者是否具有临床意义尚不清楚。我们对其安全性进行评价,以
目的:观察止痛散敷脐治疗儿童过敏性紫癜(腹型)中虚脏寒证的临床疗效。方法:收集2018年4月~2019年3月山东中医药大学附属医院儿科病房过敏性紫癜(腹型)中虚脏寒证的患儿共60例,其中对照组30例予西医基础治疗配合小建中汤加味煎汤口服,治疗组30例在对照组治疗的基础上予止痛散敷脐治疗,7天为1个疗程,治疗1个疗程。观察止痛散敷脐治疗对腹型症状体征的疗效及激素使用率、减量时间的影响。结果:1.治疗
部分上市公司长期面临主营业务亏损或是盈利下降难以扭转的情形,在竞争日益加剧的今天,这些公司需要做出战略转型的选择,通过转型来获得新的利润增长点,增强上市公司持续发展
精准扶贫是习近平总书记2013年在扶贫会议上首次提出的扶贫政策,是指针对不同的贫困环境,不同贫困程度的农户状况,运用科学有效的程序与方法对扶贫对象实施精准识别,精准帮扶,精准管理的治贫思想。长期以来,我国的扶贫项目积累了一些经验,也存在着一些问题:扶贫目标不正确、扶贫政策不合理、扶贫项目效果不佳、专项扶贫资金不足、扶贫资金使用率低以及扶贫待遇不公等,这些问题无不体现着精准的重要性,向真正有需要的人
在文中,我们研究一类非线性椭圆型方程的解的存在性和渐近行为。首先利用上下解方法,在有界区域上通过求得其爆炸上解和爆炸下解,证明了其爆炸解的存在性,进而通过摄动方法得
目的对自制坎地沙坦酯片的处方及工艺条件进行筛选和优化,确定合理的处方和科学的生产工艺;建立有关物质、溶出度和含量测定等质量控制方法;初步考察制剂稳定性,通过质量对比,以期达到自制片剂与进口原研片剂“必洛斯”体外药学一致性的目的。方法本课题的研究内容分为三个部分。第一部分为自制坎地沙坦酯片的处方设计及工艺优化,第二部分是自制坎地沙坦酯片的质量控制研究,第三部分为自制坎地沙坦酯片的稳定性初步考察。在广
研究目的了解小儿传染性单核细胞增多症(Infectious Mononucleosis,IM)的症状体征、并发症、实验室检查的特征以及出生、发病时间五运六气各要素的分布规律,探讨IM患儿出生及发病时间五运六气与其并发肝损害的相关性,并建立预测模型,为临床防治提供参考。研究方法选取山东中医药大学附属医院及山东大学齐鲁医院2003-2018年收治的诊断为IM的病例,通过逐层筛选,建立IM及原发性EBV
度量空间上的Roe代数是“非交换几何”及算子谱理论领域非常重要的C~*代数。本文研究了离散度量空间X上两类Roe代数的理想结构。一类Roe代数由X上具有B(H)系数的有限传播算子
氨气选择性催化还原(NH3 SCR)技术是有效脱除NOx的重要手段之一,其核心是高性能SCR催化剂的开发。Cu/SSZ-13因其高活性、宽温度窗口和高N2选择性,有望成为新一代车用脱硝催化剂