【摘 要】
:
基因微阵列数据的应用在目前的疾病预测研究中效果显著,它能帮助提高医疗效率和改善医疗效果。然而伴随着医疗领域信息化发展的不断加快,医疗行业面临到了海量数据以及非结构
论文部分内容阅读
基因微阵列数据的应用在目前的疾病预测研究中效果显著,它能帮助提高医疗效率和改善医疗效果。然而伴随着医疗领域信息化发展的不断加快,医疗行业面临到了海量数据以及非结构化数据的挑战。大量纷繁多样的数据使得预测模型难以建立,预测性能不甚理想。本文主要是针对基因微阵列数据进行分析预测,进行了如下研究:(1)本文介绍与讨论了对基因微阵列数据集中的重要属性进行字段筛选的方法。从而提取出非结构化的基因微阵列数据里面的重要属性。并选用了极限学习机算法对筛选出来的样本数据建立预测模型,找出数据中标签与特征之间的映射规则,从而利用训练得到的预测模型进行疾病预测。极限学习机(ELM)是一种速度非常快的数据挖掘算法,该算法利用最小二乘原理建立预测值与实际值之间的关系表达式,再利用广义逆原理求解满足关系式的最小范数最小二乘解即预测模型中的重要系数,建立出最终的预测模型。它的泛化能力和求解速度均优于传统的神经网络算法、决策树、支持向量机(SVM)等预测算法。(2)本文对预测模型进行优化的原因在于,在进行数据采样时,数据维度映射到高维空间后,样本数据集中的某一部分样本数据被误归入了其他分类,因此非结构化的基因微阵列数据样本中存在不同比例的异常值,所以极限学>习机(ELM)算法的泛化能力-与预测精度受到影响。本文对造成极限学习机(ELM)算法性能低下的原因做出分析得出,在进行预测模型建立的时候,训练算法将每个样本都进行了相同的处理,必然存在异常的样本数据影响预测模型的性能,为了减小错误样本数据对预测模型性能的影响,文章可提出了对样本数据的输入进行加权的解决办法,优化出两种算法,分别是加权的极限学习机(WELM)与双加权的极限学习机(BWELM)。(3)本文利用加州大学欧文分校(UCI)机器学习库所提供的4组基因微阵列疾病数据集分别对传统的极限学习机与单、双加权后的极限学习机进行了预测算法分析的实验,实验给出了在不同异常值(异常值比例从0至0.3)时各个算法的预测性能。实验结果分析指出,在存在异常值的情况下,经过加权处理后过的极限学习机算法的预测精度更高。
其他文献
粘弹阻尼道床是受约束阻尼结构的启发所发明的一种新型的道床减振方式,结构主体是由道床(约束层)、基层和由粘弹阻尼材料组成的阻尼层构成。但在实际工程中,列车往往因紧急制
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。知识获取瓶颈问题是制约词义消歧技术发展的重要因素,现存多种
可见光通信(Visible Light Communication,VLC)技术因其绿色环保且不占用传统无线电频谱资源,近年来受到了中外学者的广泛研究和各国政府的大力支持。为了满足光线亮度的需求
城镇化问题在中国争论了几十年,从大拆大建的造城运动到十八大以后倡导以人为本的新型城镇化改革,这期间经历了从对地的城镇化到对人的城镇化的转变。不管是“成都模式”、“
本文是一篇英译中模拟交替传译实践报告,选取普林斯顿大学出品的访谈类节目——《国际座谈会“奥巴马医疗改革:神话还是现实”》为模拟交传案例,分析目的论原则在访谈类节目
针对柔性关节空间机械臂动力学建模与仿真问题,以空间三维四连杆柔性关节机械臂模型为研究对象,考虑扭转弹簧非线性刚度系数、惯性耦合等因素,应用Lagrange方程建立动力学模
数据挖掘的目的是通过运用特定的算法,从大量数据中发现有用的规则和模式,并用于描述和预测。贝叶斯网络是一种描述变量间概率依赖关系的有向无环图,它提供了一种自然的表示
胶东地区先秦考古工作开始于上世纪30年代,在90年的发展历程中,随着考古发现的不断补充,研究的持续深入,以及技术的革新、理论的完善,胶东地区考古工作取得了一定的进步和发展。胶东地区旧石器时代早期至晚期一直有人类居住,这一时期的考古发现主要是遗址、洞穴及打制石器和动物化石等遗物,通过这些遗存可以反映出胶东地区与日本、朝鲜的旧石器时代文化有着一定的联系,并且是当时古文化交流的重要途径。胶东地区新石器时
海参,是棘皮动物门,海参纲的无脊椎动物。海参蛋白含量高脂肪含量低,含有多种功能成分,具有延缓衰老、预防和改善多种疾病等保健功效,无论是药用还是食疗,都具有很高的价值。市面上常见的刺参多呈青色,偶见白色刺参,但是近期养殖时筛选出了一种通体呈紫色的刺参,实属罕见。为探究紫刺参的优势价值,给紫刺参合理的市场定位,本论文以青刺参和紫刺参两种刺参为研究对象,对两种刺参的常规化学成分和营养成分、免疫酶活性和色
焊接作为现代制造工艺中一门非常重要的工艺技术,在机械制造领域中得到了广泛的应用,但是由于其工作时候产生的热辐射以及一些有害气体对人体的危害是比较大的,为了改善操作工人