基于群体智能的特征选择算法在SELDI质谱数据分析中的研究

被引量 : 0次 | 上传用户:zx385213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是生物信息学各个应用领域建模任务的前提。这些领域如生物序列分析、微阵列数据分析及质谱数据分析等都存在高维小样本和内部空间疏散的特性,由于小样本数据存在其固有的危险:不精确和过拟合,因而数据分析面临着巨大的挑战。结合生物信息学应用领域这些具体的特点,各种新的稳定行和鲁棒性好的特征选择算法不断地被提出。质谱技术能够检测生物样本(组织和细胞抽取物、血液、尿液等),获得样本中目标蛋白的分子量。因此,该方法能够识别出与疾病相关的模式,从而为寻找疾病标记物、特异的治疗疾病的靶分子、药物开发和疾病的诊断、治疗等提供重要的、直接的线索。本文系统地研究了SELDI-TOF质谱的数据分析,并将群体智能优化算法结合支持向量机(SVM)应用于质谱数据分析的生物标记物特征选择中。主要工作分为以几个方面:1)对国际上目前的研究前沿SELDI-TOF质谱技术进行理论研究,归纳了比较了SELDI-TOF质谱数据分析中的预处理方法和生物标记物选择方法,并总结了质谱技术存在的问题和发展方向。2)对群体智能算法,特别是蚁群算法(ACO)、粒子群算法(PSO)、及对应的改进算法的基本原理进行研究,为以后的学习应用提供了理论基础。3)将特征的权重因子作为ACO算法搜索过程中的先验信息,结合支持向量机(SVM)用于筛选血清蛋白相关生物标记物,该方法建立的癌症诊断模型取得了较好的分类性能测试仿真结果。4)将基于量子粒子群算法(QPSO)、ACO算法和粒子群算法(PSO)分别与SVM结合,并将建立的诊断模型用于生物标记物的选择。通过实验表明,基于量子粒子群算法建立的模型不仅具有良好的预测精度而且在速度上有大幅的提高,因此,具有一定的理论意义和实用价值。最后对本论文的主要研究成果进行了总结,并对有待进一步研究的方向进行了展望。
其他文献
中央西部大开发战略的实施与深入,将进一步提高中国与中亚各国经贸合作及相互投资的层次并使合作程度向纵深发展。作为中国在中亚最大的贸易伙伴,哈萨克斯坦以其独立以来对外
目的探讨依达拉奉治疗特发性肺纤维化(Idiopathic pulmonary fibrosis,IPF)的临床疗效和安全性。方法将IPF患者42例随机分为2组:治疗组22例,依达拉奉治疗;对照组20例,常规甲
邮政储蓄银行打破了邮政储蓄多年"只存不贷"的经营模式,并于2007年3月20日挂牌成立,其依托网络、资金等优势把经营目标锁定为中、低端客户,其所经营的业务范围也随之扩大。邮
数学是人类活动的结果,处于动态发展的状态。数学史与数学教学的整合是数学工作者关注的重要问题。数学史与数学教学整合的认知研究内容包括数学的本质、数学与文化的关系、
随着印刷电路板行业的发展,使用的电镀添加剂种类和数量越来越多,成分也越来越复杂,含有这种添加剂的废水COD值高、可生化性差、与重金属离子结合生成比较稳定的配位离子,加
ERP(企业资源计划)作为先进的管理思想和信息化工具,综合考虑了制造厂、供应商、分销商以及客户等各方面的影响,面向整个供需链管理。采购位于企业供应链的上游,是物流和资金
与传统的极限平衡方法相比,有限元方法在边坡稳定分析中的优势明显。有限元强度折减法在边坡稳定分析中的应用正逐渐受到重视,但是这种方法目前在工程中的应用还不成熟。本文
<正>轮状病毒感染是小儿秋季腹泻的常见病因.为明确病原诊断并探讨其临床意义,我院细菌室于95年10月至11月对以“肠炎”为入院诊断的293名患儿大便用ELISA法检验其中的轮状病
<正>在中国的远古文化中,东北地区的新石器时代晚期红山文化独树一帜。1980年代开始,中国考古学泰斗苏秉琦先生根据红山文化一系列重要发现,提出"古文化古城古国"的重大研究
本文通过正交试验确定了蜂花粉提取物制备的最佳萃取条件和蜂蜜蜂花粉冰淇淋的最佳配方,并介绍了蜂蜜蜂花粉制作过程中的操作要点。