蛋白质质谱数据挖掘方法研究

被引量 : 0次 | 上传用户:wuliaoaiaia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确诊断各类癌症至今仍是一个医学难题,尤其是对早期癌症的诊断。为此研究人员提出蛋白质质谱数据分析方法,通过分析蛋白质质谱数据样本来检测是否患有癌症。具体过程是:先提取样本关键特征训练分类器,然后用分类器对测试样本分类。由于蛋白质质谱数据固有的高维数和噪声等特性,显著增加了蛋白质质谱数据分析的复杂度,使得对蛋白质质谱数据的分类十分困难。本文采用卵巢癌和胰腺癌蛋白质质谱数据,并运用多种方法进行分析研究,特征选择采用T检验法、自组织神经网络和主成分分析法,样本分类器采用支持向量机和概率神经网络。本文研究五种蛋白质质谱数据分类方法,使用不同的特征选取方式和分类器。第一种分类方法:特征选择采用T检验法,分类器采用支持向量机;第二种分类方法:特征选择采用自组织映射网络,分类器采用支持向量机;第三种分类方法:特征选择采用T检验法和二次主成分分析法,分类器采用支持向量机;第四种分类方法:特征选择采用T检验法和MSDI(Maximum Significant Difference And Independence)算法,分类器采用概率神经网络;第五种分类方法:特征选择采用T检验法和本文提出的MSDSRI (Maximum Significant Difference And Square Root Of Independence)算法,分类器采用概率神经网络。本文针对上述蛋白质质谱数据的分类方法进行了详细的分析和深入的研究,得出结论如下:样本识别率不仅与特征选择的方法有关,还与分类器种类和用于分类器训练的特征数量有关。使用支持向量机作为分类器时,特征选择采用T检验法比自组织映射网络好,采用二次主成分分析法比主成分分析法好;使用概率神经网络作为分类器时:特征选择采用MSDSRI算法比MSDI算法好。从整体分类性能方面考虑,基于MSDI的特征选择算法和概率神经网络的分类方法,要好于基于二次主成分分析特征选择法和支持向量机的分类方法。在卵巢癌切片组织检查中样本识别率可达到99.498%;在胰腺癌切片组织检查中样本识别率可达到99.722%。
其他文献
铝合金的化学氧化技术能够显著提高铝合金的耐蚀性和与底漆涂层的结合力,其中铝合金的阿洛丁化学氧化在航空结构材料领域应用非常广泛。本文主要介绍阿洛丁1200S的成膜机理、
目的了解深化公立医院改革对护士离职的影响。方法分析某公立医院在深化医院改革前、后5年间157名离职护士的情况。结果 10年间合同制护士的离职率高于事业编护士(P<0.01)。
基于Revit的BIM模型和OPC标准开展建筑智能化信息集成平台的研究。借助OPC智能化数据访问技术和BIM三维模型信息共享的特征,在BIM模型中增加建筑智能化信息,研究基于BIM的智
论文设计制作了简易气敏传感器测试系统主要用于气敏薄膜元件的气敏特性测试,该测试系统可以较好地测试气敏样品的气敏特性以及电阻-温度特性。该测试系统现具备测试范围广,
主要运用文献资料法与逻辑法,论述了竞技体育竞赛中不正当竞争行为的含义、内容、特点与危害,分析了竞技体育竞赛中不正当竞争行为产生的社会根源,提出应从建立健全法律法规
从闪光涂料的成膜特性上,对色差理论进行了简单描述,并分析了其应用技术。联系涂装生产现场,介绍了涂膜色差的控制对策与应用。
运用文献资料、测量法和数理统计等方法,对高校男子攀岩与非攀岩运动员的身体形态及机能指标进行对比分析,旨在通过研究攀岩运动员与非攀岩运动员身体形态、机能指标上的差异,探
为适应现代气象预报、农业气象研究和其它业务服务需求及资料管理方式的转变,利用VB 6.0语言编程建立了基于Windows平台的武威市地面气象资料管理系统。详细阐述了系统设计思
为探讨女时装模特的体型特征,对60名模特表演专业的学员进行了身体形态指标测量,用Heath-Carter体型分类法计算出体型三联数,并分析了体型及各测试指标间的差异。测量结果:优
<正>在刚刚闭幕的2012北京国际车展上,易图通科技(北京)有限公司以"真3D导航地图"惊艳亮相于整车馆。作为国内唯一进入整车馆的导航地图企业,易图通不仅展示了目前世界最先进