基于复杂网络拓扑特征提取的代谢数据分类研究

来源 :深圳大学 | 被引量 : 3次 | 上传用户:asd_012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢组学效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,以寻找代谢物与生理变化的相对关系。自提出以来,代谢组学的研究获得了长足的发展,广泛应用于功能基因组测定、药物设计、生物标志物识别等多个领域。分类学习是代谢组学数据最常用的分析方法之一,但由于代谢组特征数据具有样本少、维度高、数据非线性、噪声多等特点,传统分类学习方法难以获得令人满意的结果。针对这一问题,本文提出新型的基于复杂网络拓扑的特征提取方法(Feature Extraction Based on Complex Network Representation,NTFE)帮助提高代谢数据分类性能。NTFE算法先对每个样本构建网络,然后采用基于互信息的有监督特征选择方法和基于条件互信息的边修剪策略,减少样本噪声,最后提取样本网络拓扑结构特征作为分类依据,提升后续分类准确率。实验结果表明NTFE算法在原位肝移植色谱代谢组数据上可获得比传统分类学习方法更佳的预测结果。在 NTFE算法的基础上,引入遗传算法,将NTFE算法中的样本特征和参数作为染色体,分类准确度作为适应值,提出基于遗传算法和网络拓扑的特征提取方法(Network Topological Feature Extraction Based on Genetic Algorithms,GA-NTFE)。实验结果表明,GA-NTFE方法在保持NTFE方法精度的基础上,特征数降低了一半,运行性能提升了一倍,同时算法获得的特征加权值可以具体描述各代谢物信号与目标生理状态间的关联。针对代谢组学数据的分类问题,本文提出了两个基于复杂网络拓扑的特征提取算法。两个算法可以有效提高代谢数据的分类准确率,同时GA-NTFE算法可以得到维度较低的特征子集,这有助于厘清关键代谢物与目标生理状态关系,为生物医学相关研究提供支持。
其他文献
英语写作是我国外语教学强调的一个核心技能,但却是一项最难掌握的技能。长期以来,写作一直是英语教学过程中一个较为薄弱的环节。究其原因,传统的写作教学以教师为中心,没有充分
结构损伤识别方法是桥梁结构健康监测系统的重要组成部分,也是目前国际上工程界研究的热点问题,具有很强的工程背景和重要的实用价值。基于此,提出了一种基于可降阶有限元模
本文以肉食性斑点叉尾鮰(Ictalurus punctatus)、杂食性异育银鲫中科3号(Carassius auratus gibelio, Var. CAS Ⅲ)、草食性草鱼(Ctenopharynodon idellus)和肉食性长吻鮠(Le
家庭是社会的重要组成部分,社会的稳定与和谐也与家庭的和谐稳定息息相关。作为家庭关系中的重要内容——夫妻财产制度,它在物质上确保了家庭生活的正常运转,更在婚姻财产的民事
<正>史学为一整体的学问,应在全面关照之下研究具体。所以读完书再做学问,乃治学的必由之路。所谓通识,应是贯通融通之通,通透通达之通。若以道听途说、似是而非的横通为通,
会议
基于对华北地区(包括长江中下游地区)金属矿床辉钼矿Re-Os模式年龄数据,云母、钾长石和石英40Ar-39Ar年龄数据,个别高精度矿物和岩石Rb-Sr等时线测年数据以及与成矿相关花岗质
强迫倾向被定义为与强迫症相关的完美主义,是一种认知倾向。强迫倾向多指个体内心冲突性质为常性,痛苦情绪间断或不间断地持续2-6个月,知情意行统一协调;排除精神障碍和器质性
实验背景:肝细胞癌是最常见的恶性肿瘤之一,在世界范围内,其致死率在肿瘤相关疾病中排名第三位。近年来虽然早期诊断,以及放疗、化疗和手术治疗的联合使用使肝癌的治疗有了一
2009年,新医改明确提出,“要把基本医疗卫生制度作为公共产品向全民提供,且要大力发展农村医疗卫生服务体系,进一步健全以县级医院为龙头、乡镇卫生院和村卫生室为基础的农村
在中国加入世界贸易组织后,随着经济整体的高速增长,中国金融服务贸易额并没有表现出强劲的增长势头。中国金融服务贸易有其自身的特点,学术界对于金融服务贸易的研究多集中