【摘 要】
:
探测复杂疾病临界点对疾病早期诊断至关重要,本文利用多个样本与单个样本分别提出了两种基于隐马尔科夫模型的挖掘复杂疾病临界点的算法,构建了两种综合不一致性指标,以挖掘健康期到疾病爆发之间的临界状态.为验证算法的有效性,将两种指标分别应用在仿真网络数据,肺部急性损伤数据、乳腺癌数据中,并在疾病恶化前,成功探测并及时发出预警信号,另外,两个实际数据集的结果均通过留一法、生存分析、KEGG功能得到验证.第一
论文部分内容阅读
探测复杂疾病临界点对疾病早期诊断至关重要,本文利用多个样本与单个样本分别提出了两种基于隐马尔科夫模型的挖掘复杂疾病临界点的算法,构建了两种综合不一致性指标,以挖掘健康期到疾病爆发之间的临界状态.为验证算法的有效性,将两种指标分别应用在仿真网络数据,肺部急性损伤数据、乳腺癌数据中,并在疾病恶化前,成功探测并及时发出预警信号,另外,两个实际数据集的结果均通过留一法、生存分析、KEGG功能得到验证.第一章,绪论.该章主要介绍论文的背景,论述了复杂疾病的复杂性与危害性,探讨了探索复杂疾病临界点的必要性.并且介绍了在过去的研究中几种探索复杂疾病临界点的方法或算法.第二章,预备知识.在该章中介绍了隐马尔科夫模型的几个重要步骤,临界点分岔理论与构造个体特异性网络的方法,以上皆是本文的算法基础.第三章,算法设计.在该章中叙述了两种挖掘复杂疾病临界点的算法的算法步骤,一种算法是结合了临界分岔理论,构建了一种基于多样本的指标;另一种算法结合了个体特异性网络的性质,构建了一种基于单样本的指标.两种指标均能够在疾病临界状态时发出预警信号.第四章,仿真实验.在该章中构建了一个具有9个节点的仿真网络,首先对临界点分岔理论、个体特异性网络的性质在仿真数据中进行验证,然后分别将两种指标应用在仿真网络数据上,均在系统参数→0时发出预警信号,成功挖掘出其临界状态.第五章,实际应用.在该章中我们将两种指标应用至小鼠肺部损伤数据与人类乳腺癌数据中,均得到一致的结论:小鼠暴露在光气后的第4小时到第8小时进入临界状态,而乳腺癌在状态IIB到IIIA期间进入临界状态.为验证结果,本文进行了留一法交叉检验,验证了结果的稳定性.另外,我们分析了在所探测的临界点中表达最具有显著差异基因:结合生存分析,发现ABCA10、ADAM33、BAI3等基因对乳腺癌有显著影响;结合功能分析,发现这些所在的通路与疾病有密切的联系.
其他文献
龙岩市农业产业结构调整的趋同性与同质性,造成农业发展与农民增收在新的发展阶段出现徘徊。破解新时期的发展难题,关键在于搭建好科学技术与农民生产之间的桥梁。从顶层设计理顺农业推广,使农业科技真正的转化为农业可持续发展的动力。本文梳理龙岩市农业推广体系的历史进程及其变动轨迹,基于农业推广框架模型分析龙岩市农业推广内外部环境,并对其农业推广的综合效益进行评价。从推广服务系统与目标团体系统分别探究农业推广体
2009工业软件高峰论坛于2009年9月3日日在北京顺利召开。本次论坛以“两化融合‘软’加速”为主题,着重讨论了在国家新时期“两化融合”新政策下,我国工业软件业面对的历史机遇
目的利用高效液相色谱技术(HPLC)建立清热解毒片/胶囊的特征图谱和其中多种成分的含量测定方法,实现对各生产企业清热解毒片/胶囊质量优劣的综合评价。并采用管碟法对各企业
五氧化二钽(Ta2O5)是钽最常见的氧化物,也是钽在空气中燃烧生成的最终产物,主要用作拉钽酸锂单晶和制造特种光学玻璃。由于钽具有多种可变价态,因而,五氧化二钽在电化学能源
小麦是全世界上首要的粮食作物。我国是世界上小麦生产和消费第一大国,小麦的生产与国家粮食安全密切相关。在我国现实国情下,提高小麦单产量,是确保小麦总产量,保障国家粮食安全的根本出路。千粒重是小麦产量关键要素之一,由粒长、粒宽和粒厚等构成,其大小与小麦产量息息相关。在小麦育种中,千粒重的不断提高是人们普遍关注的主要目标。因此,通过分子生物学手段,发掘和鉴定小麦粒重相关基因的优异等位变异和开发功能标记的
考虑了WardropUE条件与系统最优(SO)原则共存时的交通网络配流问题,给出了组合式Wardrop条件等价的网络配流平衡规划模型及其求解算法,并指出了该思想与方法在智能交通系统(ITS)中的应用。
喀斯特地区的石漠化是制约该区经济发展和人民生活水平的一大障碍,其土壤肥力状况是石漠化治理的重要依据。流域作为一个相对完整的汇水单元,基本涵盖大部分地形条件和水文过
为了使天然气/汽油两用燃料汽车燃用不同的燃料时,能自动改变点火提前角,从而保证发动机在不同的转速时都在最佳点火提前角下工作,研究了两用燃料汽车点火提前角的优化调整方