论文部分内容阅读
获得性免疫缺陷综合征也被简称为艾滋病。至今为止,医学界依然没有有效办法彻底治愈或根除该病毒。研究表明,艾滋病病毒的变异复杂,不断进化的突变类型对现有的任何药物都能产生抗药性,并且变异类型与HIV药物抗药性之间存在不确定性关系。这篇论文利用贝叶斯模型中的多维分类模型以及聚类树模型研究艾滋病基因变异类型之间的关系,并尝试利用构造的模型理解基因变异类型如何影响艾滋病药物抗药性。贝叶斯网络模型是一种描述多变量之间依赖关系的统计模型,通常被用于学习不确定领域的知识结构。这篇论文的工作集中在贝叶斯多维分类模型和贝叶斯聚类树模型的分析,并用这些分析成果理解两个问题:1 HIV基因突变类型间有何种不确定性关系;2 HIV基因突变类型如何影响药物抗药性。总的来说,本论文成果主要有以下两方面:主要理论贡献1分析了贝叶斯多维分类模型的有效训练方法,以及贝叶斯多维分类模型上推理问题MAP、MPE的复杂度,同时给出了一个基于价值理论的贝叶斯多维模型训练算法,并为推理问题MPE设计了一个高效的精确推理算法。2推广了贝叶斯因果聚类树模型中的Pearl定向原则,分析了聚类树中的最小因果盆问题和唯一聚类树恢复问题,同时证明聚类树恢复算法的近似度为K+1。主要应用贡献1基于Stanford大学艾滋病研究小组提供的5692个艾滋病病例数据库,贝叶斯多维模型训练算法优化生成贝叶斯艾滋病抗药性多维分类型。同时,贝叶斯多维分类模型的MPE精确算法可计算出艾滋病变异类型对艾滋病药物的抗药性程度。2利用设计的因果聚类树恢复算法,分别训练出基于艾滋病主要基因突变类型的PIs,NRTIs,NNRTIs因果聚类树模型,这些模型很好的吻合了现有临床试验结论,并预测了部分基因突变类型的新特征。3设计的MATLAB工具箱包含HIV序列分析以及贝叶斯模型主要分支的重要算法,涉及到HIV原始数据提取,贝叶斯模型学习,随机数据生成,推理问题计算等方面。开源Matlab工具箱的查阅和下载,请访问我MATLAB官方网站的个人空间:http://www.mathworks.com/matlabcentral/fileexchange/authors/45984