致病基因和细菌蛋白质亚细胞分布的预测方法研究

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:liyon_88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因和表型之间关系的确定是分子生物学研究的核心目标之一。前期的研究结果表明,决定相同或相似性状的基因在蛋白质相互作用网络中的关联性较强。基于这个假设,研究者们提出了一系列以网络为基础的方法以确定基因和表型之间的关系。在这些不同的算法中,基于扩散谱的方法表现出了较好的预测效果。本文提出了一种基于扩散谱的新方法来确定可能的致病基因。对某种特定疾病而言,其扩散谱定义为PPI网络中候选致病基因的稳态分布。通过比较候选致病基因与相应疾病之间的扩散谱相似性,就可以对候选的基因进行排序。最后,我们对训练集中的基因(预留的作为训练集的基因和随机抽取的基因)进行留一交叉验证来检验方法的稳健性。结果表明所提方法相比其它基于扩散谱的方法表现出了更好的预测效果。除此之外,我们将该方法应用于预测包括前列腺癌和阿尔兹海默病在内的16种多因子疾病以进一步验证所提方法的泛化能力,结果表明该方法所预测出的致病基因与已有的科学文献报道具有很强的一致性。研究表明,对多种信息数据(表型相似性数据、疾病和基因扩散谱相似性数据)的整合可以更有效的帮助人们确定候选致病基因。细菌蛋白的亚细胞分布信息对蛋白质功能预测、基因组功能注释及药物设计等方面发挥着至关重要的作用。在本研究中,我们提出了一种新的方法来预测细菌蛋白的亚细胞分布特性。该类方法整合基于位置信息的分数矩阵的特征信息及基因功能注释信息,进而进行分布特性预测。随后采用一种基于线性核函数的支持向量机后向特征选择方法对整合后的特征向量进行排序并筛选出最优特征向量。最后,基于上述特征选择方法挑选出来的最优特征向量,我们使用了支持向量机方法对蛋白质亚细胞分布特性进行预测。为了检验所提方法的稳健性及泛化能力,我们进一步使用了与训练集具有低相似性的三个数据集(M638,Gneg1456,Gpos523)进行重叠交叉验证。对于这三类数据集的准确率分别达到94.98%,93.21%和94.57%。这比之前方法在准确性方面提高了1.8%-10.9%。综合比较的结果表明,本文所提的方法在预测细菌蛋白的亚细胞分布特性方面表现出了很大的优势,可以作为一种有效的工具进行相应的预测研究。
其他文献
目的:分析阻塞性睡眠呼吸暂停综合征与高血压的相关性。方法:选取2018年1月-2019年1月在我院接受健康体检的50例受检者作为对照组,选取同期在我院检查疑似有阻塞性睡眠呼吸暂
《京津冀协同发展规划纲要》赋予天津“全国先进制造研发基地”的功能定位。天津作为我国老工业城市,制造业发展基础较好,理应在我国先进制造业发展、制造强国建设中走在前列
目的:探讨健脾养血祛风方对脾虚证慢性湿疹小鼠模型皮肤屏障功能及免疫机制的影响,为健脾养血祛风方治疗脾虚证慢性湿疹提供实验依据,从而进一步论证将“健脾养血祛风法”作
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
深部脑刺激(deep brain stimulation, DBS)是神经工程领域的研究热点之一,在临床上利用DBS的高频电刺激(high frequency stimulation, HFS)技术治疗帕金森(Parkinson’s dise
目的:随着现代医学的发展,目前,骨科临床治疗水平有了长足进步,很多骨科疾病可以治愈,但是某些疾病,如骨折不愈合、骨质疏松症、股骨头坏死、骨缺损,仍然需要找到新的治疗手
目的:探究并总结在对小儿患者麻醉治疗时,利用丙泊酚中长链脂肪乳的麻醉效果以及在临床中的应用价值。方法:选取2018年11月-2019年2月在本院接受手术麻醉治疗的小儿患者100例
目的:建立髌骨髌腱结合部跳跃损伤动物模型和离心运动动物模型,分别用于研究长期和急性跳跃运动对髌骨髌腱结合部(PPTJ)组织结构、细胞外基质和细胞因子的影响,并探讨运动后冷
本文主要通过实验对比研究铝翅片和泡沫金属铜对石蜡的储热性能和储热密度的综合影响,分别测试封装纯石蜡、封装石蜡的同时加装平行铝翅片、将石蜡填充到泡沫金属铜空隙三组
规范性翻译研究往往会受到研究者自身所处历史时期的审美期望的干扰,不能给予译文全面历时性描述。该文运用描写性翻译研究方法论对Dawn的两种译本—陈寿庚先生译本和唐建清