蛋白质功能标注中噪声识别模型研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:wangfeiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是最主要的生命活动过程的载体,执行着生物体内各种重要功能。对蛋白质功能进行自动标注是生物信息学领域的关键问题,也是后基因时代的核心问题之一。准确地标注蛋白质功能,对疾病机理分析与调控、新药品研发、农作物促产、生物能源开发等研究领域都有着极大的促进作用。然而,蛋白质功能标注信息来源广泛,噪声标注信息不可避免地被引入。这些噪声功能标注会误导蛋白质相关功能的分析与应用,降低后续蛋白质功能的预测精度。已有蛋白质功能预测研究更关注预测功能信息完全未知蛋白质的功能和蛋白质的缺失功能,极少关注蛋白质噪声功能的识别。本文针对蛋白质噪声功能标注识别这一问题进行研究,其主要工作如下:(1)提出了一种基于语义相似度和分类相似度的蛋白质噪声功能识别算法(NoisyGOA)。该方法首先计算蛋白质之间的语义相似度和基因本体(Gene Ontology,GO)功能标签之间的分类相似度,然后计算一个蛋白质的每个功能标注与它语义近邻蛋白质的功能标注最大分类相似度之和,最后选择与这些近邻蛋白质具有最小分类相似度的功能标注为该蛋白质的噪声功能标注。在酵母菌,人类和拟南芥这3个模式生物的模拟噪声数据和真实噪声数据集上都显示了该方法在噪声功能标注识别方面的有效性与优越性。NoisyGOA不仅展示了蛋白质噪声功能的可识别性,而且表明了语义相似度和分类相似度对蛋白质噪声功能识别的作用。(2)由于NoisyGOA在计算语义相似度的过程中易受蛋白质已有噪声功能标注的影响,并且没有功能标注之间的差异性,本文提出另一种基于证据属性加权和稀疏表示的蛋白质噪声功能识别方法(NoGOA)。NoGOA首先用一个蛋白质-功能标签关联矩阵存储蛋白质功能标注信息,利用稀疏表示来计算蛋白质之间的语义相似度,并通过蛋白质的语义近邻对蛋白质的功能标注信息投票来初步识别该蛋白质的噪声功能;其次,NoGOA按不同的证据属性,对过去时期的蛋白质噪声功能标注进行统计和概率预估,在关联矩阵上,根据不同证据属性的噪声概率,对功能标注分别加权,再利用功能标签间层次结构关系向上传播权重;最后通过整合基于语义相似度的初步识别结果和加权的蛋白质-功能关联矩阵的结果识别蛋白质的噪声功能标注。在酵母菌,人类和拟南芥这3个模式生物上的实验结果表明,与现有算法相比,NoGOA能更准确识别蛋白质噪声功能。另外,为了验证NoGOA识别蛋白质噪声功能的效果,我们剔除了NoGOA识别的噪声功能信息,在此基础上进行蛋白质功能预测。实验结果展示,该方法能够提升现有蛋白质功能预测算法的精度。
其他文献
实现我国控制人口增长,提高人中素质这一基本国策的有力保障是控制出生缺陷.为了保证独生子女病残儿父母第二胎的优生,对病残儿进行医学鉴定是至关重要的.为了减少和防止病
会议
本研究为解决废弃铁尾矿砂(简称尾砂)及基层、底基层铣刨料(简称RAI)处置问题,采用"铁尾矿砂+RAI"固废处治技术,将双废再生混合料100%代替新集料应用于道路基层。通过对双废
地区经济发展的差异,使得大量流动人口进入经济发达地区。流动人口带来巨大经济效益的同时,也给传染病的防治带来一定挑战。本文基于流动人口这一因素,在肺结核传播机制的基
本文研究了周期边界条件下Kolmogorov-Spieqel-Sivashinsky(KSS)方程全局吸引子的正则性和渐近吸引子的存在性.第一个主要内容是研究KSS方程在空间Hk(Ω)(k ≥ 0)中全局吸引
核磁共振(NMR)成像技术是继CT机之后,医学影像领域的又一重大技术进步。从80年代应用在医院以来,它的发展速度是惊人的。但是由于NMR自身原因,与其他检测方法相比NMR的灵敏度
某热电公司发电机组汽轮机改造项目,在汽轮机出口管系上由于膨胀节设计选型不当,造成机组长时间无法起机。经局部调整管线布置,选用适合于吸收管道热变形,同时具有足够柔性且
电磁场的动量和角动量是经典电磁学有趣而又基本的问题。对恒定电磁场,可以有四种等价的方法来计算其动量。但对于角动量,情况要复杂得多,我们对此进行了仔细的分析。另外,本
本文以内蒙古某铀矿数字化矿山建设为例,介绍了目前矿山数字化水平,提出了地浸矿山数字化建设的架构,包括资源储量管理数字化、浸出过程数字化、水冶过程数字化、生产管理数
安氏Ⅱ~1是临床上比较常见的一种错类型。矫治起来有一定的难度,且针对不同的错机理有不同的矫治方法。许多学者对安氏Ⅱ~1错畸形的特征进行了研究,结果不尽相同,这些
会议
针对波纹管膨胀节的轻量化设计,简要介绍了常用的设计方法与基本原理。对于波纹管膨胀节中的关键部件波纹管的设计,EJMA标准第十版及GB/T 12777—2008标准均利用了材料冷加工