基于高维稀疏矩阵隐特征分析的蛋白质相互作用预测技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:baochangjingmao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理解蛋白质间是否存在相互作用以及存在的相互作用所行使的功能,是理解生命活动的基础。利用蛋白质间的相互作用信息构建复杂的相互作用网络,建立蛋白质间的功能联系,能够为从整体上掌握生命的运行机制提供有益信息。虽然研究者通过生物实验方法确定了模式生物蛋白质间的一些相互作用,但是这样的研究进程较慢,对建立完整的蛋白质相互作用网络是远远不够的。随着数据挖掘技术的逐渐成熟,已有很多研究者将数据挖掘算法应用于生物信息学的蛋白质分析任务上,对蛋白质间相互作用进行预测,为实验指明了方向。现有处理蛋白质间相互作用的方法如聚类、贝叶斯等,大多算法简单,预测精度不高,并且难以处理高维稀疏的数据。而随着蛋白质组学研究的推进,如今的生物数据中已知蛋白质数量变得非常庞大,而他们之间的相互作用信息却大多未知,这样的数据网络即高维稀疏网络。在这样的数据上,基础的算法难以准确的预测,并且需要消耗大量的资源和时间。而隐特征分析由于只依赖于已知数据分析,能够很好的分析高维稀疏矩阵。本文首先介绍了基于奇异值分解的矩阵分解模型和在其基础上发展而来的一般隐特征模型,隐特征模型具有能处理高维稀疏矩阵的特点,但是一般隐特征模型有着不稳定,可能出现过拟合的问题,另外蛋白质相互作用网络为无向网络而非一般隐特征模型处理的二部图。因此,我们对其进行了多种优化和修改,提高隐特征模型的精度,并提出对称模型使其能分析无向图。本文的主要工作为:1)对隐特征模型进行深入的研究,在一般隐特征模型的基础上,通过非负乘法更新达成非负约束,通过在目标函数中加入正则化机制避免过拟合,加入频率加权等,以得到各种特型隐特征模型,提高了精度和效率。2)针对蛋白质相互作用数据为无向网络的特征,根据对称矩阵分解的理论,研究出了对称非负隐特征模型,并考虑加入线性偏差以提高精度,对得到的各隐特征模型进行对比实验分析,得到对称隐特征模型在蛋白质相互作用预测实验中有着更好的性能表现的结论。3)根据研究结果,用Java实现了一个蛋白质相互作用预测的图形展示系统。
其他文献
ZnO是一种重要的宽带隙半导体材料,禁带宽度与TiO2相近,为3.37 eV,并具有生产成本低、无毒无污染等优点。尽管有关ZnO作为光催化剂的报道日渐增多,但光催化活性不高、光化学
白蚁是一类社会性昆虫,属于等翅目,它们分布广泛,除了南极洲以外,所有的陆地均有白蚁分布,在热带和亚热带地区数量最为丰富。白蚁是自然界纤维素和半纤维素的天然降解者,这种
基于DNA的杂合催化剂由于其高效、高选择性的催化性能在人工金属酶领域中脱颖而出,从2005年出现以来得到了长足的发展,然而其催化机制至今仍然不为人所知。为了揭示其催化反
空间网状天线往往具有尺寸较大、柔性较低的特点,因而受到扰动时易产生振动,并且其激发的低频模态非常密集。利用波动理论对结构建模并进行动力学分析,可以避免模态法引起的
本文运用山路引理,Palais-Smale条件,喷泉定理等数学理论研究了高功率超短激光通道模型中出现的一类拟线性薛定谔方程解的存在性问题.本文共分为四章.第一章绪论部分主要介绍
大型装备制造具有产品尺寸与重量大、工艺复杂、小批量多品种定制化生产、生产周期长,行车调度易干涉等特点,生产资源和行车资源的利用率成为整个制造过程的瓶颈。为合理调配
TiO2光催化剂(如附着态TiO2,多孔TiO2薄膜,TiO2/Fe3+,TiO2/Fenton等)催化氧化降解水中的有机污染物具有能耗低、操作简单、反应条件温和、可减少二次污染等突出特点,因而日益
电化学免疫传感器因实验操作简便、灵敏度高、特异性强、检测速度快等优点被广泛研究。近年来纳米材料逐渐被应用于生物传感领域,并获得突破性进展。其中,纳米复合材料由于其
本文研究区位于东海陆架盆地西湖凹陷,研究目的层段为古近系始新统平湖组。根据论文研究内容,结合前人研究成果,以沉积岩石学、层序地层学、构造地质学等为指导,在区域地质背
我国的华南地区位于地球赤道异常区北驼峰下方,该区域电离层活动异常活跃,是电离层闪烁和TEC(Total Electron Content)耗空的高发区。本文利用“子午工程”布设在该地区的深