基于矩阵分解算法的改进及在长非编RNA调控预测中的应用研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:wenlai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,在生物信息领域,越来越多数据有待挖掘。然而,目前的生物数据大部分是经过生物医学实验得出的,显然,其花费的成本以及耗费的精力是巨大的。最近几年,随着人工智能的普及发展,越来越多的科研人员将智能算法应用在生物大数据挖掘和分析的方向。其中,长非编码RNA是一种最近才被重视的生物大分子,其可以调控蛋白质以及微小RNA,从而对疾病产生影响。运用智能算法来研究长非编码RNA与其他分子的关系预测是当前的研究热点。在本文中,我们提出了基于矩阵分解的改进算法。该算法主要在隐语义模型的基础上,将矩阵分解后的隐因子向量用逻辑函数表示成概率值,该值表明了对应的用户和项目的关系得分。通过带逻辑函数的隐语义模型能够对推荐的结果有更好的解释,同时也有利于计算和表示,但是该方法并没有利用到协同过滤,对于用户和项目各自之间的相邻关系没有考虑。因此,我们引入了图正则化的思想将用户和项目的相似性融入到目标函数,相似性越强则对应的隐因子向量越接近。加入图正则化的逻辑矩阵分解可以实现协同过滤,但是实际中往往相似性越高的用户会对同一项目产生偏好,因此我们又根据K近邻的思想保留样本间的最强相似性,提高其在协同过滤中的影响,从而提高预测精确度。最后,我们将改进的矩阵分解算法应用在了生物信息学领域,分别是长非编码RNA-蛋白质相互作用预测和长非编码RNA-微小RNA相互作用预测。我们将长非编码RNA-蛋白质以及长非编码RNA-微小RNA近似为用户-项目模型,其中交互信息可以等价为用户对项目的评分,而长非编码RNA,蛋白质和微小RNA的序列相似性则用作协同过滤信息加入到模型中。在留一交叉验证实验中,两个模型分别取得了0.9025和0.9319的AUC值。进一步地我们又分别基于不同测试集对两个实验做案例分析验证模型的有效性。所有结果表明,虽然增加了邻接正则化会降低计算效率,但是改进的算法在预测准确性上优于其他算法,显示了算法改进后的良好的预测能力和可扩展性。
其他文献
滑动轴承作为重要的动力工程旋转机械设备,自发明以来被广泛应用于电力、航空与船舶动力以及供热等工业领域。目前应用于滑动轴承润滑状态上的诊断方法,如时域、频域或者振铃
电化学传感器因其成本低,便携,分析快速,选择性高而备受关注。设计优异的电极材料是提高电化学传感器灵敏性和选择性的关键。环糊精(CD)作为一类重要的超分子化合物,由于具有分子选择性识别及超分子组装等特性而广泛地应用于生物医药等领域。本文将环糊精作为功能单元与具有超强导电性的石墨烯、多孔碳等碳基材料通过共价或非共价键结合构筑电化学传感器,以实现对酪胺类分子的检测。具体内容如下:1.利用改进的Humme
甘油单酯脂肪酶是一类专一性地作用于甘油单酯底物的水解酶,其独特的催化特性使其在工业应用中极具应用价值。另外,甘油单酯脂肪酶在哺乳动物生理调节方面也起到了关键的作用。开展工业需求或参与生理代谢关键酶三维结构的研究,有助于理解该类酶的结构与功能关系及丰富酶学理论,具有科学与实际应用研究价值。本课题以海洋地衣芽孢杆菌的甘油单酯脂肪酶Geobacillus sp.12AMOR1(GMGL)为研究对象,研究
目的:鲜药的应用在中医临床上具有悠久的历史和重要的价值,但在实际应用中,绝大部分鲜药品种均以干品代之。因此,本课题首先对鲜马齿苋进行质量标准研究,保证鲜马齿苋药材质
细根作为根系中最活跃和敏感的动态组成部分,其物候和生产对生态系统初级生产力、植物竞争以及反映气候变化对生态系统带来的影响方面发挥着重要作用。为揭示全球变暖背景下
石油产品是人类活动造成的常见土壤污染源之一,它会引起土壤微生物、化学成分、结构和物理性质发生重大变化。本研究的主要目的是对加油站区域的地下水污染状况进行评估。在
针对当前毛乌素沙地沙柳灌丛衰退问题,设计维持丛状结构特征可持续的生态平茬方法,通过野外观测试验和室内风洞试验研究不同平茬方法下沙柳灌丛的风场结构与防风效益,为今后毛乌素沙地沙柳生态平茬提供理论指导。试验设定6种平茬强度(0Φ、0.2Φ、0.4Φ、0.6Φ、0.8Φ、1.0Φ,Φ为灌丛蓬径),3种平茬模式(模式A:按平茬强度沿主风向从灌丛迎风面向背风面平茬、模式B:按平茬强度沿主风向从灌丛两侧向中间
  近几年到一些厂访问,看到新一代炼铁专家空前地创造力,使我国炼铁生产水平,进入国际先进行列。其中有些高炉,已经登上世界高峰。同时也看到有的厂、有的高炉,存在一些问题。本
目的:通过系统的化学成分研究和药理实验,对雷丸乙酸乙酯部位进行成分分离和鉴定,探究雷丸对不同细胞的毒活性,并对其机制进行初步探讨。方法:1.采用硅胶柱层析、反相RP-18柱
金褐霉素(Aureofuscin)是由金褐链霉菌(Streptomyces aureofuscus)产生的一种次级代谢产物,属于四烯大环内酯类抗生素,具有抗真菌活性,有待应用在医疗卫生、食品加工等更广泛的领域。因其生物合成的调控机制尚未明确,金褐霉素的产量较低,限制其进一步应用,所以提高金褐霉素的产量成为重中之重。前期实验通过在金褐链霉菌中过表达aurJ3M基因,高效液相色谱(HPLC)分析检测发