基于0-1矩阵分解的蛋白质功能预测

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:lk123ad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确地标注蛋白质功能是功能基因组学的核心任务之一.蛋白质功能标注信息存在大量缺失且功能标签空间巨大.近期一些标签压缩方法被提出并应用于蛋白质功能预测,但是这些方法获取的压缩标签可解释性差,且面临着多标记学习中的阈值划分难题.为解决这些问题,本文提出一种基于0-1矩阵分解的蛋白质功能预测方法 (zero-one matrix factorization, ZOMF). ZOMF首先将蛋白质–功能标签关联矩阵分解成两个低秩0-1矩阵,挖掘蛋白质和功能标签间的内在关联.其次它利用蛋白质互作网和基因本体结构信息分别针对上述两个低秩矩阵定义了平滑正则项,约束指导低秩矩阵的优化.最后它利用优化获取的低秩矩阵重构关联矩阵,进而实现蛋白质功能预测.通过在酵母菌、拟南芥、老鼠和人类数据集上的实验表明, ZOMF比已有的相关算法能够更准确地预测蛋白质功能,它无需对重构的关联矩阵进行阈值划分,压缩的0-1标签可解释性更直观.
其他文献
<正>语言技能是构成语言交际能力的重要组成部分。语言技能包括听、说、读写四个方面的技能以及这四种技能的综合运用能力。提高学生的英语写作能力是英语教学中的重要内容之
在网络购物中存在信息偏在、商家信誉度低、消费者个人信息的泄露、消费者个人信息的泄露、交易安全难以保障、售货服务存在严重问题、立法水平低等问题已经严重侵害了消费者
近日,国务院印发我国实施制造强国战略的第一个10年行动纲领——《中国制造2025》,描绘了用3个10年时间进入世界制造强国前列的战略目标,提出了具体战略方针、任务及重点工程
油田开发后期的油井高含水,会造成油井减产、采油费用上升和环境污染。为此,加拿大工程研究中心研制成功了一系列可用于有杆泵、螺杆泵、电潜泵的井下油水分离器,并已将电泵
“我宣布,上饶市中心城区‘不文明陋习专项整治行动’启动!”5月27日上午,市委书记、市文明委主任、市创文指挥部总指挥马承祖,吹响了上饶市中心城区向不文明陋习宣战的号角!$$
报纸
随着物联网终端的快速发展,数以百亿计的新设备将接入网络。为了满足物联网设备小型化,远程管理以及适应高温、振动等复杂苛刻的外部环境等需求,新型电信智能卡(eSIM)应运而生,并逐
报纸
本文通过分析河南省出口产品结构存在的主要问题及差距;从调整产品结构、发展高新技术产品、发展特色产业、创建自主出口品牌等四个方面提出了优化河南省出口商品结构,提高河
<正>作为新一代聚酯仿棉纤维及其产品的总品牌,现如今,"逸绵"正在被整个纺织行业所认同,并被越来越多的纺织服装企业所知晓。其实,自2011年8月由中国化纤产业技术创新战略联
传统的高校思想政治教育以课堂教育为主要途径,以理论宣讲为主要内容,以灌输填鸭为主要手段,越来越不适应高等教育的发展需求。加涅的学习理论和教学理论可以有效地解释大部