蛋白质相互作用信息提取算法研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:qyyqyy202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单体蛋白质通过与其它蛋白质相互作用来发挥其生理功能,确定和分析蛋白质相互作用有助于理解细胞过程的分子机制,寻找用于开发疾病诊断方法或新药的信息。目前,大最新的蛋白质相互作用信息以研究论文形式发布,这些论文通常被收录于生物医学文献数据库中。对于研究人员来说,如果用人工阅读方式从海量的文献数据库中提取出蛋白质相互作用信息非常耗时耗力,不利于研究工作的开展,如何快速有效的获得这些信息非常重要。本文对“蛋白质相互作用信息提取”,这个具有重要理论意义和广阔应用前景的课题进行研究和探索。 主要研究工作如下: 针对现有蛋白质相互作用信息提取算法存在的局限性,提出了一种分两步骤实现的蛋白质相互作用信息提取算法,即:先应用支持向量机(SVM)提取文献中的蛋白质名称信息,然后通过关键词匹配技术提取文献中的蛋白质相互作用信息。该方案为蛋白质相互作用信息提取研究提供了一条新颖的研究思路。 对口前该研究领域内常用的数据集进行比较分析,选择语料丰富的GENIA3.02作为本文研究的主要数据集。通过实验发现:对五种单词特征(单词、词性、单词前缀、单词后缀、前导类别信息)进行了不同的组合,以五种特征组合的蛋白质名称信息提取算法性能最好:SVM方法应用到蛋白质名称信息提取领域,其性能好于传统的基于词典提取方法,与最大熵方法性能相近;本文设计的两步实现蛋白质相互作用信息提取算法与该研究领域其它方法比较,性能较好。 最后,本文设计了一种蛋白质相互作用信息提取系统。该系统采用模块化结构实现,包含如下六个模块:文献预处理模块、特征提取模块、蛋白质名称信息提取模块、蛋白质名称信息提取结果筛选模块、蛋白质相互作用信息提取模块和数据显示模块。已完成除数据显示模块外其它模块核心程序的研究和实现。
其他文献
期刊
期刊
期刊
铝酸钠溶液的晶种分解是拜尔法生产氧化铝的重要工序,其工艺条件控制得当与否,不仅影响产品氧化铝的数量和质量,而且直接影响循环效率及其它工序。铝酸钠溶液的体系结构复杂,晶种
国内无创血液动力学监护系统的研制工作正处于探索阶段,目前以基于阻抗检测方法的检测系统为主流,这类系统是以欧姆定律、三元件细胞模型为基本理论基础,由Nyboer J.及Kubicek G.M.提出并发展起来的一套理论系统。本系统就是以Kubicek公式为基本计算公式。本课题设计了应用于基于阻抗检测系统的数据采集及血液动力学分析系统,并进行了初步的试验验证。本文首先分析了基于阻抗检测的血液动力学系统的
期刊
铝铜系合金是国民经济和国防建设中重要的材料,中重稀土Y加入到合金中可提高合金的强度、硬度和电导率等性能,铝铜钇合金可在多个领域得到应用。本论文以Na3AlF6-AlF3-LiF-Mg
期刊
随鞍钢高炉的大型化,对球团矿的使用量越来越大,鞍钢弓矿公司已建成两台链篦机-回转窑,产能都是200万吨/年,鞍钢厂内的带式机球团产能200万吨/年。鞍钢每年还从国外进口大量
随着科学技术的进步和生产力的发展,各个领域研究的问题进入到复杂系统阶段,比如对人脑的研究,对金融系统、社会经济系统的研究,就是常见的控制系统也变得越来越复杂。复杂系统研