文本挖掘用于药物活跃基因筛选及雷帕霉素案例分析

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:oqo235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人们一直面临药物短缺的难题的情况下,耐药性现象的爆发更加剧了药物短缺情况。然而,新药研发始终面临研发成本高昂的问题。药物重定位,即发现已上市药物新的治疗活性,这一低成本药物发现方法逐渐兴起。由于药物已经进入临床阶段,药物安全问题已解决,这意味着药物重定位方法耗时短,成本低。然而,目前药物重定位中还存在诸多挑战,其中,如何通过基因构建药物疾病关系是药物重定位领域的重要研究方向之一。本文在此基础上,引入基因通路信息,通过构建药物-基因-基因通路-疾病关系,达到药物疾病关系构建的目的,从而完成药物重定位。这一研究过程中需要海量的生物实体关系数据,这类数据绝大多数以文本的形式储存。海量的文本通过人工阅读来抽提其中的生物实体关系高成本低效率。因此,使用文本挖掘方法通过计算机辅助文本中的知识抽提成为解决这一问题的重要途经。文章具体实施路线:首先,以19种典型药物重定位药物的药物名为关键词在PubMed中检索相关文献共获得303,443摘要文本,通过文本挖掘方法从文本中挖掘出含有互作关系的基因作为药物相关基因集;然后,将药物基因集富集到基因通路上得到有序的药物基因通路列表;接着,根据基因通路和疾病的直接关联信息将药物关联到疾病上,从而完成构建药物疾病关系的目标。在这一过程中的主要工作重点:1,比较了4种文本挖掘方法在本文药物发现策略上的应用效果。这4种方法分别是基于PubTator摘要共显,基于PubTator句子共显,基于PubTator句子依存树关系共显和Turku Event Extraction System 2.1(TEES)。挖掘方法的评价共两方面:一方面为文本挖掘得到的基因集在获得药物已知基因集上的准确率。4种文本挖掘方法的基因集依次计算与空白对照组基因集(KEGG数据库中人类通路中全部的基因集)在发现药物已知靶标基因集准确率上的比值,比较结果依次为:12.322,14.062,32.547和101.193,比值越大准确度越高效果越好,因此TEES方法最佳。另一个方面为比较基因通路富集结果得到的通路列表中药物已知通路的排名情况。已知药物基因通路在富集结果中排列越前,则该方法越好,结果表明TEES方法最佳。2,以药物雷帕霉素为例,进行案例分析。通过TEES方法得到雷帕霉素的活跃基因集,然后采用9种通路富集方法对活跃基因集进行基因通路富集分析,得到对应的有序基因通路列表。和CTD数据库提供的已知药物通路列表比较相似性,得到对应F值,我们设计的IPF_box方法和P值效果这三种富集方法较好。综合这三种富集结果,排名前五疾病通路乳腺癌等均由文献验证为雷帕霉素适应症。此外,我们以乳腺癌-雷帕霉素关系为案例,验证了文本挖掘具有药物疾病预测的功能。3,开发文本网络可视化工具用于本文策略得到的药物-疾病关系验证。从疾病出发通过Literature Network文本网络可视化工具构建疾病基因网络,观察药物相关基因在疾病基因网络中的情况,推理可能的药物疾病作用机制,以达到验证药物-疾病关系的目的。
其他文献
安徽民族民间体育项目形式多样,内容丰富,具有广泛的群众基础,是我国徽派传统文化的重要组成部分。在坚定文化自信、弘扬优秀传统文化的时代背景下,分析安徽民族民间体育资源
本文是一篇商务洽谈口译实践报告。所描述的口译任务为笔者在2017年9月8日参与第五届绵阳科技城国际博览会—中以高科技产业合作对接会一对一洽谈口译,选取了以色列迈坦诺亚
大数据时代,数据的作用日益凸显。但是在此时代背景下普遍存在着政府数所掌握的数据难以开放出来供社会开发,同时也面临着政府数据开放出来后社会各主体对数据开发活动不感兴
世界文化遗产不仅是人类与自然共同的杰作,而且是人类宝贵的精神财富,对人类发展史有着重要的意义。博物馆是人们了解他国历史文化的重要渠道之一,文博翻译在其中起到了举足
文章通过研究西方“新具象绘画”来探索当代工笔人物画的发展道路,具体分析和总结了受到西方“新具象绘画”影响的当代工笔人物画所展现的内在艺术观念、外在表现语言以及审
基于校验保护的RAID存储阵列是常用的存储方案,广泛应用于数据中心、云平台和超算中心中。传统的基于机械硬盘构建的存储阵列系统已经无法满足现代应用对性能的要求。基于闪
本翻译实践报告以第六届全国口译大赛为基础,所含内容为笔者在第六届全国口译大赛校级初赛﹑省级复赛和西南大区赛上的现场口译情况。本文的案例分析材料为笔者在第六届全国口
工人阶级是中国共产党发展依靠的主要力量,在近代中国的发展进程中起着关键性的作用。早在中国共产党成立之前,国民党、资产阶级、无政府主义者及某些官僚政客就已经注意到中
副词是汉语中较为庞大的一个词类,不仅体现在其数目众多,种类多样,同时学界对其内部小类的梳理、性质的判断及分类,仍然未形成系统且明确的成果,为此方言副词的研究作为汉语
党的十九届四中全会《决议》指出,推进国家治理能力和治理体系现代化是全党的一项重大战略任务,需要坚持从我国的实际情况和国情出发不断完善和发展我国的国家制度和治理体系