基于整合文本挖掘方法的中医证与分子生物学知识的关联分析系统

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:Moke_jlsf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划(Human Genome Project)以及分子生物学、信息科学的发展,不同学科的生物医学数据“爆炸”式增长。如何整合这些数据资源发现其中隐藏的知识一直是系统生物学研究的难点。传统中医学和现代生物医学是完全不同的学科,是一个互补性知识系统。本文结合中医药文献库和Medline开展整合文本挖掘(Integrative Text Mining),对中医证和分子生物学进行的关联分析研究具有重要意义。信息抽取是文本挖掘中一项重要技术,是在非结构化的自然语言文本中定位相应的结构化数据单元,从而使自由文本数据成为相应的结构化数据。信息抽取是文本挖掘的前期步骤和基础,基于信息抽取的文本挖掘系统是研究趋势所在。本文在系统分析和阐述信息抽取技术的基础上,结合实际应用开展了生物医学文本挖掘研究。在利用Bubble-bootstrapping算法抽取中文实体名称研究的基础上,对该算法进行了必要的改进,将其应用到基因名称的抽取中。通过对2000篇英文摘要的抽取实验,表明Bubble-bootstrapping算法在英文实体名称抽取领域同样具有良好的应用前景。其次,在信息整合的思路下,本文结合中医药文献和生物医学文献进行了中医证候基因相关关系知识发现研究。设计实现了基于整合挖掘的中医证和分子生物学知识的关联分析系统Medisco-3S。该系统具备Medline数据自动下载、术语实体识别、实体相互关系计算、可视化展现和网络图分析等功能。
其他文献
在软件开发中,开发人员在调试时花了大量时间。普通的调试器提供了很多帮助,但是调试仍然是一项艰巨的任务。为此开发人员提出了基于快照的回溯调试技术,其中的快照技术很多
当人们生活快速发展的同时,无线通信技术也随着快速发展,频谱资源的匮乏和无线应用需求持续增长的冲突越来越明显。认知无线电技术为了解决频谱资源利用率的问题应用而生。该技
目标检测历来被认为是一个十分复杂的问题,同时也是图像理论发展的瓶颈之一。小波变换和分形理论的提出拓宽了人们的视野。基于小波变换的目标检测是利用小波变换的多分辨率
VC-1是2003年微软在WMV9(Windows Media Video 9)基础上提出的视频压缩技术,2006年4月,SMPTE正式颁布了VC-1视频编码标准,并随后发布了解码算法的参考模型。VC-1整合了MPEG及
随着通信技术、嵌入式计算技术和传感器技术的飞速发展和日益成熟,无线传感器网络在军事、环境监测、医疗护理、空间探索等方面都显示了广阔的应用前景,被认为是21世纪最有发
大数据、云计算以及目前类型众多的网络业务的出现,导致传统电信网络的劣势越来越突出。光交换技术的灵活性以及光传输介质(光纤)的大容量、低损耗等优点使得全光网络相比于传统
数据是当今信息社会宝贵的资源,发现并利用潜藏在那些复杂数据集中的有用知识已成为科学决策的前提。数据挖掘技术通过关联规则、聚类及分类等方法实现从大量的、不完全的、
Web Services是一种崭新的分布式计算模型,它由一系列相关技术和标准组成,如XML、SOAP、WSDL和UDDI等。Web Services具有完全的平台无关性、语言无关性,其主要目标就是要在现
语音通信对实时性和连续性都有较高要求,但现在的网络(IPv4)只提供一种尽力而为(Best-effort)的服务,网络拥塞的发生会导致丢包和延时,从而使得话音质量严重下降,因此为了确
随着经济竞争的不断加剧和市场的不断扩大,如何有效地支持跨部门、跨企业之间的业务过程集成,己成为新一代企业信息系统面临的重大挑战。当前,Web服务的逐步成熟以及业务规则