生物医学文本挖掘及其在基因调控信息分析中的应用

被引量 : 0次 | 上传用户:xiaoxiao1946
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基因调控领域研究信息以指数级增长,一方面带给研究人员海量的研究数据,同时也给研究资源的选择带来了很大的困难:如何方便地查询基因调控相关的数据库、工具和文献;如何及时了解最新的研究信息;如何快速选取文献成为急需解决的三大问题。与此同时数据挖掘技术也获得了飞速的发展,使用机器学习方法对生物数据文本进行数据挖掘已经成为一种生物信息学研究的一种新方法,尤其是文本挖掘中更成为研究的热门,这同时也为我们解决上述问题提供了有效的方法。本课题针对上述情况,根据文本挖掘的需求设计实现了频繁序列算法,并提出了该算法在文献选择和文本分类等多方面的应用,开发了用于信息提取和文本挖掘的频繁序列算法系统(FSAS);同时结合文本挖掘技术分别建立了基因调控信息资源库(GRIS)和基因调控信息智能检索系统(InfoAgent)。文本分类是文本挖掘中最主要的部分,其核心问题在于如何实现分词和提取文本特征。基因调控研究领域的发展日新月异,新词、新技术不断涌现,传统的基于词库的分词算法无法适应这一变化。本课题实现的频繁序列算法可以在无字典情况下挖掘出文本中的频繁长词和新词。本算法挖掘出的长词,比单个词更能体现文本的主要意义,所以可以用来帮助研究人员了解文献的主要内容,从而实现对所需文献的阅读选择。同时,这些词经过选择后可以方便地生成文本特征向量,为文本分类服务,本课题利用FSAS系统提取的文本特征,结合SVM技术,对基因调控相关的文献进行了分类实验,多次分类结果的平均准确率达到80%以上。另外,FSAS对一定量的基因调控相关文献进行分析后,也可以构建该领
其他文献
本文以黄石市为研究区,选用16种指标,收集2006-2014年相关数据,利用灰色等维新息模型外推出2015-2020年各指标数据。综合2006-2020年数据,利用评价模型评价黄石市土地生态状
微弧氧化技术是一项从传统阳极氧化基础上发展起来具有较好应用前景的表面处理技术。国内外对镁合金微弧氧化技术的研究主要集中在AZ系和AM系,对变形Mg-Zn-Zr系的研究很少,并
近十年来,Client/Server(简称C/S)结构在企业计算、信息查询等多种应用系统中得到了广泛的应用。与主机系统相比,它是一种全新的计算模式。这种应用结构不仅极大地提高了应用系统
随着科学技术的突飞猛进,技术型企业在经济、社会发展中的作用不断增强,技术并购的重要性日益显现。近年来,技术并购已为现实中国企业实现发展战略的重要手段并为企业家所采用,得
进入21世纪以来,新型材料的使用成为了时代的潮流,纳米材料在新型材料中占据了非常重要的地位。纳米材料具有很大对比表面积,体积效应以及尺寸效应。纳米材料对于增强聚合物材料
铸造产业素来享有“工业之母”的称号,是关系国计民生的重要行业。浇注是铸造生产的关键工序,对于铸件的产量、质量起着决定性的影响。浇注过程控制的关键要素是金属熔液的浇
党校是学习、研究、宣传中国特色社会主义理论体系主要内容的重要阵地。在全面建成小康社会与努力实现"中国梦"的新形势下,高校党校建设进入了新的发展时机,同时也面临新的发展
为解析消费者对童装店铺的视觉感知,为营造童装店铺中符合企业品牌形象的店铺陈列氛围,利用儿童色彩特点,以三个服装风格为陈列调整对象进行陈列优化。基于色彩和消费行为理
池莉小说的人物塑造独具特色,她既关注着人们琐碎的生活,同时也有着强烈的人生命运之思,对人物潜意识的挖掘使她的作品更显深度.
黄酮类化合物是板栗的营养因子之一,具有多种生理保健功能,它能够降血脂、降血糖、抗心律失常、抗氧化、清除体内自由基、抗衰老、增强机体免疫力。黄酮类化合物在植物中分布