面向专利的化合物和生物实体识别系统

来源 :情报工程 | 被引量 : 0次 | 上传用户:muniao090908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探索专利文献中的化合物和生物知识变得至关重要。为了识别化合物实体和生物实体,开发了面向专利的化合物和生物实体识别系统。系统基于开源的机器学习和自然语言工具进行开发。系统按照流水线模式进行,本文将详细阐述其三个主要过程:预处理(句子分割、词条化),识别(基于条件随机场的方法),后处理(基于规则的方法)。最后,利用系统在已标注的化合物专利语料库进行大量实验,进行十折交叉验证,得到了69.20%的F值。但是,从结果可以看到,在专利文献上的实验表现,要低于论文和新闻语料库中的表现。
其他文献
自2007年党的十七大提出城乡一体化的重大历史任务和目标、2012年十八大将城乡一体化提升为解决“三农”问题的根本途径以来,该主题已有大量研究成果面世,仅2007年以来在中国
2015年初,美国精准医学计划的提出得到了学术界的广泛关注。本文介绍了美国精准医学计划提出的基础与背景,重点阐述该计划在数据采集、管理与整合等方面的挑战,介绍了精准医
随着人们生活水平不断提高及消费观念的转变,我国体育用品产业逐渐复苏,人们更注重自身健康,加强体育锻炼,因而体育用品市场竞争变得愈加的激烈。许多时装品牌也试图从健康运
人格不仅是心理学问题,更是社会学问题。社会成员的人格特征与整个社会存在着深刻的联系。从社会学的视角分析,休闲教育有助于引导学生的日常生活,有助于人格的社会适应和人
民国时期 ,河南灾荒严重 ,在政府救荒不力的情况下 ,“义赈”便以各种各样的方式表现了出来。不仅国内的慈善人士积极参与 ,以西方传教士为主体的力量也加入了赈灾的行列。华
在描述移动电子商务推荐系统的基本特征基础上,分析了显式评分输入和隐式浏览输入的差异,认为移动互联网环境下隐式浏览输入是推荐输入的主流。进而通过用户兴趣提取、用户兴趣