基于前后文词形特征的生物医学文献句子边界识别

来源 :小型微型计算机系统 | 被引量 : 4次 | 上传用户:boji13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对生物医学文献的特点及信息抽取的特殊要求,提出了基于前后文词形特征和有教师学习的句子边界识别算法.与针对一般英语书面语设计的句子边界识别算法不同,本文提出的算法不使用特殊的辅助词表和语法层面的特征信息,只使用前后文单词的词形信息作为句子边界识别和消歧的依据.利用这些特征设计了最大信息熵识别器和支持向量机识别器,并在Medline摘要上进行了实验,达到了超过99%的正确率.实验结果表明,最大信息熵法和支持向量机法在句子边界消歧问题上具有相近的性能,同时还表明,对生物医学文献句子边界识别,只使用词法层
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
教《风》一文,让学生仿照诗文,展开想象的翅膀,创编儿歌。发现孩子们具有丰富而奇特的联想和想象力,从而深刻领悟到:童心清纯可爱,教师要善于营造学生学习成长的良好环境,努力为孩子
对80例存在营养风险的创伤患者分别采用肠内营养(对照组,40例)、肠内营养联合补充性肠外营养(观察组,40例)两种营养支持治疗方式,观察两组患者的蛋白水平、氮平衡的情况,发现
祝允明(1460-1526),字希哲,又号支指生、枝指生、枝山等,苏州人。擅诗文书法,才气横溢,与唐寅、文徵明、徐祯卿号称“吴中四才子”。书法造诣尤深,兼擅诸体,融会贯通,蜚声艺
2019年11月,国务院办公厅印发了《关于切实加强高标准农田建设提升国家粮食安全保障能力的意见》(以下简称《意见》),2019年全国冬春农田水利基本建设电视电话会议对高标准农
采用茜素络合物、动物体内色素标签及玻璃管动物标签3种方法对养殖条件下的曼氏无针乌贼幼体进行标志,探索其在今后乌贼野外标志放流中的应用可行性。结果表明,3种标志方法均
近日,重庆市农业农村委员会举办全市农田建设项目验收及绩效评价培训班,对农田建设项目验收、考核评价、耕地质量建设与保护及有关法律法规等内容开展培训,并对新修订的《土
一、黄河流域基本情况黄河流经我国9个省区,大部分流域属于干旱半干旱地区,农业灌溉效益显著,灌区主要分布在淳水两岸、甘宁沿黄高原、宁蒙河套平原、汾渭盆地、黄河下游平原
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
CORBA是一种当前流行的基于对象技术的中间件平台.CORBA对应用屏蔽了分布式系统的异构性.然而目前许多CORBA系统没有充分地考虑容错问题,而容错是运行在异构环境中的分布式应