SVM与错误驱动学习相结合的生物实体识别方法

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户：kahn419

【摘要】

：

本文介绍了一种SVM和基于转换的错误驱动学习相结合的生物实体识别方法。该方法首先通过抽取较为丰富的特征集合如单词特征、词性特征和词形特征等,使用GENLA语料对SVM分类器

【作者】

：

黄浩炜王挺陈火旺

【机构】

：

国防科学技术大学计算机学院,湖南长沙 410073

【出处】

：

第九届全国计算语言学学术会议

【发表日期】

：

2007年期

【关键词】

：

错误驱动学习方法生物学特征集合转换规则识别方法分类器语言现象训练文本命名实体词特征运用语料校正词性词形抽取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了一种SVM和基于转换的错误驱动学习相结合的生物实体识别方法。该方法首先通过抽取较为丰富的特征集合如单词特征、词性特征和词形特征等,使用GENLA语料对SVM分类器进行训练,然后使用训练后的SVM分类器进行生物文本中命名实体的识别。为进一步提高识别的效果,该方法利用基于转换的错误驱动学习方法对SVM的标注结果进行校正,转换规则较好地挖掘出生物学文本中的语言现象,进一步提高运用SVM方法得到的结果。

其他文献

番薯属甘薯与牵牛EST-SSR标记开发及通用性分析

通过对番薯(Ipomoea)属的12 812条甘薯和28 422条牵牛EST唯一序列进行检索分析,在319条甘薯EST序列中发现了共328个EST-SSRs,平均每20.41 kb出现1个甘薯SSR;在936条牵牛EST序

期刊

Sweet potato (Ipomoea batatas)Morning glory (Ipomoea nil)EST-SSRTransferabili

基于DCC动态流通语料库的中文组织名监测与研究

本研究以中国主流报纸动态流通语料库DCC(Dynamiccirculating corpus)为研究平台,选取2002-2006年六份主流报纸作为中文组织名监测研究的专用语料库,最终形成一个中文组织名

会议

中文命名实体识别系统的领域扩展

本文利用条件随机场模型实现了一个金融领域到通用新闻领域的中文命名实体识别系统领域扩展方案,并对如利用分词和词性标注信息进行了深入的研究。原系统针对金融领域,在分词

会议

谷物胚乳中淀粉合成酶及其同工型的研究进展

谷物中通常以淀粉的形式储存能量,淀粉由直链淀粉和支链淀粉组成.在胚乳中,支链淀粉生物合成中涉及二磷酸腺苷葡萄糖焦磷酸化酶(ADP glucose pyrophosphorylase,AGPase),可溶

期刊

EndospermStarch synthaseStarch synthase isozyme

基于自学习策略的产品特征自动识别

本文主要考察只有规模很小的标注语料可用时,如何进行产品特征的自动识别。特别地,产品特征应按句子进行识别,因此识别过程可看为二元分类问题。本文中产品特征候选用二值向

会议

基于WEB的计算机领域新术语的自动检测

本文主要介绍"基于WEB的计算机领域新术语的自动检测"算法的设计和实现。随着计算机技术的迅猛发展,英语中每天者会出现大量的该领域的新术语,如何将这些新兴术语及时发现并

会议

计算机技术新术语语料库自动检测算法设计实现词语新出现时间点度曲线英语应用特征思想考查汉语比对

小规模语料中术语概念关系的提取

本文提出了一种从小规模语料中提取术语概念关系的方法。其基本思想是利用关系所关联的术语的共性而非术语对的共性提取关系。基于此想法。我们提出了两个假设。以它们为前提

会议

小规模语料领域术语概念关系提取方法判别函数目标关系关联计算机直观信息思想实验规则

100-Gb/s undersea transmission with high spectral efficiency using pre-filtered QPSK modulation form

We provide a review of our recent 100-Gb/s, high spectral efficiency (SE) experiment targeting transoceanic and regional undersea transmission distances. We dem

期刊

QPSKfilteredformattransmitterquadraturefilteringposteriorimultiplexingtr

生物医学命名实体识别的特征选取与评价

本文研究的主要目的是针对生物医学命名实体的特点开发使用有效的特征集合,并结合使用不同的信息资源,以提高基于特征的机器学习方法识别生物医学命名实体的性能。本文详细分

会议

和苏联专家们相处的一些体会

在庆祝偉大的十月社会主义革命四十周年的节日里,我們怀着感激的心情想起这一偉大国家对我國的真誠友誼和無私帮助;也使我想起了和苏联?覀兿啻θ兆又械闹种只匾浜吞寤帷?在

期刊

药用植物苏联专家四十苏联国家他都不言我能我曹燕私家墓

SVM与错误驱动学习相结合的生物实体识别方法

与本文相关的学术论文