基于条件随机场的人物信息抽取

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户:sdggertretfdhghdfh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息抽取成为自然语言处理的一个热点,同时也是难点。针对不同的问题,大家提出了不同的方法,而大多数的方法是基于启发式规则或者抽象成分类问题,本文将从人物百科中抽取人物信息看成是一个序列标注的问题,利用条件随机场对生语料进行序列标注。此外,文中详细介绍数据分析的方法以及特征选取方法,所提出的方法直接从生语料中抽取,节省了大部分方法的数据预处理部分,同时避开了大部分方法使用的句法分析的特征,有效地提高了信息抽取的效率。在文章的最后做了两组对比实验,实验结果表明,本方法能够非常准确地从HTML生语料中抽取
其他文献
根据工程实际需要,对水下不分散混凝土选用原材料进行了分析,对配合比进行了设计调整。在混凝土的生产及使用过程中,采取了一系列的质量控制措施及手段,以满足产品质量及工程施工
目的探讨更昔洛韦预防肾移植术后病毒感染的临床效果.方法对30例肾移植患者3个月内每月应用更昔洛韦,每天5mg/kg,静脉给药,滴注5天,预防病毒感染,并进行随访,了解其治疗效果.
目的:总结血管介入栓塞技术在外伤性肝脾破裂出血中的应用价值。方法收集近年来我院的外伤性肝脾破裂、行血管栓塞治疗的资料,总结分析血管介入栓塞治疗外伤性肝脾破裂的适应征
<正>各有关单位:为贯彻落实《中华人民共和国环境保护法》《中华人民共和国大气污染防治法》《中华人民共和国水污染防治法》《中华人民共和国固体废物污染环境防治法》等法
为了阐述陕西省的耕地面积变化及其压力状况,基于60a统计数据,分析了陕西省耕地数量随时间变化特点,计算了耕地压力指数,利用GM(1,1)模型预测了全省未来10a耕地面积及其人均耕
2008年2月28日,第十届全国人大常委会通过了《中华人民共和国水污染防治法》。与1996年的《中华人民共和国水污染防治法》相比,修订后的《中华人民共和国水污染防治法》虽然在
目前,全球每年约有50万t非织造布用于生产过滤器,大致相当于全球工业用非织造布总量的10%。其中主要的应用领域是液体过滤领域,2015年气体/空气过滤器所使用的非织造布超过17万t,而
朗伯于1760年出版了光度学,国际照明委员会于1924年公布了第一份视见函数V(λ).这期间160余年流行的光度学,本文称之为朗伯光度学或古典光度学.本文充分肯定了朗伯光度学在计
软件开发和软件测试是当前软件项目团队的中坚力量,两者工作相辅相成。本文分析了软件开发与软件测试在项目团队中的关系及重要性,并从软件测试的角度提出处理好与软件开发关系
传统基于频域范围的对称分量法不适于电力系统故障暂态变化过程的实时分析。针对该问题,提出一种基于时域分析的瞬时对称分量法,即根据三角函数变换的理论,构造旋转相量并对