基于种子自扩展的命名实体关系抽取方法的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:sunny_cui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取对语言信息的自动化处理有着重要的意义,而命名实体之间关系是信息抽取中的一个重要研究课题。它与信息检索、问答系统、信息过滤有直接的关联,同时,作为一项基础性研究,它对于自动文摘、机器翻译、内容理解、语境生成、文本分类以及数字图书馆建设都有重要的研究意义。 对于命名实体之间关系的抽取,主要有知识工程和自动训练两种主要的方法。知识工程的方法有相对较好的效果。但是它也有明显的不足,知识工程的方法的开发非常昂贵,且适应性不强。越来越多的学者都开始致力于自动训练方法的研究。 本文在目前命名实体之间关系抽取的研究现状下,对命名实体之间关系抽取进行了比较深入的探讨。本文的主要工作是利用统计学的方法,利用自动训练的方法自动获取知识进行命名实体之间关系的抽取。研究工作主要包括以下两个方面: (1)提出了一种基于种子自扩展的命名实体之间关系抽取的方法,运用这种方法可以对大规模文本集合中的命名实体之间关系进行抽取; (2)基于向量空间模型,并采用潜在语义分析和特征提取等技术,完成了对关系抽取时信息的获取。 通过以上两种方法,使命名实体之间关系抽取结果的性能大大提高。 本文提出的方法在开放语料的测试中,取得了平均72.9%的召回率和平均69.3%的准确率,从而验证了方法的有效性。
其他文献
学位
当今信息化社会,信息数据的重要性与日俱增。由于人为操作、设备故障、计算机犯罪或自然灾难等原因,数据可能被破坏,数据恢复技术得到越来越多的关注。数据雕刻技术是一种在存储
随着互联网技术与基础设施的不断发展,通过网络进行高清流媒体直播,在商品导购、景区推介、小型赛事直播等领域的应用需求日益增加。但现有商用模块或实验系统,在高清实时流媒
目前,面向对象开发技术得到广泛应用,由于其本身带有重载性、封装性、多态性,在提高了软件生产率和可靠性的同时,也给软件测试带来了诸多的问题。本文通过分析面向对象技术对软件
随着计算机图形学的深入发展,数字几何处理渐渐成为研究热点,很多研究成果已经得到了广泛的实际应用。 在数字几何处理中三维网格是最常用的物体形状表示方法,网格参数化
数字蒙太奇技术是指将同一场景的不同照片通过拼接、融合形成一幅新的更好地表达摄影师对场景理解的照片的一种架构技术。它作为一种新的图像处理技术和基于图像的绘制技术,近
混沌分形理论被认为是继相对论、量子力学之后,人类认识世界和改造世界的最富有创造性的第三次革命.混沌分形理论的基本思想起源于20世纪初,是一门正在蓬勃发展的新学科.它描述的
随着数字视频及多媒体技术的发展,适用于不同领域的MPEG,H.26x等国际视频编码标准应运而生。为了适应用户终端的多样性以及网络自身的传输特性,常需将已压缩的视频码流进行转
三维人脸合成是计算机视觉和计算机图形学领域最富有挑战性的课题之一,可以广泛地应用于新一代的人机交互、影视广告、计算机游戏、远程会议、辅助教学等许多领域,是近几年来国
虚拟现实是一种基于可计算信息的沉浸式交互环境,具体地说,就是采用以计算机技术为核心的现代高科技生成逼真的视、听、触觉一体化的特定范围的虚拟环境,用户借助必要的设备以自