人名消歧关键技术研究与实现

被引量 : 0次 | 上传用户:zhangtingzhi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网时代的到来,网络使用的便捷性不断提高,终端数量不断增加,使得信息发布的速度加快,信息量飞速增长搜索与特定人物相关的信息是用户在互联网上进行搜索的主要目的之一,而重名现象的普遍性导致互联网文本中人名歧义现象严重通用搜索引擎返回的结果并不能针对歧义现象有效地组织信息,造成了用户耗费大量的时间从许多同名人物中筛选自己感兴趣的人物信息,且有遗漏重要信息的信息的风险因此,如何有效的消除这些歧义,把信息以有组织的形式呈现给用户,就成为一个非常重要的问题为此,本文进行了以下四个方面的工作:第一,本文探讨了人工标注人名歧义语料的过程,并提出了基于自适应共振理论的两阶段消歧策略模仿这一过程:在第一阶段,构建代表人物的类别并对文档进行分类,在第二阶段通过层次凝聚的方法合并相似的类别系统通过类人行为,自动构建目标概念集合并实现歧义消解本文设计实验并验证了两阶段消歧策略的有效性,在两种人名识别结果上,本文的两阶段方法的性能比传统方法提高了0.92%和5.00%第二,本文实现了人机互助的系统,辅助建立识别规则和多种知识词典资源并利用这些资源和规则建立了机构名识别系统,通过与其他两种命名实体识别工具ISLEX和LTP的比较,证明了规则方法在人名消歧任务的识别要求中,具有较高的性能和效率,可以有效适用于人名消歧系统的实际应用第三,本文对搜狗全网新闻语料进行了标注,得到了可用于互联网人名消歧研究的真实网络语料资源;分析了人物属性的对于互联网语料的重要性和各属性的特点;针对网络上的非结构化信息,设计并实现人物属性抽取系统;最后,通过在真实网络语料上的实验,对人物属性特征的有效性进行了验证第四,本文分析了人名消歧系统的任务和功能,设计并实现了基于知识资源人名消歧模块,完成了页面爬取页面分析基于知识资源人名消歧数据存储等模块,实现了直观的消歧结果排序算法,建立了新闻检索结果消歧系统
其他文献
知识经济时代,知识与创新已成为决定企业成败的关键因素,企业如何通过组织学习与智力资本来提升创新绩效成为学术界关注的焦点。本研究基于知识基础理论与组织学习理论,提出
分析了智能家居近距离无线技术中国专利申请的总体态势,深入探究了多个热点技术的专利申请状况,基于专利申请、技术特点等预测了智能家居无线技术发展趋势,并为国内企业提供
<正>一、引言近年来审计期望差问题一直是国内外研究的热点,国外已经将审计期望差作为重点进行了大量的实证调研,我国在这一领域的实证研究几乎还是一片空白。本文以我国审计
本期对雕塑语言的转换、观念的尴尬、抽象与具像等问题进行探讨,本期文章从各自的角度阐述了自己的观点,反映出对当下艺术现象的敏锐嗅觉。
教育的本质在于赋教育以生命,以生命的延续和发展为最高目标。传统公共英语教学有其滞后的弊端,需要在时代的更迭和教学的改革中注入新鲜的思路。乐活概念是倡导以健康和持续
扩散光层析成像(Diffuse Optical Tomography,DOT)和荧光层析成像(Fluorescence Diffuse Optical Tomography,FDOT)技术由于具有良好的特异性、实时性和安全性成为了成像研究的热点
教材是教学过程中极其重要的部分,词汇教学在对外汉语教学中扮演着非常重要的角色,对外汉语教材的词汇编写质量就显得尤为重要,因此对外汉语教材中的词汇编排是值得花大力气研究
农村顶岗实习教师具有教师与学生的双重身份,要求师范生在尽快适应角色转换的同时,迅速成熟,担负起重要的社会责任:志愿服务农村教育、提升农村教师素质、关爱农村儿童成长、
选聘高校毕业生到农村工作是加强基层组织建设、培养党政后备人才、推进农村发展的重要举措。大学生村官是农村干部中最具希望的一支队伍,也是一个最具独特性的群体,他们到农
目的:研究MRI对颞下颌紊乱病诊断的准确性和可信性。方法:利用MRI对19例单侧关节疼痛颞下颌关节紊乱病(TMD)患者38侧关节完成开闭口斜矢状位T1和T2加权成像,观察盘突关系、盘