基于特征融合方法的同义实体识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:fengaitong1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同义实体识别有助于提高数据质量,是数据融合的关键步骤之一。准确识别数据库中的同义实体可以解决数据冲突问题,有助于去除冗余数据,帮助提高数据集成度,保证数据的准确性、一致性和完整性,为数据的挖掘和分析奠定基础。因此,同义实体识别的研究具有重要意义。为利用Web动态知识库解决同义实体识别问题,本文结合实体特征和相似函数,研究基于特征融合方法的同义实体识别问题,主要研究工作如下:(1)针对现实中同一实体存在不同表象的问题,分析了当前同义实体识别的方法,提出基于搜索引擎的实体特征值计算方法。该方法是以搜索引擎为工具并结合实体特征而设计的一种相似度计算方法。为综合多个不同特征的实体识别结果,运用D-S证据理论特征融合技术融合多个特征的识别结果。最后通过实验验证了利用D-S证据理论特征融合的同义实体识别方法SER-DS在识别精度、召回率和F值上优于基于单一实体名称的同义实体识别方法,证实了SER-DS方法进行同义实体识别的优越性。(2)为充分利用搜索引擎返回的页面信息,分析了页面信息并对其作了一定程度的去噪。在此基础上设计一种新的相似函数VarSim,更精确地描述实体对之间的关系。因基于D-S证据理论特征融合技术的同义实体识别方法具有主观因素的不准确性,设计一种简单的低层信息融合方法——组合特征融合方法multi-FF,将多个实体特征组合的识别结果进行融合。最后通过实验验证了VarSim相似函数的同义实体识别效果更佳,同时也证实了基于组合特征融合的同义实体识别方法SER-multi-FF的同义实体识别效果优于SER-DS方法。
其他文献
乳酸乳球菌在工业生产的过程中会产生乳酸,而乳酸的积累会导致发酵液的酸化,进而影响菌体的生长和生产。非编码sRNA作为细菌体内重要的转录后调控因子,在应对多种环境的胁迫
随着我国综合实力的不断增强,国家提出并积极促进实施经济走廊建设及“一带一路”等重大决议。其中,“一带一路”优先需要开展的方向则是完善我国的基础设施,并使其实现与毗
近年来,城市轨道交通以其运输效率高、安全环保等优势成为了我国解决城市拥堵问题的重要发展方向。但在其快速发展的同时,安全运营也面临着新的挑战。为了保证现有城市轨道交通的安全运营及远期城市轨道交通线网的科学规划,管理者和规划者必须了解现有网络的脆弱性水平,才能找到降低网络脆弱性的方法。本文首先从网络物理结构和运行状态两个角度将城市轨道交通网络脆弱性分为静态脆弱性和动态脆弱性。复杂网络理论为城市轨道交通
本文研究了纤锌矿AlyGa1-yN/AlxGa1-xN三角量子阱中极化子能量和极化子效应(或叫极化子能移),以图像的形式给出纤锌矿量子阱中极化子基态能量、跃迁能量以及极化子效应随流体静
在现实论审判活动当中,案情复杂难以裁判对于法官而言已是较为普遍论论情况,而法官在面对诸多论疑难案件时又不能通过拒绝裁判论方式逃避责任。作为公民权利最后论保障,诉权
本文首先简单地介绍了粒子物理学、高能物理实验及正负电子对撞实验的历史和现状,介绍了高能碰撞间歇与分形研究中的一些重要的概念和理论;其次,对e~+e~-对撞的事件产生器、
由于密码子的简并性,同义突变并不改变最终的氨基酸序列,所以它在过去一直被认为是沉默的,是不会对生物个体产生任何影响的。但现在越来越多的实验已经证明同义突变可以通过
语言是我们日常交流的一种手段,而其语音具有传递信息的功能。因此,能否正确发音关系到能否正确流畅地进行交际,也体现个人的英语水平和能力。语音表征是指长期储存在记忆里
研究目的:分析椎弓根钉板内固定系统在治疗寰枢关节脱位中的临床效果。方法:研究方法用回顾性研究分析对2010年5月到2016年12月间因寰枢椎脱位在我院骨科脊柱外科病区应用钉
在深入推进反腐败斗争的进程中,技术侦查自2013年被新《刑事诉讼法》正式明确为侦查手段以来,以其独有的秘密性、灵活性、技术性、高效性、客观性、可采性、主动性、可控性等