基于搜索引擎与规则的中文实体名称消歧方法

来源 :电脑知识与技术:学术版 | 被引量 : 0次 | 上传用户:zj770929
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对专家推荐场景下中文机构名称存在语义异构的问题,提出搜索引擎与规则相结合的中文实体名称消歧方法,首先利用搜索引擎的映射能力解决异构问题,然后通过编辑距离纠正实体机构名称,最后使用后缀、缩写等规则对实体进行消歧。该方法在12108份包含同名机构实体的真实数据集上测试具有良好的性能表现,机构数量降低12%,实验结果表明所提方法有效。
其他文献
所谓计算思维就是涵盖计算机科学之广度的一系列思维活动,可以将复杂的问题简单化,通过一系列的计算,建模等方式使问题得到解决。论文从大学计算机课程现状与存在的问题出发,
Microsoft PowerPoint用来制作多媒体课件比较常见,在于操作简单方便、容易上手,深受幼儿、中小学老师的喜爱。PowerPoint能集成图片、文字、动画、音视频等多种媒体形式,使
针对目前市场对智能家居需求的不断增加,以及智能家居市场所面临的造价高、标准不统一等现状。介绍了模块化设计在智能家居中的设计思路,以及利用模块化设计解决上述的智能家
通过面向武汉市广播电视大学开放教育学院汉口、光谷校区4个班级130名学生发放调查问卷,对新媒体背景下开放教育学生网络素养进行了统计分析,结果显示,开放教育学生认识到了
介绍了一个加工链轮、曲轴端面孔数控机床的通用程序。加工各种不同品种链轮、曲轴端面孔的专用数控机床的数控编程比较复杂,本文介绍了一个合理的采用参数化设计的通用加工
微信等各类公众平台是在基于"互联网+"信息技术的发展上而产生的,目前,随着微信功能的不断延伸,其在各行各业日常工作中得到了更加频繁地使用。并将其充分地运用到了课堂教学
为了解决经典快速排序算法在面对待排序数据事先有序,大量重复数据,递归层数过深以及排序稳定性等诸多问题时暴露出来的缺陷,从枢轴的合理选择、三路划分、与其他排序法结合
近年来,国民越来越注重生活水平和质量,纷纷尝试着在室内居住环境和办公环境中摆放绿植以达到休息放松和美化环境的目的。但由于生活工作节奏的日趋加快,人们由于缺乏时间、
在大数据时代,随着网络上的文本数据日益增长,文本分类技术显得越来越重要,是文本挖掘领域的热点问题,具有广阔的应用场景。文本分类方法的研究开始于20世纪50年代,一直受到
为满足15A以内直流稳压电源的检定需要,设计该标准装置。文章介绍了新建标准装置的结构和工作原理、技术特点等。对测量不确定度、重复性、稳定性进行实验验证。