基于类语言模型的中文机构名称自动识别

来源 :计算机科学 | 被引量 : 5次 | 上传用户:ydy611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。
其他文献
阐述了同类图书排列的意义、方法及种次号的编制和使用中应注意的问题,探讨了分类索书号的组成和编制方法。
移动ad hoc网络的开放、动态、分布式特性对网络安全问题提出了巨大挑战.本文指出了几种典型安全路由协议的缺陷,并提出了一种新的安全路由协议AMDSR.它采用对路由请求消息进
学科化服务是高校图书馆服务高校建设的重要手段,本文分析了当前高校图书馆学科化服务存在的问题及其原因,探讨了解决的对策。
近年来汉语方言自动辨识研究有了初步进展,但由于缺乏带有语音标注的方言音库,性能优越的并行音素识别-语言模型(PPRLM)方法尚未得到研究和运用。本文借助高斯混合模型(GMM)符号化器把PPRLM的思想方法引入到汉语方言辨识中,并通过融合置信判别使系统能够用于开集辨识。仿真实验表明,本文方法具有很高的稳定性和可靠性,综合性能较为优越。
本文分析了词汇量的语音识别原理和技术,对系统实现进行了软硬件功能划分,提出了硬件实现方案和软件实现方案,为应用产品的语音识别系统开发作了有益的探索。
等级保护是信息安全技术的重要原则之一,作为信息安全重要组成部分的网络容灾系统同样要遵循这一原则.本文详细论述了容灾系统等级划分、4种不同等级的网络容灾系统模型以及
本文利用图像的相关性原理,结合图像的边缘信息,提出了一种新的图像边缘保持的方向平滑算法。该算法主要通过控制平滑区域大小和均方差阈值来选择受噪声干扰最小和最大相关区域。仿真证明该方法能够较好地去除椒盐噪声和高斯噪声,并且能够很好地保持图像的边缘和细节信息,作为图像的一种预处理方法,具有较高的实用价值。
面对日益激增的信息量,人们迫切希望能够拥有快速、便捷获取有用信息的技术或方法。信息检索及稍晚发展起来的信息抽取技术应运而生。本文旨在介绍并分析比较信息抽取与信息检
随着移动计算技术的飞速发展,越来越多的用户将通过无线移动方式访问数字图书馆.但是,目前的数字图书馆系统都假定用户访问信息时是静止的.本文首先给出了移动数字图书馆系统
本文概要介绍南京大学自主研究开发的分布式虚拟环境AIMNET的关键技术。AIMNET借鉴了兴趣管理的思想,提出了双向一共享组播树的通讯结构,从而大大降低了网络通讯量,并保证了AIMN