面向短文本的命名实体识别

来源 :计算机应用 | 被引量 : 36次 | 上传用户:handy1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。
其他文献
问卷调查显示,常规教学与学科竞赛相脱离导致师生在准备竞赛过程中需要额外付出大量的时间与精力。以学科竞赛为依托,设计一系列创新实验项目,并把创新实验项目贯穿于日常的
高等高校是进行道德教育的重要阵地,它承担着为大学生良好道德素质的养成提供坚实的理论基础和思想基础的责任,肩负着为社会主义道德建设提供努力的目标和效法的榜样的任务。将
《刑法修正案(九)(草案)》将“违规运输危险化学品”的行为纳入危险驾驶罪的处罚范围,并试图采用抽象危险犯的立法模式来保障道路公共安全。“违规运输危险化学品”行为的入刑立足
基于ASP的远程高校考试报名系统的实现,是典型的信息管理系统(MIS),其开发主要包括后台数据库的建立和维护以及前端应用程序的开发两个方面。对于前者要求建立起数据一致性和完整
机房主要由计算机和交换机组成,是中等职业学校实验实训、教育教学的重要场所。由于计算机生均台数相对较少等原因,使得计算机需要保持较高的完好率。依据计算机管理维护的基
与欧美发达国家相比,中国作为机动车保有量最大、交通状况最复杂的国家,面临更为严峻的道路安全挑战,儿童这一道路交通的弱势群体理应得到更高的重视,但事实却并不容乐观。
随着信息技术的发展,信息技术已走近我们的数学课堂。利用信息技术辅助教学,改变了传统的教学方法和学习方式,优化了课程结构,为构筑理想课堂搭建了一个很好的平台。一、借助
本文介绍了利用由三座标测量技术或齿轮全齿宽整体误差测量技术测得的齿面误差,通过计算机模拟轻载条件下齿轮副啮合过程的接触状态,用以评估轮齿的接触斑点。同时提出了应用
非负矩阵分解(NMF)要求分解得到的左矩阵为列满秩,这限制了它在欠定盲分离(UBSS)中的应用。针对此问题,提出基于带行列式和稀疏性约束的NMF的欠定盲分离算法———DSNMF。该算法在基本NMF的基础上,对NMF得到的左矩阵进行行列式准则约束,对右矩阵进行稀疏性约束,平衡了重构误差、混合矩阵的唯一性以及分离信号的稀疏特性,实现了对混合矩阵和源信号的欠定盲分离。仿真结果表明,在源信号稀疏性较好和较
利用计算机实现高次非球面光学系统的自动设计,是从根本上克服此类系统设计之难的必由之路。本文根据一个已经实用的程序讨论高次非球面自动设计的难点、新型质量指标的建立