《知网》在命名实体识别中的应用研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：guoke3zhang

【摘要】

：

命名实体识别是自然语言处理领域的一项基础研究，它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别，提出了基于《知网》的两种改进策略来增强模型的泛

【作者】

：

郑逢强林磊刘秉权孙承杰

【机构】

：

哈尔滨工业大学智能技术与自然语言处理实验室计算机科学与技术学院

【出处】

：

中文信息学报

【发表日期】

：

2008年5期

【关键词】

：

计算机应用中文信息处理名实体识别概念相似度《知网》最大熵模型 computer application Chinese information pr

【基金项目】

：

国家自然科学基金资助项目（60435020,60673019）,国家863计划资助项目（2006AA01Z197,2007AA01Z172）,黑龙江省自然科学基金资助项目（E200635）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

命名实体识别是自然语言处理领域的一项基础研究，它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别，提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到最大嫡模型中；第二种策略是利用《知网》来计算最大嫡模型中词特征之间的概念相似度。在北京大学《人民日报》语料上的实验结果表明第一种策略可以有效地提高名实体识别的性能，第二种策略的改进效果不明显。

其他文献

《元朝秘史》电子文本检索系统的研制

本文概要地介绍了13世纪《元朝秘史》的文献背景及原文所独有的复杂文本形式,通过对文本的内涵分析和版面分析,设计了关于《元朝秘史》电子检索系统的研制方案.其中主要解决

期刊

计算机应用中文信息处理元朝秘史复杂文本电子检索系统computer applicationChinese information processin

发展“自主型国际代工” 迈向“共享式经济增长”

虽然金融危机过程中的国际经济走势还存在诸多不确定性，但我国经济运行已处于企稳回升的关键时期。因此，我们在思考和寻求因应金融危机的政策时，应立足当前、着眼长远，并涵括宏观

期刊

经济增长国际自主型代工共享金融危机经济走势经济运行

拓展市场突出效益构筑我局跨世纪发展的坚实基础

一、关于当前面临的形势和任务去年以来,我局生产经营内外部环境发生了很大变化,已经进入到了一个十分困难的时期。1999年,这些困难和压力正在逐步加大。主要表现在:一是市场

期刊

天然气跨世纪发展建立现代企业制度生产经营拓展市场市场竞争扭亏增盈坚实基础效益集团公司

我爱云南的云和山

<正>~~

期刊

云南民歌艺术大师绕丝叠山对齐幻山里山云山自然

一种改进的Wu-Manber多模式匹配算法及应用

本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足，给出了一种改进的后缀模式处理算法，减少了匹配过程中字符比较的次数，提高了算法的运行效率。本文在随机选择的TRE

期刊

计算机应用中文信息处理多模式匹配后缀模式字符串匹配全文检索信息检索computer application Chinese informatio

天然气管道产业经济带的形成与发展

耗资巨大的"西气东输"工程已经启动,这意味着"气化中国"的构想正在变为现实,标志着我国天然气管道建设将进入发展时期。因此,研究与天然气管道建设相关的经济问题,对于加快天

期刊

天然气管道天然气资源产业经济带形成与发展天然气利用管道建设西气东输天然气工业天然气消费能源结构

一种支持多语言文本布局方向的文档处理模型

文档处理是文字处理的关键组成部分，针对多语言混合排版的需求，本文提出了基于“框”的支持不同方向的多语言文本布局的文档处理模型。该模型把时文本布局方向的处理封装在文档

期刊

计算机应用中文信息处理文档格式化文本布局方向文字处理computer application Chinese information process

汉语词典的快速查询算法研究

汉语词典查询是中文信息处理系统的重要基础部分，对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾，设计实现了基于双数组TRIE机制的汉语词典查询算法，并提出了

期刊

计算计应用中文信息处理汉语词典查询双数组TRIE双编码算法computer applicationChlnese information proce

基于配价的维吾尔语框架语义知识库的构建

本文阐述了以配价作为基本描写法、真实语料为事实依据的维吾尔语框架语义知识库（简称框架网FrameNet）的构建，该知识库在构建维吾尔语词汇及其所属框架的语义词典等诸多领域有着

期刊

计算机应用中文信息处理框架网维吾尔语配价computer application Chiriese information processing

信息检索中一种基于词语-主题词相关度的语言模型

本文提出一种基于词语主题词相关关系的语言模型TSA-LM （Term Subject Association Based Language Model ），它的基本思想是把一篇文档分成两个文档块，一部分是由领域主题词表中

期刊

计算机应用中文信息处理语言模型主题词词语-主题词相关关系词语文档-主题词归属关系词语主题词共现关系computer application

《知网》在命名实体识别中的应用研究

与本文相关的学术论文