基于上下文感知的中文新词识别算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：yhh9

【摘要】

：

为提高中文信息处理中的新词识别效率，提出一种基于上下文感知的新词识别算法。首先基于网络新词的特点，对网络文本进行N元（N-Gram）切分预处理，然后利用局部匹配预测（PPM）算法对中文

【作者】

：

李钝屠卫石磊陶永才

【机构】

：

郑州大学信息工程学院

【出处】

：

计算机工程与设计

【发表日期】

：

2012年10期

【关键词】

：

中文信息处理中文新词识别局部匹配预测算法上下文感知 N元算法语料库 Key words： Chinese information processing

【基金项目】

：

河南自然科学基金项目（2010A520039、20108520035）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为提高中文信息处理中的新词识别效率，提出一种基于上下文感知的新词识别算法。首先基于网络新词的特点，对网络文本进行N元（N-Gram）切分预处理，然后利用局部匹配预测（PPM）算法对中文新词进行识别，最后采用LRU替换算法对识别出的新词进行入库处理。实验表明，较之当今几个主流的分词机制，该算法具有较高的识别率和召回率。

其他文献

北京市综合交通运行监测专栏交通运行月报[2019年2月]

路网运行城市路网:受春节假期影响交通奈力达显著低位,总体呈节前、节中和节后三阶段特征。城市路网月日均高峰平均交通指数为2.8,总体处于基本畅通级别,环比下降44.40%,同比

期刊

交通运行运行监测综合交通月报北京城市路网段特征畅通

论跨国公司在华购并的发展历程与趋势

期刊

跨国公司购并香港中国策略投资公司外资企业

"两课"教学方式改革的探索和研究

文章针时当代大学生的具体特点和"两课"的特色,阐述了"两课"教学应在课堂讲授的基础上,尽可能地结合一系列丰富多彩、行之有效的教学形式,使马克思主义和思想品德教育理论通

期刊

两课教学方式改革lectures of 'two courses' teaching method reform

我国对外反倾销调查与外商在华直接投资研究

文章在综述反倾销与对外直接投资关系文献的基础上完成了两大任务：一是从反倾销与涉案产品部门外商直接投资的关系、反倾销与非涉案产品部门外商直接投资的关系两个方面分析了

期刊

反倾销外商直接投资合成数据模型antidumping FDI panel data model

不同微观驾驶行为对基本路段交通流运行特征的影响

为了提高道路服务水平,减少道路交通事故,改善车辆设计,开发车载安全装置通过驾驶模拟器和交通仿真相结合的方法,深入探讨个体驾驶行为交通流特征的影响.首先,选取反映驾驶员

期刊

驾驶行为驾驶模拟器交通仿真交通流特征聚类分析

逆向淘汰、财政补贴与农业的低效率发展——基于湘北农村的调查研究

农村社会劳动力转移的逆向淘汰趋势将使我国的农业逐渐失去自生能力，而不具备自生能力的农业经济组织是不能依靠财政补贴提高经济效率的。如果在劳动力逆向淘汰使农业生产失去

期刊

劳动力转移逆向淘汰财政补贴低效率均衡labor migration adverse elimination financial subsidy low

促进科技与金融结合培育战略型新兴产业

科学技术是第一生产力，金融是现代经济的核心。科技金融是实现科技与经济结合的重要手段，是实施科技创新的重要支撑条件，是促进科技成果转化、催化创新经济、培育战略型新兴产业

期刊

科技金融金融结合新兴产业战略型培育科学技术是第一生产力科技成果转化现代经济

城镇化与“三农”问题解决

目前,人们已从过去主要强调农业生产、科技兴农、粮食生产等问题跳出,强调通过农村劳动力的转移来解决"三农"问题.但由于我国现实的特殊性,一味地强调城镇化发展,不但会增加"

期刊

城镇化“三农”问题劳动力转移城镇化发展问题解决农村劳动力城镇化进程发展民营经济农业生产现代化问题urbanization agricult

日本高校毕业生就业导向机制及对我们的启迪

本文介绍了日本高校毕业生的就业导向机制的特点，分析了其长处与不足，并结合我国高校的实际，提出了完善我国高校毕业生就业制度的改革措施。

期刊

毕业生就业导向机制政府行为

基于Windows Vista的IE保护模式潜在弱点分析

为提高Windows Vista平台上Intemet Explorer7程序的安全性能，提出了基于IE保护模式架构的安全性增强方案设计方法。对Windows Vista系统访问控制机制和Intemet Explorer7程序

期刊

强制完整性控制用户界面特权隔离用户账户控制IE保护模式WINDOWSVISTAMIC UIPI UAC IE protected mode Wind

基于上下文感知的中文新词识别算法

与本文相关的学术论文