自动分词相关论文
为了对公共资源电子交易平台运行过程中产生的大规模结构化或非结构化的电子数据进行分析和利用,充分挖掘公共资源交易数据的价值,并......
智能问答是一种针对自然语言处理的高级信息检索形式,基于大量的语料数据库,选择构建合适的数据模型,从而实现人机之间的对话,精准......
“互联网+”时代,形象逐渐超越实物成为旅游者消费关注的焦点,游客更倾向于购买口碑好的、形象好的商品。本文以网络游记为数据来......
汉语词缀的显著特点是语义半虚半实、位置固定以及较高的能产性。词缀能够批量造就语言中急需的部分词语,造词规则较为明晰简单,符......
近几年来,信息技术和产业迅速发展,国际互联网上各种新兴应用层出不穷。上世纪90年代,Blog在西方国家出现,到2001年,已经成为了网......
本文的内容是建立在作者在研究生期间实现一个TTS系统工作的基础上的。课题的任务是建立一个基于小语料库的汉语文语转换系统,目前......
自20世纪80年代以来,计算机语料库的建设和应用,引起了许多国家信息技术领域和语言学界日益浓厚的兴趣。语料库对自然语言处理的不同......
本文主要介绍了汉语分词中未登录词识别与词性标注方法。未登录词是影响汉语分词准确率的一个重要因素,未登录词包括人名、地名、时......
该文全面介绍了TTS的发展过程、基本原理、以及多级TTS理论的基本组成.据此提出了一种网络信息阅读系统的设计方案.多级内码理论是......
该文对数据清理方面的知识进行了比较全面、详细的描述.介绍了数据清理的概念、意义和国内外的研究现状.并对数据清理的原理、方法......
在中文处理中,例如句法分析、语句理解、自动文摘、自动分类和机器翻译等,首先会遇到一个非常棘手但又不可避免的问题,那就是汉语......
基于规则的自动分词和取词系统是针对这一问题而提出的一个可行的解决方案.它同样以词库作为各项处理的基础,通过分词和取词两个自......
在自然语言文语料库的较高水平分析中,自动的词类分析是非常重要的组成部分.其中一个重要问题是,当词用于具体的上下文中时,获得正......
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向。它是指......
本文研究了在基于统计语言模型的汉语统一分词框架下的新词识别问题。主要有以下两部分工作:(1)总结已有的新词识别特征及新词识别......
本文主要实现了一个基于支持向量机的中文网页内容的自动分类系统,介绍并实现了局域网内通过网卡截获网络数据报并对数据报进行重组......
如何快速有效的寻找到合作伙伴,Web挖掘是一个理想的途径。一方面是企业对快速、准确而全面获取合作伙伴信息的渴望,而另一方面却......
随着人机通信研究的不断深入,语音合成技术越来越受到各国学者们的关注。语音合成系统要想提高其合成的语音的自然度,关键的第一步就......
Web内容过滤系统作为重要网络信息安全设施,通过对Web内容信息进行识别过滤,使得有害Web信息不能进入受保护的网络,在保护青少年身心......
随着信息技术的不断发展,特别是Internet应用的普及,网上信息成指数级增长,如何自动处理这些海量的信息,有效的保留大的文本集合成为了......
书面汉语自动分词是中文信息处理中的重要步骤,它是文本校对、机器翻详、文本分类、文本检索、计算机人机接口等诸多中文信息应用......
汉语自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对歧义字段的处理是影响分词精度的关键,国内外......
随着Internet和Web技术的飞速发展,Internet已成为人们进行信息交流的不可缺少的巨大的信息空间。面对如此巨大的海量信息,人们在......
面向奥运新闻机器翻译的中文分词研究与实现随着信息时代的到来,“信息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交......
当代科技革命的主要特征,是以计算机为支持手段进行信息处理。随着计算机的广泛应用,计算机已由过去的数据处理、信息处理发展到现在......
随着网络的发展,数字化信息迅速增加,人们对中文信息的处理也越来越关注,同时,现代汉语信息的处理和研究也显得尤为重要,计算机自动分词......
随着Internet技术的发展,各种网络应用服务越来越多,BBS(Bullet in Boards System )的开设为广大网络用户开辟了自由发表言论的空......
自动程序设计是软件工程师的梦想。随着人工智能、认知科学的理论研究发展,以及人们在软件生产领域的实践,一些特定领域的、自动、......
在中文自然语言处理中,命名实体识别(NER)是中文自动分词的一个重要步骤:同时,由于命名实体的识别课题必须解决词的边界界定、上下文......
当前软件系统开发一般基于一些高级专业编程语言,由专业程序员进行需求调研,系统设计及代码编写,系统测试等,开发工作大多由计算机......
本报讯11月22日,IBM宣布IBM WebSphere II OmniFind在华为技术有限公司取得成功应用,协助华为构建了企业级的搜索平台。华为多年的......
科研成果是图书策划的潜在对象。文章以“中国文化典籍计算机整理与开发技术研究”系列丛书为例,从把握时代脉搏,占据科研前沿,确......
本文根据网上战役训练的要求,以部队作战方案为对象,将系统工程方法、人工智能技术、模糊推理技术和神经网络技术有机地结合起来,......
网络信息的日益增加迫切需要适宜的检索工具,特别是进行专业信息的检索,需要体现专业词汇特点的搜索引擎.本文在对搜索引擎核心技......
词的正确切分是进行中文文本处理的必要条件。带标注语料库的出现弥补了分词规范和词表的很多不足,使得分词可以动态地进行。可是现......
随着科技的发展和海量信息的涌现,信息处理技术已经成为当今世界发展不可或缺的一部分。要在海量信息中提取有用的知识,就必须要让机......
近年来,随着国民经济信息化的不断发展以及Internet的普及,中文信息处理技术的应用日益广泛。由于中文文本是按句连写的,词间无间......
自动分词是中文信息处理领域的一项基本技术,也是智能化中文信息处理的关键,它在机器翻译、信息检索、文本分类等中文信息处理的各项......
[目的/意义]构建与新时代相适应的人民日报分词语料库,为中文信息处理提供最新的精标注语料,也为从历时的角度分析现代汉语提供新......
随着互联网时代的发展,如何有效地组织和分析藏文信息,提高藏文信息领域获取信息的效率,成为满足藏文信息领域人们需求的关键问题,这使......
自动分词是中文信息处理的基础课题之一。现有的分词软件和技术主要是针对现代汉语新闻科技等较为规范的文本,对于其他领域汉语文本......