词语切分相关论文
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结......
汉语书写时是按句连写,词间无间隙,容易让人在句子的理解上产生偏差,这就给查询信息、机器翻译等工作造成了很大的困难:造成不相关......
中国手语环境下的自然语言处理是人工智能的一个重要分支,而手语环境下的汉语自动分词是中国自然语言处理的一项基础性工作,也是中文......
随着计算机技术的发展,语音交互已经成为人机交互的必要手段。让计算机发出自然流畅的语音是人们梦寐以求的事,随着语言学、语音学、......
随着计算机技术,特别是网络技术的迅速发展和普及,人们越来越迫切地希望用自然语言与计算机交流。因此自然语言信息处理得到了前所......
本文首先介绍了蒙古文附加成分的切分方法,然后描述了改进的蒙古文自动词性标注系统的总体结构,最后以规模为95万词的语料库作为训......
本文根据“词汇的完整性理论”证明合成复合词从内部组合特征和外部扩展特征两方面都不同于词组结构形式,即与词汇不同层次的句法......
本文介绍了美国 SIRSI公司的 Unicorn图书馆自动化集成系统公共目录查询模块 Web Cat,并对 Web Cat中文书目检索机制与应用进行了......
由于汉语与英语有不同的特点,导致机器翻译时把汉语当做源语言要比把英语当做源语言要困难得多。本文试图从汉英机器翻译的角度探......
【正】0.汉语的词语切分是一个十分重要然而又尚未解决的难题.诚如兹古斯塔所指出:“汉语词汇单位的界线往往不好确定,也不易辨别,......
北京大学计算语言学研究所在开发了《现代汉语语法信息词典》等语言资源的基础上,又在实施另一项大型语言工程,即对大规模的现代汉语......
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结......
探讨搜索引擎技术的概念与原理,分析了各个部分的功能及设计要点.通过设计并实现了一个搜索引擎,探讨索引擎的设计与实现的方法.......
维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象......
汉字的“字”与汉语的“词”单位不一致,给人脑和电脑的理解都带来困难。汉语另外有三种可能的文本:“汉字词式书写”文本、“纯拼音......
虚拟新闻丰富了战略对抗演习的表现手段,提高了参演人员的沉浸感。针对目前该系统以人工操作方式为主和自动化程度较低的现状,提出将......
根据拉丁维文的特点,分析了拉丁维文常见的拼写错误类型,提出了一种将最小编辑距离、基于有向图模型的词语切分和trigram语言模型融......
本文介绍了美国SIRSI公司的Unicorn图书馆自动化集成系统公共目录查询模块WebCat,并对WebCat中文书目检索机制与应用进行了探讨。......
对中文时间词和数词在文本中的常见形式进行归纳,以此为基础构建用于识别时间词、数词的规则集,提出一个基于规则的时间词和数词自......
在国家标准《信息处理用现代汉语分词规范》基础上,兼顾中古词汇的过渡性、佛教文献的特殊性、人工分词的操作性、分词软件识别的......
计算机翻译是人工智能的重要研究课题,目前已有不少计算机翻译软件系统研制成功并投入实际使用,取得了一定的效果,但依然存在较多......
北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括......
北京大学计算语言学研究所在开发了《现代汉语语法信息词典》等语言资源的基础上 ,又在实施另一项大型语言工程 ,即对大规模的现代......
北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外,还包括专有......
外国学生在阅读中文时常会出现断词错误或字字停顿的现象,这给他们带来了很多阅读上的问题和障碍。因此,外国学生在阅读中文句子时......
自然语言处理是计算机科学中一个引人入胜、富有挑战性的课题。它的任务是建立一种计算模型,这种计算模型能够模拟人类语言认知的过......