语音输出系统中汉语自动分词问题研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:houjhz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文处理中,例如句法分析、语句理解、自动文摘、自动分类和机器翻译等,首先会遇到一个非常棘手但又不可避免的问题,那就是汉语分词问题,此问题的重要性是不言而喻的,它是一切后续工作的基础.在单词切分阶段产生的一丝一毫的差错,都将直接影响整个中文处理系统的质量.本论文所要解决的就是一个语音输出系统中的汉语分词问题.该论文在介绍了一些汉语语法、汉语分词以及数据库等方面的相关知识之后,以Visual C++为工具,按照"机械分词不达意+歧义校正"的思想,实现了该分词系统.在论文的最后讨论了一些分词方面的困难以及今后需要注意的一些词题.
其他文献
在信息化时代计算机扮演着越来越重要的角色,越来越多的企业、商家、政府机关和个人通过网络获取信息、处理信息。同时人们将大量的重要信息,以数据文件的形式保存于计算机或存
随着互联网和移动通信技术的发展,移动应用业务将逐步从以语音为主转换到以数据业务为主,越来越多的人们对信息的获取提出更高的要求,即实现随时随地访问Internet并且从Internet
在这篇文章中我们对任播服务研究的现状进行了较深入的分析与研究,并提出了一种网络层的任播服务构架和相应的路由协议HHA.在这个构架中我们主要采用了四种方法用以解决任播
作为一种有效的网络安全技术,防火墙通常被设置在Internet和内部网络之间,依据预先设定的安全策略,对进出内部网络的数据包实施合法性过滤和检查,从而实现对内部网络的保护。
该文首先介绍了解两种相关的绘制方法——基于图像的绘制(IBR)和体绘制(Volume Rendering),以及基于点的绘制与他们的关系.进而分析了当前基于点的绘制的几种主流技术以及基
云计算作为一种新型计算模式,以云数据中心为核心基础设施向用户提供按需和弹性的计算服务。然而,随着不断增长的用户需求以及对数据中心高可用性、灾难恢复的要求,通过单个数据
web信息提取是当前比较活跃的一个研究课题,但web数据的大量性,异构性和动态性,是web信息提取的一个桎梏。对于结构化的Web数据,已经有较为成熟的解决方法;而对于非结构化的Web数
嵌入式Internet网关为远程用户对设备的远程访问提供中间接口,它的关键技术是为传统的嵌入式设备提供Internet访问能力并为管理这些设备提供广泛的应用支持.考虑到代码的可重
目前,我国银行普遍应用电子计算机处理储蓄业务,大量的票据靠手工输入,速度慢,录入人员数量大,劳动强度大。银行票据自动识别系统能够对票据中的数据信息进行识别,由手工录入转化为
随着高性能计算技术的突破和发展,对整个地球系统的数值模拟软件系统已经变成可能。地球系统数值模拟软件系统具有空间尺度大、时间尺度大、分辨率要求高的特点,需要对多个物理