基于统计与规则相结合的口语语言理解研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:cry87ac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实现“人机口语对话系统”是多年来人们一直渴望实现的梦想,也是人工智能领域研究人员孜孜不倦追求的目标。口语对话系统的目的是在用户和计算机之间提供一种交互界面,帮助用户以一种更为自然的方式利用计算机完成任务。正如“口语对话”本身所表明那样,该系统的主要特点是以语音作为输入输出,要求系统能够理解用户输入的语音。 口语语言理解是对话系统中最核心的组成部分,其性能的好坏对口语对话系统有关键性的影响。它的任务是从口语句子中提取出语义表示。口语的特点决定了口语理解的困难,口语理解一般需要解决三种噪声形式:用户的自发性引起的“随意噪声”,不合乎语法的句子引起的“语法错误噪声”和语音识别错误引起的“语音错误噪声”。本文则主要研究这三种噪声形式的处理,主要的研究工作和研究成果包括: 1.针对口语对话系统的语言理解为语义理解的特点,采用了语义框架的表示方法。为了处理具有“随意噪声”和“语法错误噪声”的口语句子,我们提出了基于统计与规则相结合的口语理解方法。该方法首先利用统计分类器确定口语句子的任务主题,然后根据这个任务主题动态寻找相应的语义语法,利用基于文法的分析技术得到句子的语义概念。在对实际用户的语料测试中,该方法取得了1.94%任务识别错误率和5.73%语义单元理解错误率。 2.语音识别作为对话系统的输入端,其性能的好坏直接影响着对话任务是否能顺利进行?为了处理“语音错误噪声”,获得更优的语音识别性能,自然语言理解模块和语音识别模块的有效融合是一个研究趋势。为此,提出了基于全信息的N-Best语音识别结果重排算法机制。该算法需要考虑如下因素:首先语音序列要与应用领域的语法保持一致,应能被语法解释,这属于语法信息;其次,由语法解释的分析结果在语义上应真实,这属于语义信息;再次,语义分析结果应与当前的对话上下文相关,这属于语用信息;最后得到语音序列的全信息值,获得全信息值最高的语音假设即为最优。 3.设计并实现了面向奥运的多语言智能信息服务系统中的人机交互模块。该模块支持多种语言查询(英语、汉语、日语等),在体育领域内,提供应用场景为赛事信息查询的多语言智能信息服务;在城市公共领域内,提供应用场景为天气预报、公交信息查询、旅游餐饮信息查询的多语言智能信息服务,既包括面向公众用户的多语言智能信息广播和讲解,也包括面向奥运参与者个人的个性化多语言智能信息咨询。
其他文献
随着通信技术的高速发展,通信网的网络规模不断扩大,网络运营商引入多厂商设备,在得到利益的同时,带来了网络复杂性日益提高。为了提高服务质量和降低运行成本,对网络管理系统的要
人脸识别技术在近几十年来成为图像处理与模式识别领域的一个研究热点,不但在理论研究上具有较大的挑战性,而且在现实生活中有广阔的应用市场。本文就是从人脸识别技术在人员
本文首先介绍了OFDM技术基本原理,其中包括OFDM的IFFT实现,以及引入循环前缀消除ISI和ICI的机理。随后介绍了IBOCHybrid系统的OFDM调制技术,并以此为例进行了Matlab仿真。 本
In this paper I have talked about basic of GSM and GPRS and there networks and the network modeling, some fundamental GSM terminology is necessary to know it, T
期刊
伴随着无线通信技术的发展,通信系统的传输速度和速率口益受到人们的关注。如何有效地、高速地、安全地进行通信,越来越成为世界各国政府和相关公司所关注的焦点,OFDM技术的推出
美国前国务卿基辛格曾告诫世人:控制了粮食,就控制了人类。貌似这句话在开玩笑,实际上是告诉建立科学的粮库监控系统,减少坏粮面积,保障粮食存储的质量和数量的重要性。而粮食的温
本论文重点研究了无线分组数据网络中采用分组调度算法的下行多天线传输。对于需要极高频谱效率的未来高速分组网络而言这是一个非常重要的系统设计问题。目标是从总容量的观
在双向中继无线网络中,由于两个信源节点到中继的距离并不都是一致的,就带来了信道之间的不对称。如果两个信源节点到中继均采用低阶的调制方式,信道质量好的资源没有得到最大限