基于多层条件随机场的短语音语义识别方法

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:chren1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的日益成熟和自然语言处理技术的进步,人们采用语音和移动智能设备交互已经成为了一种趋势。本文的研究重点是如何让移动智能终端理解用户口语的语义内容,研究了一种基于多层条件随机场的短语音语义组块识别方法,该方法将口语语义理解分解为操作指令分类和语义组块信息提取两个过程,在这两个过程中均使用了条件随机场技术,通过获得组块的中间表示格式得到操作任务的语义树表达,智能终端根据最终的语义树去执行相应的任务操作,从而实现了对用户口语操作指令语义理解的目的。本文的主要工作如下:1)语料采集与分析:语料采集对象是在校学生群体,经分析将用户指令分成了十种类型。采用了两种不同的分词及词性标注工具(BosonNLP与HanLP)来建设语料库,得到了操作指令分类语料库和语义组块识别语料库,分别用于操作指令分类和语义组块信息提取两个过程中。2)根据本文研究对象的特点,设计了操作指令分类模板和语义组块识别模板,依据模板采用条件随机场技术对操作指令分类语料库中的训练语料进行训练,得到了操作指令分类模型(m_A);使用条件随机场对语义组块识别语料库中的训练语料进行训练,得到了十种操作指令的语义组块识别模型(m_N)。3)使用已经训练好的模型m_A对操作指令分类语料库中的某条测试语料进行分类,识别结果为N类型操作指令。接着使用对应的语义组块识别模型m_N,完成N类型操作指令的语义组块信息提取,并采用中间表示格式来表示N类型操作指令,得到该操作指令的语义树,从而实现对N类型操作指令的理解。在实验中,采用HanLP分词标注的操作指令分类准确率达到91.67%,采用BosonNLP分词标注的操作指令分类准确率达到了94.79%。采用HanLP分词标注的操作指令语义组块提取平均正确率达到了88.19%,采用BosonNLP分词标注的操作指令语义组块提取平均正确率达到了91.25%。
其他文献
令G是一个n阶简单图,Q(G;x)=Σk-0n(-1)n-kq(G,k)xk是图G的无符号Laplacian特征多项式.本文主要研究的问题,是关于图的无符号Laplacian特征多项式的系数(简称无符号Laplacian
醇选择性氧化为相应的羰基化合物是有机合成中一种十分重要的官能团转化反应。传统的醇氧化方法所使用的氧化剂通常会产生大量的有毒、无用副产物。氧气(空气)价格低廉,氧化
为了减缓黄土高原地区水土流失和长期施用无机肥间接造成的土壤肥力下降与土壤板结等方面的负面影响,主要从用地养地相结合对水土流失起缓冲作用和培肥地力的效果,从而达到节
在水资源短缺的地区,春季农作物生长主要受低温和干旱的影响,而地膜覆盖能提高地温和土壤含水量,增加作物产量。但是普通地膜的长期应用给土壤带来一定的破坏,生物降解型地膜
基于偏移正交幅度调制的滤波器组多载波(Filter Bank Multicarrier with Offset Quadrature Amplitude Modulation,FBMC-OQAM)技术已经成为5G中对传统正交频分复用技术的替代
三维网格序列动画(DMS)如今在计算领域中的地位日益突出,其被广泛的应用于不同的领域中,如三维房产建模、三维家具摆放和三维军事模拟等。由于三维技术所产生的模型越来越逼
随着计算机科学和Web2.0技术的不断发展,互联网在我们的生活中扮演了越来越重要的角色,极大地丰富了人们的生活。然而互联网的不断发展产生了带有“噪声”和冗余信息的海量多
本学位论文在Hilbert空间或Banach空间中,通过半闭原理、不动点技巧、投影算子技巧等工具,并利用Banach空间中的几何性质来研究解决非线性算子不动点问题与变分不等式问题.改
针对复杂的母婴市场,用户在母婴教育,健康,消费等方面难以择优选择的背景下设计了应用服务器对母婴早教,母婴生活,母婴商家等资讯信息分析,以及用户和宝宝信息收集,便于用户
针对目前光催化效率低的问题,以提高光催化活性为目的,从增强光子吸收和促进电荷分离两个方面,利用碳基材料具有独特的上转换光致发光特性、出色的电子传输和储存特性,耦合半