利用拼音特征的深度学习文本分类模型

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:soogler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对人-机器人语音交互中经过语音识别的文本指令,提出了一种利用汉语拼音中声韵母作为特征的深度学习文本分类模型。首先,以无人驾驶车语音导航控制为人机交互的应用背景,分析其文本指令结构并分别构建单一意图与复杂意图语料库;其次,在以字符作为文本分类特征的基础上,结合汉语拼音与英文单词的区别,提出了一种利用拼音声韵母字符作为中文文本分类的特征表示方法;然后,用门控递归单元(GRU)代替传统递归神经网络单元以解决其难以捕获长时间维度特征的不足,为提取信息的高阶特征、缩短特征序列长度并加快模型收敛速度,建立了一种结合卷积神经网络及GRU递归神经网络的深度学习文本分类模型。最后,为验证模型在处理长、短序列任务上的表现,在上述两个语料库上对提出的模型分别进行十折交叉测试,并与其他分类方法进行比较与分析,结果表明该模型显著地提高了分类准确率。
其他文献
随着科技的发展,对机械零部件、模具产品的加工精度要求越来越高,高精度的单向走丝电火花线切割加工在国内逐渐得到普及。对于一些特殊要求的产品,不仅要求有高精度的机床,同时还
中国产业政策的执行对企业间工资差距有何影响?文章首先考虑加入了产业政策因素的异质性企业模型,从理论上将产业政策对企业工资影响分解为补贴转移效应与竞争效应两种机制,
随着幼教改革的深入,我园从幼儿园的实际情况出发,积极探索开发灵活多样的棋文化早期教学形式。通过培养幼儿耐心、细致的思维品质、遵守规则、相互合作、智力开发等方面探索
将群众路线与社会调查结合起来,是毛泽东社会调查的鲜明特色,是毛泽东对社会调查理论和方法的重大丰富和发展。毛泽东社会调查是拜群众为师,甘当群众小学生。开调查会和典型