基于国产处理器平台的语音识别系统设计与实现

来源 :朱帅 | 被引量 : 0次 | 上传用户:maigcy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术不断进步,计算和数据资源日益丰富,人类面临信息处理的便捷性和安全性两大问题。智能语音技术提供了高效便捷的人机交互方式,经过多年发展已在多个领域落地应用,取得了显著成果,语音识别作为智能语音技术的第一步,对整体交互体验起到关键性作用。我国早已布局自主可控技术研究以保障信息安全性,目前处理器层已有龙芯、飞腾等多款国产处理器平台,操作系统层已有麒麟、深度等操作系统平台,上层应用生态圈建设也在稳步推进,在国产软硬件平台部署离线语音识别系统具有重要意义。针对以上问题,设计并实现了可以进行词库短语识别的语音识别系统,并将该系统移植到龙芯和飞腾平台的银河麒麟V10操作系统中运行。系统通过将音频数据读取与音频数据保存设计为协同工作的两个子模块,实现语音自动采集功能,工作时可自动检测说话人讲话间隔并将讲话内容保存。近年兴起的端到端模型相较传统隐马尔可夫模型易于训练和部署,经过分析不同建模方式优点和局限,搭建了基于门控卷积神经网络+连接时序分类的端到端语音识别模型。模型使用Thchs-30、AISHELL-1、Primewords Chinese Corpus Set 1和ST-CMDS四个开源数据集训练,经过测试,其在四个数据集的平均词错率在10%以下。为了使项目部署在C/C++环境并移植到龙芯和飞腾平台,使用Tengine框架进行前向推理计算。针对特定短语识别,设计并实现了一种基于发音的拼音相似度计算,该方法生成声母距离矩阵和韵母距离矩阵用于定量表示发音区别,基于该方法设计并实现了匹配模块,进一步提升了词库短语的识别准确度。经多次测试,该语音识别系统在x86平台和龙芯平台均运行良好,短语识别正确率可达95%,识别时间在1s之内,均达到目标需求。
其他文献
工业信息物理系统作为工业生产基础设施的关键,其信息-物理域的高度耦合特性虽然提高了信息空间对物理进程管理的有效性和实时性,但同时使得系统安全边界模糊化。信息安全攻击极易利用静态脆弱点或动态薄弱环节入侵至系统内部,并逐步跨域渗透至物理域引发系统大规模级联故障。因此,设计工业信息物理系统脆弱性评估框架并探究关键评估技术是保障系统稳定运行的首要前提。根据系统脆弱性评估需求,本文从四个方面展开深入研究。首
学位
基站(Base Station,BS)部署的密集化正在推动网络结构向异构超密集网络(Ultra-dense Networks,UDN)演进,为协调致密化引发的严重的小区干扰,多点协作(Coordinated Multiple Points,CoMP)技术逐渐成为UDN中可行且有前景的传输方案。然而,在UDN中应用CoMP形成的BS协作区域很小且不规则,会导致移动用户频繁切换。此外,小区和用户距离拉
学位
“既然p,就q”作为推论性因果复句的代表,不论是在书面语中还是人们的日常交际中使用频率都非常高,且通过分析偏误语料可知,留学生在习得该语言点时产生的偏误较多。虽然目前其本体研究日趋细化,但结合对外汉语教学对其进行专门的研究尚不够充分。因此,结合对外汉语教学对该结构进行研究,既有理论意义,也有实践价值。构式语法作为认知语言学的一个重要组成部分,是目前语言研究领域中较为活跃的理论之一,同时也为语言习得
学位
随着第五代移动通信技术的发展,具有高速、低延迟、高可靠性以及无需部署新的路边基础设施等优势的5G技术将为车联网(Vehicle-to-Everything,V2X)带来巨大突破。然而,承载5G蜂窝网络下的车联网中存在一些安全问题,首先在性能方面,根据第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)制定的接入认证标准(EPS-AKA、5G AKA)
学位
语言安全问题由来已久,伴随着网络技术的发展普及,网络空间存在的语言安全问题影响了语言的健康发展,且可能危及国家安全,亟需引起重视,并加强相关治理工作。而网络空间的语言安全与治理问题涉及的理论层次广泛,目前学界综合性、系统性研究较少并且相对分散。对网络空间语言安全问题与语言治理的研究,正有其必要性与紧迫性。本研究以网络空间的语言安全问题为主要研究对象,通过对网络语言安全问题实际例证的梳理,结合具体的
学位
近年来,直播带货行业蓬勃发展,带货主播也于2020年成为正式工种,成为就业新风口。长久以来,人们普遍认为男性在媒介形象塑造中处于优势地位,关注度与相关研究较少,但实际上“坚毅”“强壮”“有冒险精神”等性别气质标签也在潜移默化中加深了男性群体的性别刻板印象,不利于社会对多元化男性形象的接纳。与此同时,有研究表明,男性的反性别刻板印象接受度较低,而女性的反性别刻板印象接受度远远高于男性。但在直播带货场
学位
信息存储的需要推动着光存储技术向超高密度方向发展,基于聚甲基丙烯酸甲酯(Polymethyl Methacrylate,PMMA)材料的多层光存储是其中一大研究热点。PMMA光盘选择新的介质材料和记录方式,带来了许多区别于传统光盘的误码问题。除了电路噪声、激光源噪声等因素,PMMA光盘上的数据还会受到码间串扰的影响,使用过程中形成的划痕、污点等也会引入连续错误。因此PMMA光存储系统需要一个同时具
学位
2013年9月和10月,习近平总书记在出访哈萨克斯坦和印度尼西亚时先后提出建设“丝绸之路经济带”和“21世纪海上丝绸之路”的重大倡议。2015年3月,中国政府发布《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》,明确提出“中巴、孟中印缅两个经济走廊与推进‘一带一路’建设关联紧密,要进一步推动合作,取得更大进展”。2015年4月,习近平主席对巴基斯坦进行首次国事访问期间,双方同意以中巴经
学位
在形象学研究中,对文学作品里“异国形象”的探讨经久不衰。就中国文学外译而言,不同译者在目的语文化中塑造的中国形象及其原因值得探讨。《聊斋志异》是蒲松龄创作的文言短篇小说集,该作品以独特的视角和生动的人物形象备受大众喜爱。Strange Tales from a Chinese Studio(2006)出自汉学家约翰·闵福德(John Minford)之手,经由企业出版社出版,一经问世便广受赞誉。本
学位
近年来,固态硬盘制造商通过使用多层存储单元等先进存储技术提高闪存存储密度,降低固态硬盘生产成本,但这些技术使得固态硬盘的数据可靠性不断降低。面对日趋严重的可靠性问题,固态硬盘采用重读方法解决纠错码不可校正的数据错误。重读方法包含多个重试步骤,每次重试步骤会调整读参考电压来重新读取数据,使得纠错码能够校正数据的比特错误。重读方法虽然空间开销小,但是会引入更严重的读干扰问题,而且还会显著增加固态硬盘的
学位