语音识别在视频会议中的应用研究及实现

被引量 : 0次 | 上传用户:acshixiaoguang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频会议作为一种远程实时信息交流与互动的通信方式,已经在医疗、教育、金融、政府等领域获得广泛应用。在传统的视频会议系统中,主要利用手动控制方式对视频会议进行操控,随着科技的进步和用户体验要求的提高,将语音识别技术应用于视频会议系统具有现实意义,语音识别技术是指计算机将人的语音信号,通过识别和理解过程,将其转换为相应的文本或命令,语音识别技术正逐渐成为信息技术中人机接口的关键技术,语音识别技术的应用已经成为一个具有竞争性的新兴高技术产业。本文以视频会议为背景,将语音识别技术应用于视频会议系统中,通过语音识别技术识别出预设的语音命令从而对视频会议进行操作控制,利用语音控制方式取代通过鼠标、键盘或移动智能终端等设备的手动控制方式,使视频会议系统更加人性化和智能化。本文基于CoolView视频会议系统,以其中的Android平台上的遥控器为基础,设计出基于遥控器平台的语音识别系统的整体结构并对其进行功能模块划分,根据视频会议遥控器的使用场景,分别实现了基于Google语音识别技术的在线语音识别系统和基于CMU PocketSphinx语音识别引擎的本地语音识别系统,在线语音识别系统用于会议的选择,而本地语音识别系统用于遥控器对其受控终端的控制,它是一个小词汇量的语音识别系统。此外,为了降低周围环境噪声的影响,提高语音信号的质量,语音识别系统中设计实现了一个音频处理模块,用于噪声抑制和音频无损压缩处理等。最后,通过测试,实现的语音识别系统能够满足视频会议系统的基本操作需求,验证了语音识别在视频会议系统中应用的可行性,而且本地小词汇量的语音识别系统具有较高的识别率和较短的识别处理时间,极大地提升了系统的用户体验。
其他文献
为了实现风电场双馈感应电机低电压穿越技术的可操作性和低成本投资,提出一种柔性串联制动电阻技术。FSBR开关采用具有反应速度快、可控性好、运行方式灵活的柔性电力电子器件
体内参与乙醇代谢的酶主要有乙醇脱氢酶 (ADH)、细胞色素P45 0 2E1(CYP2E1)和过氧化物酶 ,前两者均存在基因多态性。代谢酶的基因多态性与酒精性肝病有密切关系。
在ASON网络中,链路资源模块是控制平面中最基础也是最重要的部分,对实现ASON的自动发现功能起着至关重要的作用。但是,单靠链路资源管理器是不可能独立完成链路的管理和资源
本文基于个人研究和教学,以交际教学法为指导,重新考察了语言、教学者和学习者之间的互动关系,探讨了在外语和通用语两种不同框架下英语学习的标准和规范之间的差别,最后详细
调查了314例(男210例,女104例)四川凉山彝族中学生具有人类学特征的拇指类型、环示值长、指甲形状、足趾长等4项指标,结果显示:四川凉山彝族环值长出现率为86.94%,在我国族群
培养英语表达能力是英语教学的目标所在 ,而这种表达能力的形成必须在使用英语的过程中即“互动”的过程中得以实现。本文探讨了“互动”的概念、理论基础和“互动”英语教学
本文以B2C电子商务为平台,结合现阶段中国服装行业B2C电子商务发展现状,分析网络女装品牌网络营销中面临的问题,并对未来B2C平台上网络女装品牌的发展提出一些建议,希望能给
本文分析了物业管理企业文化建设的必要性及重要性,并从四个方面探讨了培育物业管理企业文化建设的措施。
当今社会,随着各种企业和单位对于运营效率的日益看重,传统的会议模式已经难以满足当前需求,由此包括PSTN电话会议、视频会议等在内的虚拟会议得到快速发展。其中PSTN电话会议是
青岛纺织外经工作浅析青岛纺织工业总公司殷国甫“外经”是具有时代特征的工作,笔者就三个方面对青岛纺织外经工作做一点粗浅的分析一、外经工作应把握时代脉博,加大实施外向带