麦克风阵列教室拾音系统的设计与实现

来源 :阜阳师范大学 | 被引量 : 0次 | 上传用户:greathuhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在教育信息化迅速普及的背景下,许多学校陆续引进诸多教学辅助设备,如录播教室、教学一体机等。然而在丰富的辅助教学工具中,往往疏忽授课老师最基本的扩声需求。在传统教学过程中,授课老师通常会佩戴耳挂式麦克风或者手持式麦克风等拾音设备,麦克风拾取语音信号后以有线或者无线的方式传送到扬声器完成扩声,这种方式存在麦克风佩戴不舒适等问题。近年来,教室扩声系统开始使用吊装式麦克风替换传统佩戴式麦克风。吊装式麦克风通过将带有指向性的单一麦克风吊装在讲台前方的方式完成对某一固定区域的拾音,从而真正满足了授课老师“无感”扩声的基本需求,但这种方式存在拾音区域过于单一等问题。本文以麦克风阵列信号处理技术为基础,提出以环形麦克风阵列作为拾音设备的设计方法。通过将拾音过程划分为语音端点检测、说话人声源定位以及指定方向语音增强三个阶段来实现说话人的远场拾音。本文的主要工作如下:1.对比双门限法与子带谱熵法两种语音端点检测算法的性能。双门限法存在门限阈值难以确定,以及对于固定门限阈值,不同信噪比条件下,检测结果不稳定等问题。子带谱熵法检测结果较为准确,而且在同一的门限值下,不同的信噪比和不同语音检测结果基本相同,具有较高的稳定性和普适性。2.对比延时求和(DAS)和最小方差无失真(MVDR)两种声源定位算法的性能。MVDR算法在声源定位的准确度和平均偏离角度上均优于DAS算法。在抗混响性能对比实验中,MVDR算法随着频率增加抑制波束旁瓣的能力强于DAS算法,并且在2KHz以下,MVDR算法的抗混响能力明显高于DAS算法。3.对比延时求和波束形成算法和广义旁瓣对消(GSC)波束形成算法两种语音增强算法的性能。不同帧长条件下,DAS和GSC算法对应的输出信噪比和期望信号失真度会随着帧长的增加而提高;在不同输入信噪比条件下,GSC算法输出信噪比性能优于DAS算法,并且相较于DAS算法,GSC算法能够利用阵列冗余度对其他来波方向信号进行有效抑制。4.基于教室内的环境,本文利用Re Speaker Mic Array作为麦克风阵列硬件设备,将算法移植并运行在树莓派Linux C++环境中,搭建了一套基于麦克风阵列的教室拾音系统。分别实际测试语音端点检测算法、声源定位算法和波束形成语音增强算法的有效性。通过实验测验证了所搭建拾音系统的可行性。
其他文献
严格印证证明模式是对传统印证证明模式的深化认识,它不仅体现了印证证明对于证据数量充分性与证据信息相互支持性的外部适用要求,还反映出印证证明内部对于证据来源、印证适用范围、印证适用程度的严格要求。司法证明模式的调整需以诉讼真实观及司法体制、程序机制的发展状况为重要考量,断然选择冒进的调整方案不具有现实可行性。破解严格印证证明模式绝对化与僵硬化的路径在于,优化印证证明的适用,促进心证的融合运用,即根据
进入“十四五”新发展时期,我国儿童受保护权的立法保障迈上了一个崭新的台阶。《民法典》的出台为儿童的健康成长提供了全方位保障,《未成年人保护法》与《预防未成年人犯罪法》的全面修订,进一步严密了儿童权益保护网。与此同时,儿童受保护权的制约因素仍然存在,表现为法律家长主义与儿童主体地位的紧张关系、区域发展不均衡背景下困境儿童权益保护的现实问题以及现代教育背景下儿童健康权保障的新问题。随着法律和政策的不断
<正>未成年人是国家的未来、民族的希望,未成年人的健康成长关系着中华民族伟大复兴和亿万家庭幸福安宁。未成年人保护的重要性不言而喻。如何更好维护和保障未成年人合法权益,促进他们身心健康发展,是全社会共同关注的话题。加强未成年人保护,打击侵害未成年人犯罪,更是全社会义不容辞的责任。
期刊
基于网络整合营销4I原则对信息素养教学开展研究,为高校图书馆的信息素养课程及教学设计提供理论依据与实践思考。4I原则对于信息素养教学的价值体现在强化教学保障能力、促进师生互动、提升课程质量,依托4I原则所强调的趣味、利益、互动、个性四个原则可分别针对教学内容、教学目的、教学方法、教学设计四个方面开展应用。网络整合营销4I原则在信息素养教学中的运用是一种以学生需求为导向的教学探索,通过新颖的教学模式
<正>对于未成年人、精神病人、植物人等非完全民事行为能力人,监护人应正确履行监护义务,保障被监护人的财产安全;银行应采取有效措施履行说明告知等义务,在确保业务合规性的同时,综合考虑客户的实际情况和诉求,保障非完全民事行为能力人获得金融服务的合法权益。
期刊
针对噪声治理过程中噪声源的定位及分离问题,本文通过对传声器阵列结构的仿真对比设计优化出18阵元螺旋阵,在此基础上对常用声源识别定位算法进行研究,选择高分辨MVDR算法对汽车鸣笛声进行测量识别实验,实验结果表明该"声相仪"系统能够很好地识别汽车鸣笛时的噪声效果,解决高分辨目标方位估计问题,验证了该声相仪系统的有效性。
直播电商革新了农村传统发展方式,是乡村振兴战略的强力引擎,也是农业现代化的重要动力。直播带货作为电商经济的新业态,在农产品直播营销中存在一些问题,如人才契合度低、消费习惯难培养、忽视精神价值、现有风格易视觉疲劳等现状有待提升。基于4I理论,“东方甄选”爆火背后是其用丰富生动的内容换取停留时间,满足价值需求助推品牌长远发展,多样话题设置调动用户参与氛围,差异化的场景打造自身文化符号。“东方甄选”围绕
目前,语音识别的测试需要提供语音及其转录文本,测试语音需要涵盖各个场景下的语音输入,因此,测试语音的数量远远不够。鉴于用户评论中包含用户使用场景等可辅助测试的信息,文中提出一种用户评论驱动的语音测试数据生成方法。首先,爬取移动应用市场中语音相关应用的用户评论,对其进行清洗和预处理。其次,提取评论中的语音属性并分析语音属性在评论中的组合。最后,通过数据蜕变对语音种子进行语音属性及其组合的变换,生成语
新课程标准的颁布,进一步推进了素质教育改革的进程。深度学习近几年来成为中小学教学的重点内容。小学语文教学越来越注重学生综合素质的培养,比较阅读策略成为小学语文教学中的重要方法。在传统的教学模式中,大多数教师往往采用较为单一的教学模式,这对于学生学习兴趣的激发和学习习惯的养成以及语文阅读能力的提升都是较为不利的。为了能够有效解决学生语文学习和阅读方面的问题,教师就可以采用“比较阅读”策略,让学生在“
塔可夫斯基的电影空间通过运动的景深镜头实现了可见的深度,而运动的身体与运动背景也在不断的变化中实现了交互的构造。塔可夫斯基电影中的大地是空间的基础,家宅和庙堂是主体意义的存在场所,而故乡作为精神空间的源泉,它的失落将导致身体空间与外部空间的分裂。塔氏电影的梦境空间始终朝现实开放,而其幻觉空间则体现了物迫近下主观空间的萎缩。总的来看,塔可夫斯基电影空间具有内倾性、原初性和自然性三大特征。