麦克风网络中分布式说话人跟踪方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:xue5559
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线传感器网络、阵列信号处理、移动计算、集成电路等技术的不断发展以及智能终端设备的普及,分布式麦克风网络以其灵活的网络拓扑结构、分布式的数据处理方式而得到高度重视,已成为语音信号处理领域的研究热点。基于麦克风网络的说话人跟踪就是利用网络中麦克风接收的声音信号,应用分布式信号处理方法来估计说话人的位置信息,它在视频会议系统、语音识别系统、人机交互、智能交通系统、公共安全监控、国防军事等领域具有广泛应用。近年来,基于分布式麦克风网络的说话人跟踪理论已经取得一定进展,但在复杂环境情况下尚有许多问题有待深入研究解决。例如,现有方法要求已知网络中各节点相关性和节点数,且仅采用单一模型来描述说话人运动,不能充分模拟真实运动状态;假设环境噪声是高斯分布,忽略了应用场景中常见的汽车喇叭声、鼓掌声、敲门声等非高斯脉冲噪声干扰问题。这些复杂情况都会导致现有方法的定位精度和跟踪性能严重下降,无法满足实际应用需要。本文根据贝叶斯理论框架,对麦克风网络中分布式说话人跟踪方法进行了深入研究,提出了说话人跟踪新方法,实现了对说话人运动轨迹的有效估计。本文的主要创新工作如下:(1)针对单一运动模型不能充分模拟说话人真实运动状态的问题,提出一种基于分布式交互式多模型粒子滤波器的说话人跟踪方法。该方法根据常见的说话人运动状态,选用三种运动模型来模拟说话人的运动;考虑到房间混响和背景噪声的影响,基于多个时间延迟候选估计,提出一种有效的时延估计方法。然后,在每种运动模式下,利用分布式粒子滤波器得到说话人的状态估计。最后,应用交互式多模型算法,将三种运动模式下的状态估计进行组合交互,得到最终的说话人全局状态估计,实现对说话人位置的有效跟踪。实验结果表明,所提出的分布式说话人跟踪方法,能够克服房间混响和背景噪声带来的影响,获得良好的跟踪精度。(2)针对麦克风网络各节点间相关性或节点数未知的情况,提出一种基于改进迭代协方差交叉和分布式粒子滤波器的说话人跟踪方法。该方法首先在各个节点应用粒子滤波器完成非线性滤波,获得局部状态后验概率的权值粒子表示,得到说话人位置的局部估计。然后,通过选取不同的代价函数,提出一种改进迭代协方差交叉数据融合算法,并用于各节点局部后验概率的分布式信息融合,得到全局一致的说话人状态估计,完成说话人位置的有效跟踪。实验结果表明,该方法在不同房间混响和背景噪声情况下,均能够实现对说话人运动轨迹的平滑跟踪,且无需已知网络中节点数和节点间相关性。(3)针对非高斯脉冲噪声环境下说话人跟踪问题,提出一种基于广义相关熵函数和分布式粒子滤波器的说话人跟踪方法。首先,在分布式麦克风网络的每个节点,利用广义相关熵函数对混有非高斯脉冲噪声的语音信号进行时间延迟估计,将其作为局部观测。然后,在各个节点运行粒子滤波器完成非线性滤波,并基于节点的观测和多假设似然模型计算局部粒子权值,进而得到说话人状态的局部估计。最后,应用平均一致性算法来融合各节点的粒子权值,在网络中得到说话人状态的全局估计,实现说话人位置的有效跟踪。实验结果表明,该方法在非高斯脉冲噪声环境下能有效地跟踪说话人,且对室内混响具有一定的鲁棒性。
其他文献
在世界各国的交流和当代艺术的发展下,中国的传统乐器——古筝,以其高音嘹亮、低音沉重、声调厚重而著称于世。因此,作为这样一种具有独特魅力的传统古典乐器,古筝受到许多杰出作曲者的青睐,它丰富的音乐表现力和可塑性是其获得广泛应用和创作的必要条件。《唳》是一首由古筝和钢琴共同演绎的作品,首演于2022年5月29日,本人的毕业个人音乐会。《唳》是作者委托青年作曲家朱学思老师自2020年12月开始创作的一部新
汉语方言尚未形成统一完善的方言语音库的建立标准,导致数据库之间无法实现共享,限制了方言语音识别技术的研究工作,所以形成一套统一的建库标准迫在眉睫。本文通过对大连地区方言数据库技术的研究,形成方言语音数据库采集、存储、标注、数据库设计等标准,以期为其他地区方言提供示范和借鉴,为推动语音技术进步以及公安工作尽一些绵薄之力。
从“血”在疾病发生发展过程中的参与发展入手,初步论述“血”作为病因在五脏系统疾病的发生发展中所起的作用,并进一步提出在中医五脏疾病的治疗中,如何处理疾病与“血”作为病理因素的关系,以期为临床工作提供新的思路。
建盏出自福建的建窑,作为宋代著名的民窑之一,它所烧制的建盏,以黑釉瓷为主,以兔毫纹、油滴、曜变为代表釉色,在我国瓷坛上蔚为大观。建盏不仅是一项单纯的工艺,更是数千年来民族传统文化和审美观的物化象征,传统器物的设计文化是受其所处的文化语境所影响的,作为宋代传统器物的代表,建盏所包含的设计文化是在经济、技术、人文等因素的综合影响下产生的。建盏享誉海内外,不仅在中国陶瓷文化的长河中留下了浓墨重彩的一笔,
<正>现代机器人的研究始于20世纪中期。1954年美国戴沃尔最早提出了工业机器人的概念,医用机器人是其中的一种。美国、日本、法国等发达国家从20世纪90年代开始致力于研究医用外科机器人。2000年7月,美国食品和药物管理局正式批准Intuitive Surgical公司研发的达芬奇机器人手术系统应用于临床外科治疗。达芬奇机器人系统概述达芬奇机器人是目前最先进的机器人手术辅助系统,设计理念是通过使用
会议
总结贾英杰教授治疗胰腺癌经验。胰腺癌以其恶性度高、进展迅速为主要特点被冠以“癌中之王”之称。贾英杰教授创新性提出“黜浊培本”治癌法则,认为胰腺癌临床特性符合癌浊特性,其核心病机为本虚浊蕴、土壅木郁,治疗当以黜浊培本、运土达木为关键。每验临床,收效颇丰。
城市公园是城市生态系统文化服务(CES)的重要提供者,基于居民感知视角对其进行测度具有重要意义。文章运用参与式制图和半结构访谈方法获取游客对广州天河公园生态系统文化服务的感知数据,分析CES感知结果差异,探讨社会经济因素与景观特征因素对CES感知差异的影响。结果表明:受访者在天河公园感知的主要CES类型为娱乐/游憩、审美服务;娱乐/游憩、审美和健康等CES类型分布范围较广,文化遗产、生物多样性和不
卫生巾产品广告打破了长期以来公共话语中的月经禁忌,在一定程度上反映并影响着社会对月经以及女性的观念。然而在语言学领域,国内外学者对卫生巾广告的研究甚少。随着隐喻理论的拓展,广告语篇中的多模态隐喻成为近年来的研究热点。本研究聚焦卫生巾产品广告中关于月经、女性和卫生巾的多模态隐喻,选取新浪微博上2018年至2021年间由中国十大卫生巾品牌发布的播放量最高的11则卫生巾视频广告作为研究对象,通过运用La
英国与土耳其之间的交往由来已久。自伊丽莎白一世时期起,英国便开始关注其与奥斯曼帝国之间的商业贸易,随着经贸关系的发展,奥斯曼帝国在英帝国的对外战略中占据愈发重要的位置。此后,由于17世纪末奥斯曼帝国开始走向衰落,英法等国对其领土和资源展开争夺,引发“东方问题”,这一时期,英国出于维持力量平衡与既得利益的战略考量而实行维护奥斯曼帝国完整与独立的政策,这一政策持续到一战爆发。一战期间,英土为敌,战后,
海岛生态系统可货币化的文化服务主要体现在休闲娱乐服务和景观价值。采用分区旅行费用法评估海岛已开发旅游资源区的休闲娱乐服务价值,基于相同等级旅游资源的价值等量化假设,构建了海岛尚未开发旅游资源区的景观价值评估方法,以位于渤海海峡的长岛为例进行评估。结果表明:(1)2019年长岛海岛文化服务价值为860.83亿元,平均分布密度为1.62亿元/km~2,其中休闲娱乐服务价值占28.23%,景观价值占71