动态贝叶斯网络在多模态说话人鉴别上的研究

来源 :中国科协第2届优秀博士生学术年会 | 被引量 : 0次 | 上传用户:guizhong1121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
身份鉴别所需要的高度准确性和鲁棒性往往很难通过使用单模态的生物证人方法来达到.本文提出了一种基于动态贝叶斯网络的融合框架,将声纹信息与人脸信息在特征层进行融合,从而实现多模态的说话人识别.在多模态数据库上进行的说话人鉴别实验亦显示DBN在对时序数据的融合上具有优越的性能。
其他文献
医学英语属于ESP的研究范畴。如何提高医学生的专业英语应用能力是医学院校所普遍面临的一个现实问题。本研究通过对多年医学英语教学实践及其成效的凝练和总结,旨在构建基于
软件流水是开发循环程序指令级并行性的重要调度技术,其有效性受到2方面的限制:一方面软件流水的开销抵消了它的性能;另一方面,过高的寄存器压力限制了它的应用.本文分析了软
查询裁剪是语义缓存的一个关键问题,但是现有的查询裁剪算法在时空效率和裁剪结果的复杂度两个方面存在很大的局限性,这在很大程度上限制了语义缓存的实用性.为了克服这些缺
会议
在文献[1]和[2]的基础上,本文提出了结构模糊优化的两相法,第一相用水平截集法求出模糊解,第二相用限界搜索法在模糊解中确定模糊判决隶属函数为最大的清晰解,并附有若干计算
基音周期变换是语音转换的一项核心内容,也是实现难点,高质量的基音周期变换也是得到高质量文-语转换的保证.提出一种有效的基于频域基音周期变换方法,在分析阶段中的频谱包
摄像机运动估计的应用比较广,如视频编码(MPEG4sprite编码)、体育视频注释、全景图的生成和对象跟踪等领域.以前的工作主要集中在非压缩域进行光流分析,但是解码和分析时间太
会议
视频数据在网络信道中传输,常因误码和丢包造成图像质量的严重下降.针对这种情况,提出了一种基于多相下采样的多描述视频编码算法来增强码流的容错能力,将输入图像分解为不同
会议
为了解决虹膜识别技术中有效、快速地定位虹膜图像,针对传统虹膜定位算法的局限性,提出了一种快速多尺度虹膜定位算法.该算法根据瞳孔、虹膜和巩膜的区域特征,应用多尺度策略
会议
InternetQoS(服务质量)评估是多学科领域的研究问题,本文从博弈理论的视角,基于MNL模型(多项罗吉特模型)提出了综合考虑服务质量指标和价格因素的InternetQoS评估机制.采用MN
本文提出了一种用于分割彩色图像的多尺度形态学算法.首先基于张量梯度用彩色分水岭算法得到初始分割结果,即局部水平集连通区域.然后构造初始连通区域间的RAG和NNG用于后续
会议