基于互信息置信度的网格连续汉语语音检索

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户:qunli19890523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前生活中涌现的海量语音数据,人们对语音检索技术准确度的要求越来越高。主要研究了汉语连续语音检索任务中,基于转换音节网格的研究方法。针对语音检索系统中置信度计算的问题,提出了一种基于音节间互信息的置信度计算方法,并将其用于网格结构的语音检索系统中。该方法能够有效地利用上下文之间的互信息量,从而更准确、合理地描述汉语语言模型。实验结果表明,用提出的方法建立转换音节网格来进行语音检索,其检出率(FOM)比后验概率法和N-best法有较大幅度的提高。得到的汉语语音检索系统其FOM最高可以达到83.7%。
其他文献
压缩传感(compressed sensing或compressive sampling,CS)理论一出现便受到国际上的广泛关注,它打破了经典采样模式,通过随机采样少量点即可精确或以很高的概率恢复原始信号。利用这一特点,提出了一种波达方向(direction of arrival,DOA)估计的新方法,相比于传统DOA估计,只需少量采样点同时达到方向的精确估计,计算机仿真验证了方法的可行性。
针对更实际的异构集群计算环境,充分考虑处理机具有不同的计算速度、通信能力和存储容量的特性,通过允许计算和通信操作重叠执行,采取多次并行分配计算任务的方法,设计一种可分负载多轮调度算法。实验结果表明,该算法不但能获得与均匀多轮调度(UMR)算法相当的渐近最优调度时间长度,并且能够处理更大规模的应用负载,实用性更强。
提出了一种有效的从三视角2.5维人脸图像到完整三维人脸模型的融合方法。首先用ICP(迭代最近点)方法对三视角人脸图像上手动选取的特征区域进行粗配准,然后用一种调整能量最优方法进行精确配准,最终合成完整的三维人脸模型。通过对融合结果进行相似度测量,实验说明了方法的有效性和优越性。
通过引入模拟退火算法来保证PSO的全局收敛性,在群体最优信息陷入停滞时引入位置逃逸机制保持前期搜索速度快的特性。仿真结果表明本算法不但具有好的全局收敛性,而且有好的收敛速度。
针对企业应用系统数据密集的特点,通过深入分析面向服务的体系结构下的流程模型、数据访问构件与数据模型之间的关联关系,提出一个用于集成流程模型与数据模型的关联模型。该模型由流程数据映射关系、数据访问流两部分组成。不仅可以用于数据访问构件的自动生成和数据模型的优化,而且可用于维护流程模型与数据模型之间的一致性。