搜索筛选:
搜索耗时0.9747秒,为你在为你在102,285,761篇论文里面共找到 23 篇相符的论文内容
类      型:
[学位论文] 作者:欧智坚, 来源:清华大学 年份:2003
经典HMM理论用于语音识别有一些缺点,尤其是“状态输出独立假设”忽略了语音特征间的时间依存性,阻碍了识别性能的进一步提高。时间依存性表现为由于发声器官惯性所导致的相邻......
[期刊论文] 作者:叶楠,欧智坚, 来源:通信学报 年份:1999
本文提出了一种MPEG压缩域上的快速场景分割算法,该算法目前主要针对的是新闻节目。...
[期刊论文] 作者:罗骏,欧智坚,, 来源:通信学报 年份:2006
针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处......
[期刊论文] 作者:邓侃,欧智坚,, 来源:计算机应用研究 年份:2016
为了解决语音识别中深层神经网络的说话人与环境自适应问题,从语音信号中的说话人与环境因素的固有特点出发,提出了使用长时特征的自适应方案。基于高斯混合模型建立说话人—...
[期刊论文] 作者:周佳俊,欧智坚,, 来源:电讯技术 年份:2013
在基于神经网络的语音识别任务中,提出根据激励函数二阶导数优化网络预训练阶段中权值初始化的方法。利用激励函数的非线性区域和自变量呈高斯分布的特性,寻找权值分布的较优方......
[期刊论文] 作者:欧智坚,王作英, 来源:计算机工程与应用 年份:2001
尽管作为当前最为流行的语音识别模型,隐马尔可夫模型(HMM)由于采用了状态输出独立同分布假设,因此不能描述语音现象中固有的时间相关性,文章介绍了一个更为灵活的基于段长分布HMM......
[期刊论文] 作者:孟一鸣,欧智坚,, 来源:电讯技术 年份:2013
语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能...
[期刊论文] 作者:欧智坚,王作英, 来源:电子学报 年份:2003
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架-广义DDBHMM,提出了一...
[期刊论文] 作者:欧智坚,王作英, 来源:电子学报 年份:2002
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳。通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的...
[会议论文] 作者:欧智坚;王作英;, 来源:第六届全国人机语音通讯学术会议 年份:2001
尽管作为当前最为流行的语音识别模型,HMM由于采用了状态输出独立同分布假设,忽略了对语音现象中固有的时间相关性的描述.本文引入了一个更为灵活的语音描述统计框架——广义...
[期刊论文] 作者:郑晔,欧智坚,杨艇, 来源:数字通信世界 年份:2021
结合智慧广电监管的相关法律法规,介绍了以人工智能语音识别、自然语言理解技术为基础,针对普通话、闽南语等广播电视节目进行智能识别分析,高效准确的对广播电视中的非法内...
[期刊论文] 作者:孙怿,欧智坚,胡炜,, 来源:计算机应用与软件 年份:2008
提出一种通过兴奋解说检测进行体育比赛精彩片断提取的方法。该方法包括训练和检测两个阶段:在训练中,基于训练数据对兴奋语音和普通语音分别建立高斯混合模型GMM(Gaussian Mixture Model),构成初始的分类器;在集外检测中,首先使用最大后验方法MAP(Maximum A Po......
[期刊论文] 作者:郑晔,欧智坚,杨艇, 来源:广播与电视技术 年份:2020
本文提出运用一种高效学习的端到端语音识别技术解决闽南语语音识别难题,并分析探讨了闽南语语音识别在福建广播电视与视听新媒体节目智慧监管中的应用与展望。...
[期刊论文] 作者:罗骏,欧智坚,王作英, 来源:清华大学学报(自然科学版) 年份:2005
针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健...
[期刊论文] 作者:罗骏,欧智坚,王作英, 来源:清华大学学报(自然科学版) 年份:2004
本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最...
[期刊论文] 作者:罗骏,欧智坚,王作英, 来源:中文信息学报 年份:2004
自适应技术在近年来得到越来越多的重视,其中应用广泛的包括MAP、MLLR,该技术利用少量特定人数据就可以调整码本,快速地提升识别性能,它要求原始的码本有很好的说话人无关性....
[期刊论文] 作者:叶楠,欧智坚,郑志航, 来源:通信学报 年份:
本文提出了一种MPEG压缩域上的快速场景分割算法,该算法目前主要针对的是新闻节目。它采用了依次对MPEG码流中的Ⅰ帧间,然后P帧间,最后B帧间的场景分割进行定位的方法。在该算法的基础上可以快速地完成对MPEG码流的分割,并对每个场景提取Ⅰ帧作为关键帧,从而为新闻视频数据库的建立......
[会议论文] 作者:王晶莹;王作英;欧智坚;, 来源:第八届全国人机语音通讯学术会议(NCMMSC8) 年份:2005
本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充...
[会议论文] 作者:孙怿,欧智坚,孙甲松, 来源:2007年全国模式识别学术会议 年份:2007
本文提出了用于图模型精确推理的层次消息传递(HierarchicalMessage Passing,HMP)算法以及包含树(Containing Tree)算法,以解决传统连接树算法在存在约束包含和约束消除情况下无法充分利用图模型中的结构信息的问题。HMP算法采用递归结构,逐级挖掘图模型具有的条件......
[期刊论文] 作者:赵贤宇,欧智坚,王作英, 来源:清华大学学报(自然科学版) 年份:2005
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合.无监督聚类算法利用噪声模型之间的Kullback-Leibler距...
相关搜索: