搜索与欧智坚相关的论文

语音识别时间依存性模型

[学位论文] 作者：欧智坚, 来源：清华大学年份：2003

经典HMM理论用于语音识别有一些缺点，尤其是“状态输出独立假设”忽略了语音特征间的时间依存性，阻碍了识别性能的进一步提高。时间依存性表现为由于发声器官惯性所导致的相邻......

下载此文

一种MPEG压缩域上的快速场景分割算法

[期刊论文] 作者：叶楠,欧智坚, 来源：通信学报年份：1999

本文提出了一种ＭＰＥＧ压缩域上的快速场景分割算法，该算法目前主要针对的是新闻节目。...

下载此文

一种高效的语音关键词检索系统

[期刊论文] 作者：罗骏,欧智坚,, 来源：通信学报年份：2006

针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统，可以高效地从大量语音数据中检索出感兴趣的文本信息，从而达到为国家安全服务的目的。该系统分为预处......

下载此文

深层神经网络语音识别自适应方法研究

[期刊论文] 作者：邓侃,欧智坚,, 来源：计算机应用研究年份：2016

为了解决语音识别中深层神经网络的说话人与环境自适应问题,从语音信号中的说话人与环境因素的固有特点出发,提出了使用长时特征的自适应方案。基于高斯混合模型建立说话人—...

下载此文

深层神经网络预训练的改进初始化方法

[期刊论文] 作者：周佳俊,欧智坚,, 来源：电讯技术年份：2013

在基于神经网络的语音识别任务中，提出根据激励函数二阶导数优化网络预训练阶段中权值初始化的方法。利用激励函数的非线性区域和自变量呈高斯分布的特性，寻找权值分布的较优方......

下载此文

连续语音识别中利用帧间相关性的研究

[期刊论文] 作者：欧智坚,王作英, 来源：计算机工程与应用年份：2001

尽管作为当前最为流行的语音识别模型，隐马尔可夫模型（HMM）由于采用了状态输出独立同分布假设，因此不能描述语音现象中固有的时间相关性，文章介绍了一个更为灵活的基于段长分布HMM......

下载此文

改进的基于长时谱能量差异和基音比例的语音检测方法

[期刊论文] 作者：孟一鸣,欧智坚,, 来源：电讯技术年份：2013

语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能...

下载此文

汉语连续语音识别中多项式拟合语音轨迹模型的研究

[期刊论文] 作者：欧智坚,王作英, 来源：电子学报年份：2003

尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架-广义DDBHMM,提出了一...

下载此文

从线性预测HMM到一种新的语音识别的混合模型

[期刊论文] 作者：欧智坚,王作英, 来源：电子学报年份：2002

线性预测HMM（Linear Prediction HMM，LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设，但实用中识别性能并不佳。通过分析两种HMM的各自优劣，本文提出了一种新的语音识别的...

下载此文

一种基于DDBHMM的利用帧间相关性的混合模型

[会议论文] 作者：欧智坚;王作英;, 来源：第六届全国人机语音通讯学术会议年份：2001

尽管作为当前最为流行的语音识别模型,HMM由于采用了状态输出独立同分布假设,忽略了对语音现象中固有的时间相关性的描述.本文引入了一个更为灵活的语音描述统计框架——广义...

下载此文

福建省广播电视节目智能语音分析系统研究与应用

[期刊论文] 作者：郑晔,欧智坚,杨艇, 来源：数字通信世界年份：2021

结合智慧广电监管的相关法律法规,介绍了以人工智能语音识别、自然语言理解技术为基础,针对普通话、闽南语等广播电视节目进行智能识别分析,高效准确的对广播电视中的非法内...

下载此文

利用无监督自适应的兴奋解说检测和体育比赛精彩片断提取

[期刊论文] 作者：孙怿,欧智坚,胡炜,, 来源：计算机应用与软件年份：2008

提出一种通过兴奋解说检测进行体育比赛精彩片断提取的方法。该方法包括训练和检测两个阶段:在训练中,基于训练数据对兴奋语音和普通语音分别建立高斯混合模型GMM(Gaussian Mixture Model),构成初始的分类器;在集外检测中,首先使用最大后验方法MAP(Maximum A Po......

下载此文

智能语音识别技术在闽南语广播电视节目智慧监管中的应用研究

[期刊论文] 作者：郑晔,欧智坚,杨艇, 来源：广播与电视技术年份：2020

本文提出运用一种高效学习的端到端语音识别技术解决闽南语语音识别难题,并分析探讨了闽南语语音识别在福建广播电视与视听新媒体节目智慧监管中的应用与展望。...

下载此文

基于拼音图的两阶段关键词检索系统

[期刊论文] 作者：罗骏,欧智坚,王作英, 来源：清华大学学报（自然科学版）年份：2005

针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健...

下载此文

基于相关子空间本征音分析的MAP快速自适应

[期刊论文] 作者：罗骏,欧智坚,王作英, 来源：清华大学学报(自然科学版) 年份：2004

本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最...

下载此文

说话人自适应训练方法在连续语音识别中的应用

[期刊论文] 作者：罗骏,欧智坚,王作英, 来源：中文信息学报年份：2004

自适应技术在近年来得到越来越多的重视,其中应用广泛的包括MAP、MLLR,该技术利用少量特定人数据就可以调整码本,快速地提升识别性能,它要求原始的码本有很好的说话人无关性....

下载此文

一种MPEG压缩域上的快速场景分割算法

[期刊论文] 作者：叶楠,欧智坚,郑志航, 来源：通信学报年份：

本文提出了一种ＭＰＥＧ压缩域上的快速场景分割算法，该算法目前主要针对的是新闻节目。它采用了依次对ＭＰＥＧ码流中的Ⅰ帧间，然后Ｐ帧间，最后Ｂ帧间的场景分割进行定位的方法。在该算法的基础上可以快速地完成对ＭＰＥＧ码流的分割，并对每个场景提取Ⅰ帧作为关键帧，从而为新闻视频数据库的建立......

下载此文

最大似然线性回归说话人自适应算法在LPHMM中的应用

[会议论文] 作者：王晶莹;王作英;欧智坚;, 来源：第八届全国人机语音通讯学术会议(NCMMSC8) 年份：2005

本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充...

下载此文

图模型推理的层次消息传递算法

[会议论文] 作者：孙怿,欧智坚,孙甲松, 来源：2007年全国模式识别学术会议年份：2007

本文提出了用于图模型精确推理的层次消息传递(HierarchicalMessage Passing，HMP)算法以及包含树(Containing Tree)算法，以解决传统连接树算法在存在约束包含和约束消除情况下无法充分利用图模型中的结构信息的问题。HMP算法采用递归结构，逐级挖掘图模型具有的条件......

下载此文

基于VTS的稳健语音识别

[期刊论文] 作者：赵贤宇,欧智坚,王作英, 来源：清华大学学报(自然科学版) 年份：2005

为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合.无监督聚类算法利用噪声模型之间的Kullback-Leibler距...

下载此文

看过本文同时还关注