【摘 要】
:
在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘
【机 构】
:
中国科学院大学,中国科学院电子学研究所传感技术国家重点实验室,清华大学电子工程系清华信息科学与技术国家实验室
【基金项目】
:
国家自然科学基金资助项目(61273268,61370034,61403224)
论文部分内容阅读
在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究了在特征空间中对说话人进行建模的技术,提取出能有效反映说话人和信道信息的身份认证矢量(I-vector);最后将上述研究结合构建了基于I-vector特征的LSTM递归神经网络系统。在Open KWS 2013标准数据集上进行实验,结果表明该技术相比于深度神经网络基线系统有相对10
其他文献
1999年是市工商行政管理实行体制改革后的第一年, 在这新的一年里,全市各级工商行政管理机关如何抓住体制改革的有利时机,以饱满的精神状态,把握大局,强化职能,努力开创首都
研究了事件触发机制下具有固定和切换拓扑结构的多智能体网络的平均一致性问题。为了有效降低多智能体一致性控制协议的更新次数,提出了仅依赖于各智能体及其邻居节点信息的分布式事件触发机制;为了使多智能体网络渐近收敛至初始平均状态,提出了基于事件触发机制的多智能体平均一致性协议;然后,建立了事件触发机制下的闭环系统模型,并分别获得了固定和切换拓扑结构下多智能体网络平均一致收敛的充分条件。仿真表明,基于事件触
针对传统认知无线电网络(CRN)的频谱感知策略没有考虑噪声不确定性问题,提出一种基于噪声功率估计自适应阈值和OR-决策规则的频谱感知策略。将各接收器数据构建成一个数据矩阵,并计算矩阵的协方差矩阵;计算协方差矩阵的特征值,并根据特征值的均值来获得噪声的最大似然估计;根据估计的噪声和能量信号的检验统计量来确定决策阈值;各节点根据决策阈值作出局部决策并上传到融合中心(FC),FC利用OR-决策规则作出最
通过定义类别聚类密度、类别复杂度以及类别清晰度三个指标,从语料库信息度量的角度研究多种代表性的中文分词方法在隐含概率主题模型LDA下对文本分类性能的影响,定量、定性地分析不同分词方法在网页和学术文献等不同类型文本的语料上进行分类的适用性及影响分类性能的原因。结果表明:三项指标可以有效指明分词方法对语料在分类时产生的影响,Ik Analyzer和ICTCLAS分词法分别受类别复杂度和类别聚类密度的影
为从更多角度全面地处理数值型信息系统,提出了基于多阈值的变精度邻域多粒度粗糙决策分析方法。首先,分析了双重粒化准则下邻域半径选取的局限性,针对多属性特征值给出了新的多阈值邻域半径计算方法;然后,借鉴变精度粗糙集在降低噪声数据干扰方面的优势,获取更精确的粗糙近似,并对其相关性质进行了证明。实例分析表明,新模型能有效地提高对象的分类精度和分类质量。
基于词袋的主题模型其最终主题表示存在着表意不清、可读性差等问题,为解决此问题,提出将事件作为文档和主题描述的基本元素进行主题建模。鉴于事件的稀疏性,采用基于Biterm的主题模型,并在主题推断时结合generalized Pólya urn(GPU)模型加入事件间关联性的先验知识进行指导监督,从共现和语义两个层面削弱了事件稀疏性对主题生成的负作用。实验结果表明,该算法得到的主题可解释性较好且聚类效
为了解决推荐算法中用户标签稀疏、推荐准确度不高的问题,提出了一种基于用户标签的微博推荐算法。利用TextRank排序方法提取用户发布微博中的关键词,并对该关键词进行扩展,将其作为表示用户兴趣的标签;再根据微博的效应函数和生命周期形成待推荐的微博列表,计算用户标签及其同义词在待推荐微博列表中出现的次数,将出现次数较多的TOP-k条微博推荐给用户。通过实验验证,该算法能够有效地解决用户标签的稀疏性问题
本体匹配旨在识别异构本体中存在语义关联的实体,并建立它们之间的匹配关系,它对于消除本体异构、实现本体集成和数据融合等具有重要作用。形式化定义了语义Web中的本体匹配问题,并从本体匹配方法、本体匹配挑战和本体匹配原型系统三个方面调研了最新研究进展,旨在为进一步研究指明方向。
针对现有固定、无差别采集策略在变压器数据采集中造成的耗时长、冗余信息量大,且难以满足特定的数据可用性需求等问题,提出一种基于柔性策略的变压器智能感知数据采集方法。首先以四象限图方法划分各类数据采集优先级并制定不同采集方案。然后针对实时数据采集,提出柔性采集策略,考虑变压器运行中瞬时干扰与负荷变化等特殊情况,以双重判断量化数据波动程度,根据应激式调整方案,采用动态比例尺方法自主调整数据采集间隔,以实
脑血管病在老年人中发病率、致残率及死亡率均非常高,要预防老年人脑血管病的发生,就必须重视对脑血管病危险因素的研究.高血压、高脂血症均是脑血管病的危险因素,尤其高血压