基于音素分类的汉语语声转换算法

来源 :南京邮电大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wang8327501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。
其他文献
针对无线射频识别系统应用中标签碰撞问题,在ALOHA算法基础上提出层次优先级控制的RFID防碰撞算法,增加标签层组信息以调整标签响应次序。算法综合考虑标签查询次数、传输时延整体能耗及吞吐率等性能指标,仿真分析表明,该算法较DFSA防碰撞算法有效提高了系统吞吐率,较QT在传输时延一定增加的情况下减少了查询次数,表现出良好的应用性能及可扩充性。
2015年5月17日是第47届“世界电信和信息社会日”,也是国际电信联盟成立150周年纪念日。为了庆祝这个重要日子,由中国通信学会、江苏省通信管理局、南京邮电大学联合主办的“20
压缩感知技术是目前信号处理领域的研究热点.文中针对压缩感知技术实际应用于语音领域时压缩率不高的问题做了研究.首先介绍了压缩感知技术的理论,接着提出了适合建模的观测
给出了线性方程组当A为一般方阵时解的表达式和迭代解法,并给出了它在等式约束二次极值问题中的一个应用。
针对异构网络的特性和用户无缝连接的需求,研究了UMTS和WLAN融合架构下移动终端移入WLAN时的切换必要性和移出WLAN时切换时刻的合理性。在此基础上,综合考虑终端和网络的上下文
移动模型对机会网络路由协议的研究起着非常重要的作用,因为几乎没有可以用于性能评估的大型真实网络环境。不同的移动模型使得节点的运动方式各不相同,导致网络拓扑有很大变
基于两路人体心声信号的专用检测平台,提出了一种针对双声道心音信号的欠定盲分离方法。首先对数据点进行频域聚类计算,利用观测信号中稀疏信号所表现出的特征对源信号个数进
基于传输线理论与共面波导不连续性理论,设计出求解平面与弯曲状态下倒置变换器归一化耦合系数的算法,并对高低阻抗十字K变换器进行求解。结果显示,在低频段倒置变换器的性能
通过分析大规模传感器网络中数据传输的特点,给出了一种数据安全传输模型,构建了一种支持网内处理的安全传输架构,并对此安全架构涉及的密钥管理、隐私保护和认证等关键技术
宏蜂窝和家庭基站(Femtocell)之间组成的双层网络中,由于共享频谱资源,因此增加了相互之间的干扰,从而减小了系统容量.文中针对双层网络之间的干扰,通过将认知无线电技术引入Fe