基于最小二乘法和高斯混合模型的语音转歌声算法

来源 :复旦学报(自然科学版) | 被引量 : 0次 | 上传用户:aiyis88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计了一种语音转歌声的合成器.在给定一段朗读的歌词语音文件和乐谱的信息条件下,合成器系统按照传递函数调整说话人语音的3个声学参数:基频、语音时长和频谱包络.为了构造传递函数,本文使用机器学习的方法研究了歌声的基频和频谱包络.系统选择最小二乘法去学习歌声基频中颤音的参数,用来生成歌声带有颤音的基频;利用高斯混合模型(Gaussian Mixture Model,GMM)学习歌声频谱包络和说话人频谱包络的映射关系,将说话声音的频谱包络转换为音乐带有特定共振峰的频谱包络;根据节拍信息来修改说话语音时长.最终得到
其他文献
20世纪的两次世界大战造成了理性的解体和人性的迷惘,物质文明的迅速发展带来了人的异化和后现代主义的泛滥,个体的人作为物质存在的痕迹压倒了精神自我。在当代,传统的以“政治
急慢性咽喉炎是临床常见病,笔者从2001年至今,以自拟清咽灵治疗210例,并与西瓜霜含片治疗的50例作对照观察,现报道如下:
张艺谋和重庆有两手联系,左手的《十面埋伏》捧红了永川茶山竹海,右手的《满城尽带黄金甲》让武隆家喻户晓。然而,当我市周边的武隆、武陵山、金佛山等景区如火如荼地发展之时,永
报纸
进入21世纪以来,世界上许多国家都把大力发展科技和教育作为推动国家发展的重要策略,特别是利用计算机网络这一先进手段构建远程教育,进一步普及教育,提高国民素质及倡导继续学习
在理性精神的再生产过程中,尽管充满思辨色彩的先验批判不是最直接的,但作为一种原理却无疑是最根本的.如果这个深层结构中的诸问题不能得到很好的解决,那么其他一切的经验批
气象灾害是严重威胁国家安全和人民生命生产的自然灾害。一次灾害所造成的损失可对灾区的社会经济产生致命性的打击。气象服务工作水平的提高,是减灾、防灾的有效手段,而提升
静脉输液疗法作为兽医临床最重要的治疗方法之一而常在临床上应用,但是过量的输液会导致肺水肿的发生,特别是心肺功能不全的病例.本实验以临床上患有肺炎的病例(4例),在按常
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield