人声输入与识别技术在数字化音乐创作中的实现与应用

被引量 : 1次 | 上传用户:dcf0124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数字化音乐随之大量增加,如何能够很好地融合人声输入和识别技术,从而转化为数字音乐可以极大地提高音乐制作的效率,同时保证音乐的品质和效果。本文主要对人声输入与识别技术在数字化音乐创作中的实现与应用进行了探讨,使用户只需对着麦克风哼唱一首乐曲的旋律片段,就可以生成数字化的音乐形式。本文首先以数字化音乐和语音识别技术的介绍为起始,进而介绍了多种音频格式各自的特点,根据MIDI文件在检索方面的优势,选择其作为数字化音乐创作的数据源。继而讲述了从MIDI音乐中提取音乐信息的方法,并成功地从多音轨MIDI文件中抽取出主旋律,提取出相应的音乐演奏信息。进一步对哼唱输入旋律的特征提取进行了详细介绍。分析了传统语音识别中利用短时能量和短时过零率特征进行语音端点检测的方法,结合哼唱音乐的特点,采用通过两阶段切分模式切分音符的方法即结合能量突出度指标、过零率及音高变化来切割音符,使性能有了大幅度的提升。通过对每个音符的处理,提取出整个哼唱旋律的音强、音长和相对音高特征以备人声输入与识别技术在数字化音乐创作中的实现。在旋律检索部分,根据哼唱旋律的特殊性,使用精确匹配算法与模糊匹配算法相结合的手段,最终设计出了人声输入与识别技术在数字化音乐创作中的实现与应用系统。
其他文献
归因风格指个体在长期的归因过程中形成的比较稳定的归因倾向。根据塞林格曼对归因风格的定义,可将归因风格划分为乐观归因风格与悲观归因风格。大学生对遇到的事会有意或无
铜是国民经济发展的重要原料,就目前我国经济发展的现状以及各预测机构的预测数据来分析,短时期内对铜的需求量不会减少,提高国内铜供矿能力是非常必要的。西藏是我国铜储量
新疆力争与全国同步实现全面经济增长社会,必将完成跨越式发展和长治久安两大历史性任务。目前,新疆正面临着继续实施西部大开发战略及全国十九省市对口援疆产业集群转移的机遇
研究库存控制方法的根本目的是减少资源浪费,合理利用有限资源,降低物流的总成本,使企业在经营过程中获得更多的利润,而目前我国的易腐品在流通中的损耗占销售额的比重非常大
随着宽带技术的发展和宽带资费的下降,以及电信融合套餐的大力推广,宽带市场已经从增量发展模式进入存量发展模式,在存量模式的情况下,减少客户流失,延长宽带客户产品生命周期,防止
目前,艺术语言正面临滥用和重复度越来越高的问题,这些问题使艺术表现落入俗套,阻碍了艺术的发展,窒息了艺术的创造.时代的发展要求寻找真正契合当下及未来的开放性和生成性
20世纪50年代的香港左派电影批评主要凭据《长城画报》的左派期刊影评和《大公报》、《文汇报》等左派报章影评运作,后者是批评主阵地。查良镛等批评者引介巴拉兹的电影理论
苏联犹太农业垦殖运动是20世纪20、30年代苏联犹太人在苏联政府的支持下和外国犹太慈善组织的帮助下在克里米亚、南乌克兰和远东的比罗比詹从事农业垦殖的运动。苏联犹太农业
在幼儿语言课堂教学中,通过对传统教学班和多媒体教学班教学效果进行比较研究,记录课堂教学过程中的幼儿注意力不集中次数、回答问题次数、回答问题效果以及课后复述学习内容
长期以来,人们总是把亲子关系和亲子互动看作是针对低幼儿童的家庭教育,而忽略了处于青春期的中学生的亲子教育。这一时期的青少年一方面经历着生理上的变化,另一方面承受着