一种音频片段检索系统的Java实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:zhao330300096
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频检索作为获取信息的重要手段之一,如何快速准确地从海量音频片段中获取所需内容成为音频检索发展的主要瓶颈。音频指纹技术的引入有效地解决了海量音频数据存储的容量问题,但在音频相似度上只能做到模糊匹配。因此,为了解决海量音频数据检索的精度与速度的矛盾,本文主要研究了音频特征的提取,设计了一种基于层次SVM多分类及模糊聚类的音频片段检索方法,并采用Java语言实现音频片段检索原型系统。本文设计实现的基于特征相似度的音频片段检索原型系统,实现了高速、有效的音频片段检索,具有良好的扩展性。本文实现在普通配置服务器设备存储的大规模音频样例数据源中,对未知信息音频片段进行相似音频检索,在保证检索准确率良好的同时,缩减了检索时间。论文实现的音频片段检索原型系统是一个实验性的检索平台,本文进行了大量的性能测试验证了其可用性和可靠性。本文首先探讨了音频特征向量的构成。其次通过对目前常用的音频分类方法作比较,设计了一种修正后的层次SVM多分类方法,将分类精度提高到90%以上,并能保持在实际应用中对未知数据的分类正确率。采用音频分类技术的目的是压缩检索范围,减少音频比对次数,以缩减检索时间。然后本文探讨了音频片段相似度的计算方法,实现了基于模糊聚类的一种音频片段检索系统。模糊聚类将单个音频片段庞大的特征数据矩阵聚类形成K个质心,使用这K个质心表征音频片段大幅缩减了音频特征数据复杂度,减少了音频相似度比对时间。最后根据测试结果对音频片段检索系统的发展进行了展望。
其他文献
目的探讨糖化血红蛋白变异性与2型糖尿病患者微量白蛋白尿的关系及糖化血红蛋白变异性的影响因素。方法回顾性选出于2015年10月到2017年12月定期到我院门诊就医的2型糖尿病病
背景卒中发作后,许多患者的情绪行为发生变化。大约三分之一的卒中幸存者受到卒中后抑郁(Post-stroke depression,PSD)的影响,PSD不仅明显延缓脑卒中患者的病程恢复和影响康复结局,甚至可增加脑卒中患者的死亡率,使其成为严重的社会和公共卫生问题。目前暂无针对PSD行之有效的诊断方法,PSD的诊断主要依靠相关细胞因子的检测以及抑郁量表的评定,其诊断效果往往不能令人满意,因此急需寻找
据《光明日报》(2007年4月12日)报道:“成都市某幼儿园一项调查显示:90%的孩子能说出“圣诞节”,只有10%知道“中秋节”,几乎没有人能说出“重阳节”和“端午节”;他们喜欢的玩具当中,
运城市拥有丰富的人文旅游资源及独特的自然景观,但目前旅游业的发展仍相对落后,运用SWOT法分析探讨了运城市旅游业发展的优势与劣势、机会与威胁,提出加快旅游业发展的形象驱动
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
4月底,生态环境部等五部委联合印发《关于推进实施钢铁行业超低排放的意见》(以下简称《意见》)。自去年《钢铁企业超低排放改造工作方案(征求意见稿)》发布近一年来,钢铁行
学位
国际能源价格波动和碳税政策都会对能源成本产生直接作用,从而对能源安全状况和减排效果产生影响。现有研究往往基于外部条件不变的假设分别探讨两者的影响效应。然而,国际能
尽管一个国家特有的经济制度取决于本国的历史、环境和社会的价值观,但世界各国经济制度大致可分为两类:市场经济和计划经济。韩国在市场经济模式下,经过30多年的快速发展,
在我们法律诊所小组关于女性在婚姻家庭生活现状的采访调查过程中,分析得出我国相关法律对女性离婚时的财产或财产性权益特别强调了保护原则,在具体实施中也成果显著,但同时
人教版第三学段教材每单元的精读课文后,编者都会安排一定量的略读课文。略读课文应怎样实施教学?不少教师常常感到困惑。他们有的没有准确把握略读课文与精读课文、自读课文