一个基于听觉特征的音频检索原型系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:alan_w76
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文设计了综合利用音频的感性特征和物理特征的基于内容的音频检索算法.对于一段音频信息,我们先要进行加窗处理,把音频信息分成一帧一帧的数据,我们选取了汉明窗函数.然后我们对每帧数据提取声学特征,我们综合使用了音频的感性特征和物理特征.通过计算这些特征的统计值形成特征向量;检索前必须有系统训练的过程,我们利用平均矢量量化的方法得到聚类参数集;特征匹配时将待检索的音频信息的特征向量与聚类信息比较,使待检索音频落入某一个类别;在相似度量中根据加权欧氏距离计算样本距离;在相关反馈中,使用了权值调整反馈算法,而且利用反馈记忆和反馈传播来最大限度利用相关反馈的信息.在所设计算法的基础之上,该文实现了一个基于内容的音频检索的原型系统,可以用来检索通用的音频信息.
其他文献
逻辑程序的稳定模型语义不能很好地用来描述数据库,知识库或者信念集上的约束,为此人们提出了一种新的机制—修正程序.其中的约束用修正规则表示.合法修正语义赋值给任何数据
在实际的图像处理问题中,图像的边缘图作为图像的一种基本特征,被经常应用到较高层次的特征描述、图像识别、图像分割、图像增强以及图像压缩等等的图像处理和分析技术中,从
该文采用COM组件技术,设计并部分实现了组件式GIS的数据访问接口和空间对象接口.目前市面上一般的组件GIS平台一般把数据访问放在服务器端,这样不仅导致了安装时必须在服务器
该文根据CHINANET(现中国网通CNC)骨干网三期扩容工程和云南连通骨干网网管中开发的路由监测与仿真系统及其相关的研究工作,实现了在拓扑图上对IS-IS,OSPF和BGP4的网络路由状
随着计算机技术在各个领域的快速发展,人们越来越倾向于使用电子数据处理信息,电子信息的安全问题显得越来越重要.该项课题在研究已有数据加密体系的基础上,为基于PC机的数据
该文首先通过对Web Service原理的阐述而展开,然后,将计算机界刚推出关于XML的两个重要安全协议纳入该文,加以详细、深入的分析.接着,介绍正趋于成熟的PKI系统理论,其中特别
该文分为两部分.第一部分主要研究量子搜索算法.重点介绍和分析了Grover的非结构化搜索算法.在此基础上提出Household变换在量子搜索算法设计中的独特作用,并从Household变换
移动代理系统被广泛的认为是有前途的分布式计算模型;然而,也面临着很多的挑战,主要是缺少应用软件、安全、结构和统一的标准,另外,以Jini技术为基础的Ubicomp成为了公认的动
该文在现有研究成果的基础上,从对复杂特征的分析入手,采用模块化的方法,借助Petri网设计了一种具有较强适应能力的复杂特征入侵检测模型.该模型将复杂特征按照选择、并发、
在计算机图形学和几何造型中,为了获得对三维世界的描述,实现曲面的重构是非常重要的.曲面的重构也即得到待构曲面上的散乱点群,对这些散乱点群进行曲面重构得到待构曲面的几