基于LSH距离的音频索引和检索系统

被引量 : 0次 | 上传用户:yvhtoss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的多媒体检索都面临着高维索引体系构建的问题,空间访问方法的索引存在“维度灾难”问题;度量访问方法的索引被应用得最多,它能够为系统建立高性能的索引数据库。HCT(Hierarchical Cellular Tree)是一种基于度量访问方法的动态生长的索引树,它提供了一种支持快速检索的数据组织方式,针对不同的数据对象,在应用HCT时要根据不同需求对索引片段的结构和距离计算公式进行设计。另外,现有的很多检索系统,对音频的检索并没有重视音频的时序信息,影响了检索结果的准确率。针对以上问题,本文设计了一种基于度量访问方法的HCT索引树的建立方法和检索方案,HCT索引树建立的主要时间开销在于特征向量的距离计算,本文通过LSH(Locality Sensitive Hashing)技术优化降低了该距离计算的时间成本,实验证明了该优化方法能做到快速检索和高准确率的统一。本文的主要工作如下:1、建立音频HCT索引。对音频进行静音分割,得到音频索引片段,提取片段相关特征参数构成特征向量,然后通过各维特征的均值和标准差把各维特征规整到均值为0,方差为1的分布中;构建音频HCT索引树的索引片段,使用欧式距离来描述两个索引片段之间的距离。2、采用LSH技术对HCT索引进行优化。针对高维特征向量的计算量大的问题,LSH技术把高维的特征向量映射到低维的整数空间,用更少的数据描述索引片段,片段之间距离的计算量得到很大程度的降低,从而使得检索时间得到很大程度的减少,索引建立和检索时间大约为优化前的五分之一。3、对输入的查询音频进行分段查询,本文提出一种基于综合评分的检索结果排序策略。分段的音频通过HCT快速检索得到候选索引片段集合,根据候选集合组成的时间序列,筛选出在时间上连续的片段组成候选目标结果,并对符合要求的目标结果进行评分来判断相关度,最终的目标结果按照相关度排序。该方法能很好适应查询音频时长不一的情况,TOP10平均检索命中率达到85%左右。4、完善多媒体查询系统的人机交互,提供友好的用户体验。检索系统基于B/S架构,支持本地上传示例和选择在线示例进行检索,支持检索目标自动定位播放,支持基于音频音效类型的视频内容浏览。
其他文献
摘要:随着经济的日益发展,工程建设活动愈加频繁,滑坡已成为最严重的自然灾害之一,严重威胁着人们的生命财产安全。本文通过搜集、统计和整理的方法获得所需数据,采用力学分析
<正>11月1-2日,作为国内首个粤港两地联手举办的赛道日,R+粤港赛道嘉年华在广东国际赛车场激情上演。本次赛道嘉年华由R+汽车性能用品、Vanhoo啡气、RaceChip电脑及香港改装
目的:采用RP-HPLC法测定银杏外种皮中黄酮苷含量。方法:采用Waters ODS C18柱(250mm×4.6mm);流动相:甲醇:0.4%磷酸溶液(60:40);检测波长:360nm;流速:1ml/min;柱温:27℃,以槲皮素、
本文基于结构方程模型构建了互联网金融消费忠诚度分析模型,并采用极大似然方法估计模型参数。研究结果表明,在直接影响互联网金融消费忠诚度的因素中,满意度比信任重要;在间
<正>证券市场影响股票表现的两大因素是:大众交易行为和主力交易行为。具体到了某一个股上,主力交易行为对个股中短期价格波动影响最大。个股出现有主力故意出手操纵股价之时
期刊
以常规粳稻武运粳24号和杂交稻甬优2640为材料,设置钵苗机插高产示范田,探明不同类型品种群体结构特征及其产量形成特点。研究结果表明,甬优2640秧苗素质较高,拷苗后发根力明
目的分析神经内科住院患者的临床特点,了解病种、年龄分布、用药情况等,更好地指导今后工作。方法对江苏连云港解放军149医院2012年1月1日至2012年12月31日住院的755例患者从
厌氧菌是一类需在氧张力极低条件下才能生存繁殖的细菌。此类细菌大量寄生于人的口腔粘膜、消化道、泌尿道、女性生殖道及皮肤等,厌氧菌感染往往是内源性的感染且多为混合感
现代工程建设生产,特别是大中型项目由于其生产周期长,涉及范围广,工种多而繁,工序常交叉,技术复杂,施工人员多,加之作业环境等影响,使得工程质量与安全成为了社会、政府、施
利用河北某铁尾矿和废石为原料制备了建筑外墙防火陶瓷保温材料。对铁尾矿和废石进行了ICP-AES分析、化学成分分析、X射线衍射物相分析、TG-DSC热分析和放射性检测。在此基础