论文部分内容阅读
随着多媒体设备的日益普及和数据存储、互联网等技术的飞速发展,多媒体数据已经成为人们获取与传播信息的主要媒介。面对海量的多媒体数据,如何保证用户的数据安全,如何在数据安全的条件下准确、快速地从海量数据中检索到所需内容等,一直是多媒体检索研究领域的热点问题。论文以基于内容的密文语音检索技术为研究出发点,对语音加密方法、高效的语音特征提取、语音分类、检索索引结构以及检索算法等关键技术开展了研究。主要研究内容如下:1.针对现有方法语音特征提取效率低、构造的感知哈希方案鲁棒性和区分性较差,以及检索准确度低的问题,提出了一种基于频带方差的高效密文语音检索算法。该算法首先对语音进行预处理,计算语音的频带方差作为语音特征构造哈希序列;然后对语音通过Logistic混沌置乱加密;最后对查询语音提取哈希序列,采用汉明距离算法进行匹配检索。实验结果表明,该算法构造的哈希序列具有较好的区分性和鲁棒性,并有效地提升了检索性能。2.针对传统的遍历型匹配检索算法存在的缺陷,以及为了实现海量的密文语音检索,提出了一种基于IFFT变换和测量矩阵的高效密文语音检索算法。首先结合IFFT变换和测量矩阵构造语音感知哈希序列,并对语音进行Henon混沌置乱加密。然后将语音分类,通过行程长度压缩技术对生成的哈希序列进行压缩,并上传到云端的系统哈希索引表。检索时,通过汉明距离算法进行匹配检索。实验结果表明,该算法感知哈希方案的鲁棒性、区分性以及特征提取效率优于现有方法,具备很好的查全率和查准率,且检索效率高效,检索精度准确。3.为了满足云环境下密文语音数据的高效、安全检索,以及感知哈希方案鲁棒性和区分性的要求,提出了一种基于Chirp-Z变换和感知哈希二次特征提取的密文语音检索算法。该算法首先对语音预处理后进行Chirp-Z变换,通过伪随机序列进行筛选后作为语音特征构造哈希序列,并对原始语音通过基于m序列的加密方式加密;然后通过二次特征提取将每条语音感知哈希序列唯一地映射为十进制数,并利用k-means聚类算法对语音进行均匀分类,构造系统哈希索引表。最后,对查询语音通过去噪处理后,并通过汉明距离算法进行匹配检索。实验结果表明,该算法极大地压缩了语音特征的信息容量,明显地提升了检索效率,且对带噪语音的检索效果良好。