多变量体数据的压缩技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:syhappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着移动计算和传感器设备的迅速发展,高维度多变量数据日益增多,例如互联网企业巨头阿里巴巴专注于电子商务多年,积累了海量的文本、视频类高维多变量数据,蕴含着巨大的商业价值。数据压缩技术是合理分析这些海量数据的关键一步,通过压缩可以去掉大量的冗余信息,以减小数据挖掘、可视化分析等科研任务的压力。但是传统的单一变量数据压缩技术无法处理这类海量数据,针对高维度多变量大规模数据集的压缩技术研究又很少,目前所存在压缩算法也只是扩展传统的单变量分析方法。因此,针对于高维度多变量数据的压缩技术研究具有重大的意义。本文分析了多变量体数据多个变量之间的内在关系,提出了两种可行的压缩方法,实验结果均表明了本文提出的压缩方法的有效性。在第三章中,本文提出了基于小波变换的多变量体数据压缩方法。主要利用小波变换在时频域的局部化特性以及与多分辨率分析完美结合的优点。我们通过彩色空间转换(RGB到YCbCr)预处理彩色多变量体数据,然后依据不同的权重值对三个颜色分量不均衡采样,再根据颜色分量的重要性分别选择小波变换和离散余弦变换分解数据,最后由阈值量化去掉冗余系数,实现对多变量体数据的压缩。考虑到本文第三章提出的压缩方法在处理的数据类型上的局限性,第四章中,本文又提出了结合了机器学习相关理论的压缩方法。考虑到多变量体数据的流行结构,通过流行方差最小化准则迭代求出体数据中最具代表性的体素的特征向量集合,压缩的数据是特征向量集合和MDS对原始体数据降维后结果,最后利用半监督学习算法在这些代表特征的基础上学习一个预测模型,用来重构体数据中的多个变量值。
其他文献
随着云计算的迅速发展,越来越多的用户开始使用云计算平台的服务随着用户数据的逐渐增多,如何保证云计算平台资源能够安全高效的被用户所应用,也已经成为云计算平台安全研究方面
并行计算指在并行计算机上,将一个任务分解成多个子任务,然后将这些子任务分配给不同的处理器,每个处理器之间相互协同并行的执行子任务,从而达到加快任务求解速度,或者提高求解应
大数据应用系统发展如火如荼,从互联网、物联网获取数据,提炼成信息或知识服务于各类用户。网页、感知数据集、数据集、各类结构化数据、语义数据的查询搜索是所有应用系统的一
随着计算机图形图像处理技术的发展与成熟,开始出现了许多计算机辅助2D卡通动画制作的相关技术,这些技术大体可以分为两类:一类是在传统2D卡通动画的制作流程中,用计算机辅助某些
伴随计算机技术的发展,许多新思路、新技术不断介入传统信息管理领域,导致这些领域从数据的积聚到信息管理的形式等诸多方面发生了剧变。本文结合作者多年的具体的档案工作经验
由于生理信号在情感识别中的优势,基于生理信号的情感识别的研究成果已经在人机交互、教育、医疗护理等方面得到应用。用户依赖的情感识别系统已能达到令人满意的结果。然而,实
语义相似度是人工智能、信息检索、文本分类、机器翻译、词义排岐、自动问答和句法分析等领域的基本问题,有着广泛的应用,具有理论的研究价值和应用前景。词语相似度计算是句子
本文实现了用于增强现实的实时深度图像三维人体识别与遮挡处理算法ˋ使用单帧深度信息图像与深度信息视频流ˋ专门针对增强现实领域的突出问题ˋ提出了创新性的深度图像人体
随着现代化设备及武器装备的不断发展,其所含信息量也日趋庞大,而针对这一现象应运而生的IETM也在各行各业不断的普及,所以IETM如何按照人们需求不断发展,IETM使用者的工作效率如
随着电子科技技术和网络的迅猛发展,以及数据业务量的急剧增长,这就要求越来越高和越来越新的网络技术,由于电信号和现有传输介质的物理性质的局限性,传统网络技术潜力有限,光传输