针对若干数据挖掘问题的量子算法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:yuhua_ly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机科学和统计学的交叉子领域,数据挖掘旨在从大量数据中挖掘出其中隐藏的重要信息,是知识发现的关键步骤。此外,数据挖掘可用于挖掘密码系统中明密文隐藏的模式以分析其安全性,因此也是密码分析的一个重要工具。然而,随着信息技术的高速发展,全球数据总量每年指数增长,这使得经典数据挖掘算法未来处理大数据时将面临计算性能的巨大挑战。量子计算利用量子力学基本原理(如量子叠加和量子纠缠)实现计算任务,在解决某些特定问题上相比经典计算具有显著的速度优势。例如,Shor量子算法能够快速分解大数因子,相对经典算法具有指数加速,对被广泛应用的RSA密码系统安全构成严重威胁。近年来,量子计算已被应用到数据挖掘领域,且解决多种数据挖掘问题的高效量子算法已被提出。然而,量子数据挖掘算法研究仍处于初始阶段,许多数据挖掘问题尚无高效量子算法解决。本文对此展开进一步研究,针对若干重要的数据挖掘问题,提出相比经典算法具有显著加速的量子算法。这些量子数据挖掘算法也将为密码分析量子算法研究提供重要参考。具体来说,本文研究包括以下四个方面。1、针对关联规则挖掘的核心任务——从候选项集中找出频繁项集,提出一个量子关联规则挖掘算法。具体来说,对于Mc(k)个候选k项集中存在Mf(k)个频繁k项集(Mf(k)≤Mc(l))的情况,所提算法通过并行幅度估计和幅度放大能够有效地挖掘出这些频繁k项集并估计它们的支持度。该算法的复杂度为O(k(?),其中ε为支持度估计误差。与复杂度为O(kMk)/ε2)的经典算法相比,所提量子算法当Mf(k)<<Mc(k)时关于ε和Mc(k)均有平方加速,而当Mf(k)≈Mc(k)时仅关于ε具有平方加速。2、基于最著名的主成分分析数据降维算法,提出一个量子数据降维算法。该算法以量子并行的方式将一个高维数据集投影到低维空间从而获得相应的低维数据集。与经典算法相比,当低维空间维数d和原高维空间维数满足d=O(polylog D)时该算法具有指数加速效果。此外,该算法能够被用于两个重要的量子机器学习算法:量子支持向量机和量子线性冋归预测,使其摆脱“数据灾难”。3、针对岭回归——一种通过对一般线性回归引入规范化以分析多重共线性数据的线性回归方法,提出一个量子岭回归算法。通过设计并行哈密顿量模拟技术,该算法给出一个能高效估计岭回归预测性能的量子K重交叉验证方法。整个算法首先利用量子K重交叉验证方法确定一个好的岭回归参数使岭回归在该参数下具有很好的预测性能,然后产生一个幅度编码了该岭回归参数下岭回归最优拟合参数的量子态,且该量子态可用于预测新数据。由于使用稠密哈密顿量模拟技术作为基础,该算法能够处理稠密数据矩阵。相对经典算法,当数据矩阵条件数k与其维数N满足k=O(polylogN)时,该算法具有指数加速效果。当k大到使数据矩阵满秩或者近似满秩时,具有多项式加速效果。4、基于近年提出的一个知名经典视觉追踪算法,提出一个量子视觉追踪算法。该算法包括两个阶段:训练和探测。在训练阶段,为了区分目标和背景,训练一个以量子态形式呈现的岭回归分类器,其中岭回归最佳拟合参数被编码到该量子态幅度上。在探测阶段,利用该分类器产生一个幅度编码了所有候选图像块的岭回归响应的量子态。与经典算法相比,当训练阶段、探测阶段图像数据矩阵的条件数KX、KZ和图像数据矩阵维数n满足kX,kZ=(O(polylogn)时,该算法具有指数加速优势。此外,该算法可用于高效实现两个与视觉追踪相关的任务:目标消失探测和运动行为匹配。该算法展示了量子计算在解决计算机视觉问题方面的能力。
其他文献
<正>才气焕发的英国画家约翰·埃弗雷特·米莱斯爵士(1829—1896)是拉斐尔前派社的创始人。约翰·埃弗雷特·米莱斯出生于南安普敦。他的父母看出他早熟的天资,在他九岁时便
区域间合作现象已经成为当前经济生活中的普遍现象,它在区域经济发展中发挥着越来越重要的作用。但在多数的区域合作当中,常常因为合作双方从“合作”中得到的收益存在差异,
邓小平是一位伟大的无产阶级革命家、政治家和思想家,是改革开放的总设计师,在其统一战线思想中包涵着丰富而深刻的文化统战思想。邓小平文化统一战线思想,就是在不同的历史时期
<正> 这次实验的目的在于评价某些选定的方法,这些方法是用来测定生物样品所含非挥发性氟化物的。 材料和方法 在我们的实验中,溶液中氟含量的测定所用标准液,敏感度较高,即
近年来,CCD相机逐步应用于近景摄影测量、低空摄影测量.影响摄影测量成果精度的重要因素之一是相机的技术参数,因此相机技术参数的检校是保证成果质量能否满足精度要求的关键
干部选拔任用部门化问题助长了部门优越感,阻隔优秀人才进入相关职位,降低人岗匹配度。所以,打破干部选拔任用部门化具有重要意义。基于利益分化视角,分析上下级部门、同级部
市场中同类企业相互合作,地域上逐渐集中在一起;处于供应链不同阶段的企业在纵向上产生沟通和交流,企业不断聚拢,因此,这两种类型的企业群共同形成了产业集群。目前,提升产业
李富春作为中国经济的主要奠基人之一,他长期从事经济方面的工作,形成了丰富的经济思想。改革开放已经在中国开展了三十多年,在改革开放的这三十多年中中国的经济一直处于高
含金属钌的物料难于溶解,如何将其转入溶液是钌冶金、化学中的难题。综述了目前在用的各种钌物料的溶解方法,并对其优缺点进行了分析。熔融法、氯化法和预处理活化-溶解法是
针对传统故障诊断方法的局限陛,提出一种基于概率神经网络(PNN)的诊断方法。以异步电机转子断条、偏心、失电残压等故障为例进行了诊断研究,通过选取故障样本来训练PNN,将故障信息