基于卡方分布的高维数据相似性连接查询算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:cderfvbgtyhnmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决高维数据相似性连接查询中存在的维度灾难和计算代价高等问题,基于p-稳态分布,将高维数据映射到低维空间。根据卡方分布的性质,证明了如果低维空间的距离大于kε,则原始空间距离大于ε的概率具有一定的下界,从而可以在低维空间以较低的计算代价进行有效过滤。在此基础上,提出了基于卡方分布的高维数据相似性连接查询算法。为了进一步提高查询效率,提出了基于双重过滤的高维数据相似性连接查询算法。利用真实数据集进行了实验,实验结果表明所提方法具有较好的性能。基于卡方分布的相似性连接查询算法召回率可以达到90%以上。基于
其他文献
利用超声波-微波协同法将苹果多酚和大豆分离蛋白制成了新型可食性膜,并对其制备条件进行了优化。试验结果表明:可食性膜成膜的最佳工艺条件为多酚添加量为0.4%,大豆分离蛋白
<正> 股骨粗隆间、粗隆下合并股骨颈基底部粉碎性骨折较为少见。保守治疗虽能愈合,但卧床时间长,并发症多,病死率较高,尤其发生髋内翻畸形(约占30%),影响功能恢复。自1985年8
随着我国电子信息产业的不断发展,PCB设计早已经成为了我们工作中的重要一环。电子产品正在不断想着大存储容量、高密度元件以及高速的运行速度方向发展,这都是由于大量应用了
本文旨在探讨胆碱能神经在脑缺血再灌注时的变化和意义。采用双侧颈总动脉夹闭(CCAO)的大鼠脑缺血动物模型,用改良的Ellman法测定大脑皮层、海马、间脑、纹状体和脑子五个脑区乙
至20世纪70年代前,国产刚竹属植物计24种,在这之后依据国产刚竹属植物分类研究资料共发表刚竹属植物新种50个,其中有24个竹种学名先后被认定为无效发表或错误发表应予摒弃,2
目的:探讨外阴营养不良增生型、硬化苔藓型表皮细胞和外阴鳞状上皮细胞癌等细胞膜结构与凝集素受体结合表达特征及它们三者之间的关系.方法:对慢性外阴营养不良表皮增生型、
网络学习情境是由计算机、网络等信息技术支持的数字化学习空间和学习环境,网络技术的产生不仅为人类学习带来便利,更为重要的是它创造一种与人类传统学习不同的新学习情境;
流量预测是最近几年研究的热点方向,流量预测的方式是基于数据的变化规律来实现的,常用的方法就是根据算法输入、输出来预测变化量的发展趋势。文章重点分析客流换乘量预测的
目的:探讨心理护理对上消化道异物内镜下取出术的影响。方法将104例上消化道异物患者随机分为对照组和观察组各52例。对照组采取常规护理,观察组在常规护理基础上实施心理护理
"输出驱动假设"理论强调在语言教学中以输出为引导,促进学生对语言形式进行反思和有效构建。通过将该理论运用于军事英语视听说课程的教学实践表明,该模式可以激发学生的学习兴