【摘 要】
:
针对目前增量压缩中相似性数据检测方法特征提取过程大多存在计算复杂性大、检测不够精确等问题.本文面向非重复但高度相似数据,提出一种基于增量压缩的数据块局部特征数据相
【机 构】
:
国网上海市电力公司 信息通信公司数据运维中心,上海200072;南京航空航天大学 计算机科学与技术学院,南京211106
论文部分内容阅读
针对目前增量压缩中相似性数据检测方法特征提取过程大多存在计算复杂性大、检测不够精确等问题.本文面向非重复但高度相似数据,提出一种基于增量压缩的数据块局部特征数据相似性快速检测方法FSD.首先将数据块分解为若干个子数据块,然后提取每个子数据块的特征,接着构建投票表决的分组,进行组内表决形成超级特征,最后根据超级特征进行数据相似性检测.基于开源的增量压缩原型系统Destor,在六个数据集上进行的增量压缩试验表明,与经典的SF方法比较,FSD在数据相似度检测计算的速度和效率方面得到了有效的提升,系统整体吞吐量提高了50%-90%.
其他文献
针对同时存在全局与局部环境的移动机器人路径规划问题,提出了一种分层路径规划方法.采用改进势场-蚁群融合算法进行规划.首先,在全局环境下采用改进蚁群算法进行路径规划,为
针对考虑运输时间的柔性作业车间调度问题,构建了以最大完工时间最小化、最大机器负载最小化和总机器负载最小化为目标的多目标优化模型,并提出一种小生境粒子群优化算法求解
针对现有室内场景识别方法仅通过关注视觉信息本身,而缺乏考虑图像中所含语义内容,提出一种基于长短期记忆神经网络和卷积神经网络的融合深度神经网络室内场景识别方法.首先使用labelImg工具为Visual Genome数据集图像生成位置描述符,经数据预处理算法处理后通过GloVe模型得到词向量.然后引入带有L2正则化的小批量梯度下降算法训练模型,将注意力机制与融合深度神经网络模型结合实现对位置描述符进
邻居选择和邻居数量对于推荐系统评分预测具有关键作用.本文采用复杂网络模型中多种聚类方法,针对现有方法通常基于单一相似性选择邻居的问题,建立用户为节点,相似性与置信系
面对网络学习资源的信息过载问题,如何根据用户的偏好推荐其感兴趣的学习资源是网络教育智能化的关键应用.协同过滤推荐算法无需构建资源的特征描述,经常应用于形式多样的网
基于卷积神经网络的目标检测在智能机器人、无人机等领域有着重要的应用,但其模型普遍结构复杂、参数量大、占用资源多,难以满足嵌入式目标检测任务中的实时性需求.针对此问题,本文提出一种多尺度特征融合注意力网络(MSFAN:Multi-Scale Feature-fusion Attention Network)模型,该模型基于MobileNet_YOLOv3网络模型,并结合多尺度特征融合等改进措施,在高
深度学习在控制图模式识别的运用上,易受控制图样本量和控制图质量特征数据点数的影响,针对这个问题,本文提出基于感知器-卷积神经网络的孪生神经网络(Perceptron-Convolutio
计算机棋类游戏的研究目标是人工智能选手的智力提高,而学习样例对棋局局面的代表性,在很大程度上决定了选手的智力水平,但学习样例的产生方式和优劣判定一直未能引起足够重
在大数据时代背景下,数据规模成指数级增长,传统支持向量机(SVM)已无法适应大数据环境,所以需要将传统支持向量机算法改进使其可以应用于大数据计算框架.针对计算过程中存在
为解决传统协同过滤算法中评分数据高维稀疏、用户评分偏好属性和物品类别偏好属性缺失,而导致推荐效率较低和推荐质量较差的问题,本文提出一种结合对象属性和近似检索的协同