去重相关论文
本文设计了基于大数据挖掘处理的多维数据去重聚类算法分析模型.通过详细介绍多维聚类算法,基于大数据内部关联性分析,实现了去重......
针对移动视觉任务中寻找视频连续帧重复区域以减少模型计算的问题,提出一种基于多方向搜索的连续帧目标检测去重算法.该算法利用视......
滴滴出行是一个规模巨大的网约车出行互联网公司,如何把握市场变化来扩大公司运营规模,获取用户第一意愿是非常重要的。原本各业务......
云数据中心规模的持续增长和虚拟机镜像数量的急剧扩张,给云数据中心的存储管理带来严峻的挑战。另外,海量的虚拟机镜像中占有很高......
随着计算机技术的发展与电子办公的普及,大部分企业已经从以往的纸质办公转为了现在的电子化办公,纸质文档因保存不便、查找困难也......
当今世界,互联网迅猛发展,信息无论从产生还是传播速度上,都大幅提升,在这样一个信息爆炸的时代,如何快速有效的从大量数据中获取......
随着云计算和物联网的快速发展,全球的数据规模呈现爆炸式增长,大数据时代随之到来。由于云具有强大的存储和计算能力,越来越多的......
摘要:现有的车间大型设备复杂度高,越来越依赖监控系统对其进行实时性管理。目前依靠云计算的设备监控系统所需传输的数据量越来越大......
本文以高性价比为目标,以基于PCI总线的二工位动平衡自动校正系统为对象,针对目前国内现状,开发了一套适合电机转子高精度动平衡的自......
针对达州市档案局数以万计的档案纸质文档需要通过扫描等技术图像化存储的现有情况,提出了一种在大数据下对相同图片文档去重的策......
申请公布号:CN105579980A 申请号:2013800798852 申请人:仁荷大学校产学协力团 地址:韩国仁川 发明人:金德焕 Int. Cl.:G......
电信行业由于在话单采集过程中的某些异常可能会产生重复话单,如果不及时剔除,将导致用户的费用统计有误,引起客户投诉,造成客源流失。......
同事前来求助,如图1所示,这里有一些重复的名字,现在需要实现去重之后的统计。由于实际的源数据比较多,手工统计显然是比较麻烦,有没有......
最近在工作中遇到一个问题,如图1所示,同事希望去除这里的重复文件,以","为分隔符,将其合并到一个单元格。由于实际的数据量比较大,......
针对OAI-PMH框架中存在的元数据重复问题,根据重复元数据出现的两种情况给出了相应的解决方法。对于SP中来自同一个数据提供方中的......
现有的视频去重技术多样,但字幕这一与视频内容能高度匹配的重要信息并未被考虑到其中。提出一种针对含内嵌字幕视频进行去重的方......
IRC僵尸网络是攻击者通过IRC服务器构建命令与控制信道方式来控制大量主机组成的网络。IRC僵尸网络的动态性以及动态IP地址的影响,......
结果去重和排序是提高元搜索引擎结果质量的两个关键问题,文章分析余弦相似度、基于TF-IDF的文本相似度三种去重算法,利用URL、标......
介绍了研制的两工位半自动动平衡机去重系统的组成、工作过程,重点对动平衡转子二次平面分离技术以及系统的误差进行了研究,提出了校......
随着数字化校园的发展,校园网数据量呈几何倍增长,信息的查找和定位变得更为困难。本文以大学校园网为研究对象,在分析了网络搜索......
云存储系统通过副本管理策略,在廉价设备上提供了对海量数据快速、安全、可靠的存储服务。云存储系统的发展,为云网盘服务奠定了基础......
SSO(Single Sign On)是并购整合后期的技术整合中必须要实现的一个功能,而通常不能直接将并购者的用户数据与被并购者的用户数据直接......
好不容易在人群里拍到景点的照片,回家打开电脑发现影像却是模糊的。要么是拍摄主体的轮廓有点模糊、虚化,要么整张照片的色阶也比较......
针对目前包缝机曲轴所存在的振动问题,从平衡的角度出发进行减振研究。利用Pro/Engineer软件技术建立曲轴的三维实体模型。并对模型......
针对载有结构化数据的网页特点,提出了一种新的有效字段发现策略,据此设计了一个基于学习的自动去重方法。对样本网页集进行聚类分......
蓝月一瞬Rebekka说:"这张照片的完成耗时数月。我在隆冬时节从湖边捡来照片中的这些石头,将它们涂成蓝色,然后开始等待。夏天的时候,......
文章提出了一种工程项目零部件选配组合优化方法,具体包括:将部件进行分类,分为一组或多组第一类部件,以及一组或多组第二类部件;......
随着互联网技术的发展,目前应用系统大部分采用B/S结构,其中前端页面的互动及数据处理一般采用Java Scritp技术,在数据处理的过程......
笔者研发的科技查新辅助查新工具是针对中国知网、万方、维普、中国知识产权局专利检索与服务系统设计的,通过编程实现基于EXCEL平......
提出一种针对剧集类和电影类网络视频的去重技术,根据剧集类和电影类网络视频标题的显著特征,采用精确串和正则表达式匹配算法自动......
针对载有结构化信息的网页,提出一种基于学习的去重方法。通过先期准备的样本定义分类器,根据分类器对页面中结构化信息的不同属性......
由于短文本具有词频单一、结构简单等特点,基于传统特征选取方法的文本去重算法不适合短文本。为此,提出一种适合短文本特点的去重......
针对元搜索的重复网页问题,提出基于元搜索的网页去重算法,并通过实验对算法进行有效性验证。该算法首先对各成员搜索引擎返回来的......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
课件管理系统(CAI Management System)是一种确保高校课件资源信息共享和高效利用的重要平台。对比传统课件管理和评审方法,不仅可满......
目的探讨"不去重"和"去重"两种方法分析后各NGS相关指标间的差异,研究"去重"在靶向捕获NGS数据分析中的重要作用。方法通过对58例......
通过试验对影响盘轮不平衡的2个显著因素--壁厚差值和形状不规进行研究,使用多元线性回归算法对盘轮不平衡量与2个影响显著因素之......
数据去重可删除备份过程中的冗余数据,节约存储资源与与网络带宽,是目前数据存储领域研究的重点问题。针对传统方法去重率和吞吐量......
数据去重是大数据预处理过程中最主要的一个步骤。为了提升大数据去重的效率,以及优化其在较差情况下的表现,本文以中文微博的原始......
云计算基于多种传统互联网服务技术演变而来。传统的虚拟化技术和分布式技术作为云架构的两大核心技术,为云计算提供了优秀的计算......
去重被广泛地应用于云存储服务中以节省带宽和存储资源,然而,客户端去重复化删除中仍存在安全缺陷,使外部攻击者可访问用户私有数......