基于聚类分组和属性综合权值的SNM改进算法

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:zxcfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在处理大量业务数据时,传统的基本临近排序算法(sorted-neighborhood method,SNM)查准率、查全率均不高。针对SNM算法的缺陷,提出了一种基于聚类分组和属性综合权值的SNM改进算法。该算法基于分层思想,首先采用聚类分组的方式将海量数据进行分组,然后对各属性设置综合权值最后再进行相似重复记录的识别。其中聚类分组法能有效减少记录之间的比对次数,提高检测效率;属性综合权值的方法能更加准确反映各属性对记录的贡献度,针对实际数据集的实验分析表明,聚类分组法和属性综合权值法两者结合在提高查准率
其他文献
为进一步提高现代农机自动化、信息化程度,提出了一种基于STemWin图形库和SAE J1939 CAN通信协议的采棉机监控系统。主控芯片选取ST公司生产的STM32F407IGT6,监控系统通过CAN
为了克服传统设计的不足,提出了将任意波形发生和对波形实现PID控制在单片FPGA中实现的思路,并以EP2C20Q240C8N芯片为SOPC系统的载体,完成系统硬件平台搭建。最后,对实验结果
为了满足智能加工技术的需求以及克服传统量具的局限性,开发一种基于数显卡尺的零件几何尺寸快速测量、传输、显示的装置。主要利用CPLD混合电压设计思想与硬件语言编程技术
从海绵城市信息化的现实需求出发,提出了基于B/S(Browser/Service)架构的海绵城市信息化管理平台体系架构,结合了当前IT发展趋势,调查并研究了海绵城市信息化的相关业务范围,并
针对工业过程中经常遇到的一阶滞后系统,综合考虑了系统的响应时间、超调量、鲁棒性、噪声干扰等影响因素,提出了改进性能指标的智能PID参数整定算法。将改进的性能指标作为
针对分散远距离控制分布式控制系统设备维护,介绍了一种组态软件结合网络远程高效诊断故障的方法。在柿竹园生产安全调度指挥系统中,彼此分散在15km2范围的各大生产单位为维
大气湍流是影响无线电波传播的重要因素,折射率结构参数通常被用来表征大气湍流强度。当横风作用高速列车时会使车身周围湍流场明显变化。将列车风与横风相结合,在复杂风场的
通过某核电站的一次堆外核测系统的误报警问题的解决,详解了该类问题处理的过程,包括理清事件发生经过,使用鱼骨图列明可能性,由简入繁、由易到难地排除非要因,并最终确定主
无人机往往需要在恶劣的应用场景中进行远距离可靠数据传输,基于多核软件无线电架构设计无人机宽带数据链,采用OFDM传输技术,支持点到多点的通信,以提高链路的传输性能,并对
飞机研发制造作为一个系统性的大工程,其涉及部门多、环节多、零件设备多,质量数据体量巨大,数据分析需求高、难度大,并且质量数据的各维度属性值均为离散数据信息,传统数据