【摘 要】
:
大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模
【机 构】
:
哈尔滨工程大学模式识别与自然计算研究室,大连理工大学计算机科学与技术学院,黑龙江科技大学电子与信息工程学院,哈尔滨师范大学物理与电子工程学院
【基金项目】
:
国家自然科学基金(60975042);黑龙江省教育厅科学技术项目(12511166)资助课题
论文部分内容阅读
大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上采用抽样后剩余数据样本对质心的初始位置进行更新,以便校正偏离理想位置的初始质心。该划分聚类算法具有线性空间复杂度和时间复杂度。实验结果表明所提的新聚类算法不仅能得到比常用聚类算法更理想的结果,而且运行速度快,适合处理大规模数据的聚类任务。
其他文献
对2002~2005年间我院职业病科收治的硅沉着病合并下呼吸道感染患者痰培养分离出的303株致病菌的分布情况及耐药性进行分析,了解硅沉着病合并下呼吸道感染的菌群分布特点及耐药
党支部领办合作社是我市推动乡村各项事业跨越发展的战略举措,它不仅促进了农村经济的发展,也为乡村生态振兴注入了新的动力。我们应该努力推动党支部领办合作社实现绿色转型,补
对我国汽车企业建立与实施环境管理体系的标准依据、策划构想、环境污染防治技术选择与应用 ,以及与质量管理体系一体化等进行了较为全面的分析
励磁系统是同步发电机的重要组成部分,励磁装置的性能直接影响同步发电机运行的可靠性和稳定性.针对一台600 MW机组励磁装置两次故障造成的跳闸事故,分析励磁装置的故障原因,
[1]首先应用功的互等定理计算了一对边简支、其它边无自由边的矩形弹性薄板的固有频率。本文继续应用功的互等定理来计算一对边简支其它边有由自边的情形。给出了一对边简支
分析了汽车配件需求来源和产品设计过程,提出了汽车配件产品快速设计系统的体系结构,研究了相应的关键技术,最后开发了快速设计系统并在汽配企业实施应用。
归纳总结可测函数列关于一致收敛、近一致收敛、几乎处处收敛、依测度收敛等情况之间在一定前提条件下的关系,反例说明条件的变化将影响结论的正误,从而使收敛及其相互关系更
银杏树高大挺拔,树干通直,姿态优美,叶形奇特,是著名的庭园观赏树种之一,具有较强的防尘、减噪与抗病虫害能力,可广泛栽种于道路两侧、庭院或公园。银杏犬树移植一般是指对胸径25cm
动脉粥样硬化(atherosclerosis,AS)是动脉硬化的一种常见类型,多见于40岁以上成年人,近年来有年轻化趋势,男性较女性发病率高。本病由多种危险因素参与所致,而抗动脉粥样硬化
“项目管理”,即“为了满足(甚至超越项目涉及人员)对项目的需求和期望而将理论知识、技能。工具和技巧应用到项目的活动中去。“在当前残酷的市场竞争环境下.软件开发项目的诸多