大规模数据集高效数据挖掘算法研究

来源 :信息技术与信息化 | 被引量 : 0次 | 上传用户:zhou20p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着信息技术的不断进步,人们获取数据的手段日新月异,不少企业和机构已经存储了大量的数据。基于数据的急速增长,大规模数据集高效数据挖掘技术的应用需求快速增加,本文主要以聚类算法为例,具体分析了主流的BIRCH算法在大规模数据集中的应用局限性及其改进,将CLUK聚类算法应用于大规模数据集高效数据挖掘,并获得了较好的效果。
其他文献
作为国民教育中重要的一环,高中教育对于满足社会需求,提高人口素质具有重要作用。然而在实际教学中,高中教育面临着许多问题。本文主要介绍高中教育中体育教学的兴趣培养。
剖宫产术后子宫瘢痕妊娠是指有剖宫产手术史者再次妊娠时,受精卵着床于既往剖宫产术后子宫瘢痕处,属异位妊娠,是剖宫产远期的并发症之一,若不及时进行诊治,可造成子宫大出血、子宫
1950年天津的文物专家乐翻天了!因为他们居然在天津市财政局的一个库房发现一颗翠玉白菜。
论述了我国有色冶金设计行业进一步深化体系改革的必要性,项目矩阵式管理在工程公司中的应用及其优越性。并结合设计院的实际情况,指出了矩阵式管理应注意的一些问题。
本文简述涡街流量计的基本原理,分析了温度对传感器仪表系数的影响,给出了在测量高温流体时仪表修正的实用公式。
由于大数据环境下个体行为具有多样性的特点,使得基于局部信息的一般个体行为信任评价模型考虑因素不全面,导致个体面临信任危机。为此,提出一种改进的个体行为信任评价模型
一般情况下,液体表面层总是存在着表面张力。怎样对此宏观现象给予微观解释,是普物热学教学中遇到的问题。虽然在现行教材中已有各种论述,本文将给出另一种不同的解释。从微
运用文献资料,问卷调查,访谈,数据分析及逻辑推理法等方法,以海宁一中和海宁高级技工学校2所学校为例,从女生的生理,心理特点等角度进行比较,对女生体育课兴趣的影响因素进行研究,对
以灵石山国家森林公园为例,利用ArcGIS的3D扩展模块,在ArcScene中导入灵石山国家森林公园的数字高程模型,结合遥感数据,实现灵石山国家森林公园的三维可视化。该方法改变传统
近年来,大学生漠视生命、残害生命的现象频繁发生,体现了当代大学生的心理健康问题,对当代大学生进行生命教育非常必要。分析了当代大学生生命教育的现状及成因,认为生命教育