高效数据挖掘算法在大规模数据集中的应用研究

来源 :软件 | 被引量 : 0次 | 上传用户:firemourne
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据采集和信息获取技术的迅猛发展下,政府及各企事业单位都积累了大量的数据,过去简单化的查询方式以及统计技术已经不能适应当前对大数据处理的要求,不能在更高层次上,如:频繁项集、聚类、分类、离群点检测等进行分析。数据挖掘就是在这样迫切的形式之下才得到重视和凸显起来的。于此同时,数据挖掘与人工智能、Web、物联网等的紧密结合也得到了广泛的关注及应用。从大量的复杂的混合类型数据中发现有用的模式或知识是十分紧迫和有意义的,不仅在学术界得到重视,而且对国家和社会产业结构的调整和经济效益的提升做出很大的贡献。
其他文献
天气是公众关注的重要民生话题,容易在特定时间段成为全民关注的热点、媒体讨论的焦点。打造更接地气、更具实用性和时效性的的信息服务平台是加强气象服务保障工作重要环节
当前,我国正处于社会转型的关键时期,复杂的社会环境导致国民的社会心态出现消极因素。大学生是一个特殊的群体,他们是宝贵的人才资源,是民族的希望、国家的栋梁,肩负着社会
:本文介绍了时间序列的基本概念以及主要特征,并通过神经网络及其混合模型来对时间序列进行分析和预测。首先通过时间序列的历史数据训练神经网络并通过神经网络描述时间序列
库车坳陷深部致密储层中油气资源丰富,深部油气成藏条件与浅部有很大差异,造成深部油气藏成藏特征与油气分布规律表现出与浅部油气藏完全不同的特征,阻碍了深层油气勘探。本
目的:测定平贝母药材中的主要生物碱贝母素甲和贝母素乙的含量。方法:采用高效液相色谱-蒸发光散射检测器和Agilent Hypersil BDS-C18(4.0 mm×250 mm,5μm),在流动相为乙腈-
台州多洞天福地,全国十大洞天,它就占了三席。特别是黄岩的委羽洞天在十大洞天中排名第二,是我们台州人的骄傲。但是,很少有人知道,其实委羽洞天一开始并不在我们台州,它是从北方“
报纸
从分析包装设计的影响因素入手,提出建立一套包装设计效果的模糊评价体系,并给出了利用包装设计效果模糊综合评价方法进行评价工作的详细过程。力求将人的主观感受用定量数值
目的:建立超高效液相色谱-串联质谱法(UPLC-MS/MS)同时测定瓦布贝母中西贝母碱苷、西贝母碱、贝母辛、贝母素甲、贝母素乙和湖贝甲素的方法。方法:采用Agilent Eclipse XDB C18
社交媒体是新媒体的重要组成部分,在当代,诸如微博、微信朋友圈、Twitter和Facebook等社交媒体成为各阶层群体线上交流的首选。大学生群体是社交媒体的重要用户,是社交媒体的
在确定再循环空气净化系统各主要物理量之间的内在关系的基础上,运用优化方法,对再循环空气净化系统进行技术经济比较,给出了各运行参数对系统的作用影响规律.