基于遗传算法的Web数据挖掘研究

被引量 : 0次 | 上传用户:Spring_880916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种全新的信息技术,是指从数据中提取模式的过程。同时,数据挖掘又是一种决策支持过程,它主要基于人工智能、机器学习、统计学等技术,高度自动化地分析企业原有数据,做出归纳性推理,从中挖掘出潜在的模式,预测用户的行为帮助企业决策者调整市场策略,减少风险,做出正确决策。随着万维网的迅猛发展,产生了海量缺乏语义链接的Web数据,虽然人工智能(Artificial Intelligence)、统计学(Statistics)等成熟技术在各种特定领域从模糊数据中提取隐含的、潜在有用的信息和知识的过程中得到成功应用,但是,由于Web数据的特性以及数据挖掘或知识发现本身也是一个不成熟的、尚待进一步研究的领域,对研究人员仍然是一个巨大的挑战。对Web数据挖掘问题的研究有助于网络知识的综合利用,有助于及时调整决策策略,有助于提高系统安全。本课题首先学习和分析具有一种成熟的智能优化算法(遗传算法),然后在传统的数据挖掘方法的基础之上,从Web行为挖掘领域引入了GA,进行了聚类分析和关联规则挖掘,用户聚类分析为系统准确分析类用户群体的行为特征提供了重要依据,而通过遗传关联规则挖掘,优化并且丰富了类用户的行为特征,弥补了类用户由于访问量、时间的限制而可能产生的行为特征分析不全面,从总体上起到了优化预测的作用。处理数据源主要是Web站点的拓扑结构和用户访问日志,是整个系统的离线部分,从众多用户对Web页面的大量的点击中,分析Web用户的行为特征,实现用户聚类,再分析每一类用户的个性行为特征,得到描述用户行为方式的关联规则,为整个系统的个性化服务提供知识支持。
其他文献
<正> 随着盛夏的到来,热应激对母猪生产性能的影响日益明显,以下是笔者在生产管理中的一些经验,希望能对广大养殖户有些帮助。在高温环境中,母猪采食量减少,对母猪的发情、配
中国含油气盆地处于全球(晚期)新构造运动强烈活动区,近年来油气晚期快速成藏成为我国学者关注的热点.本文针对形成于渤中坳陷新构造运动强烈活动带的PL19-3大型油田,围绕油
以L-乳酸乙酯和L-谷氨酰胺为原料,通过L-乳酸乙酯氯化、水解、酰化得到D-2-氯-丙酰基氯,再将D-2-氯-丙酰基氯与4-谷氨酰胺缩合后氨解,得到目标化合物,总收率43%,纯度(HPLC)大
分析了目前我国城市配网存在的问题,并就配网规划与改造2方面提出了参考建议。
<正>在临床护理工作中,静脉穿刺一般首选手足背静脉进行操作。手足背静脉网是浅静脉的一部分,有很好的网状结构,与深静脉相通,可回流心脏。在临床患者中,有相当一部分人的手
根据现场的实际施工需要,针对油水井储层损害评价方法和增产增注措施优化施工设计与经济效果预测方法进行了研究。依据渗流力学理论和采油工艺理论,分别对五类储层建立了油井
腈纶厂回收装置主要腐蚀介质NaSCN(硫氰酸钠)腐蚀性极强,它不仅对碳钢,铝和铝合金有腐蚀性,而且对一般的不锈钢也有一定的腐蚀性,虽然大部分设备采用超低碳不锈钢00Cr17Ni14M
目的总结肾移植术后急性排斥反应的主要临床症状和表现,并提出相应的护理措施,以指导临床护理工作。方法回顾性统计36例肾移植术后患者发生排斥反应时的临床症状和表现,并进
目的考察在光照、加热条件下甲醇溶液中大叶茜草素的稳定性。方法以甲醇-水-四氢呋喃(310:90:3)为流动相,利用DiscoveryC18色谱柱在250nm处测定大叶茜草素的含量,考察在4500
介绍国内开发的第三代催化裂化干气制乙苯技术在中国石油天然气股份有限公司锦西石化分公司的工业应用情况。该技术反应部分采用气相烷基化与液相烷基转移相结合的反应工艺,