基于WEB的增量式数据挖掘的研究与应用

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:yu19910108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web数据挖掘是当前数据挖掘的热点研究领域之一,由于Web页面数据的半结构化、不规则性和动态更新等特征,使得基于Web内容的数据挖掘研究具有一定的复杂性.本文首先简介如何从Web页面中提取半结构化数据,接着提出一种增量FP-Growth挖掘方法,使传统的FP-Growth方法适应于动态数据环境的关联规则挖掘,最后以中国汽车市场为例,挖掘消费者对不同类型、不同型号、小同价格轿车的购买偏好. Web data mining is one of the hot research areas of data mining at present, and the research on data mining based on Web content has certain complexity due to the characteristics of semi-structure, irregularity and dynamic update of Web page data. Semi-structured data is extracted from Web pages, and then an incremental FP-Growth mining method is proposed to adapt the traditional FP-Growth method to the association rules mining in dynamic data environment. Finally, taking Chinese auto market as an example, Different types, different models, small and small price cars purchase preferences.
其他文献
目的 探讨滋养细胞肿瘤的三种治疗方法的可行性及其疗效.方法 选择从2011年7月~2012年10月我院就诊被诊断绒癌及侵蚀性葡萄胎患者,根据其年龄、有无生育要求、病灶大小及肌层
在60℃温度条件下,使用H2O2作漂白剂,研究了6种不同H2O2浓度和4种漂液pH值对红色月季平面干花漂白效果的影响.结果表明:漂液浓度越大,漂白速度越快,但超过一定浓度时对材料的
目的 研究蟾酥对CEM细胞的抑制作用及其机制.方法 应用MTT比色试验观察蟾酥对CEM细胞的抑制作用;采用光镜、电镜技术观察细胞形态结构的改变;利用流式细胞术(FCM)检测细胞凋
光电位置敏感器件 (PSD)是一种可直接对其光敏面上光斑位置进行检测的光电器件 ,基于光电位置敏感器件可以构成多种非接触的高精度动态位移监测仪器。根据光电位置敏感器件的
采用生物化学的方法研究中华倒刺鲃仔稚鱼消化酶的个体发生和相互之间的异同.得到以下结果:从胰蛋白酶活力来看.3个试验组之间具有显著性差异(P<0.05),在试验后期,活饵组的胰
基于有害生物控制的原理,考虑陕北黄土高原环境特点和资源优势,结合国家退耕还林生态工程,提出乔木(枣树)—灌木—牧草(作物)—畜禽栽种养殖为一体作为陕北枣林病虫害生态调
实验室比较抗凝血灭鼠剂杀鼠灵、杀鼠醚、敌鼠钠盐毒饵(浓度0.025%)和溴敌隆毒饵(浓度0.005%)对黑线姬鼠的毒效。结果显示,单养试验中,4种鼠药对试鼠的毒杀率分别为80%,80%,1
研究了不同元素等量掺杂下重电子金属CeCu5.8M0.2(M=Ni,Zn,Cd)低温电阻、比热容和磁化率随温度的变化关系.分析讨论了掺杂元素M(M=Ni,Zn,Cd)的磁性、价态及原子尺寸对近藤温
提出了一种动态安全分析神经网络输入特征的优选方法。该方法将决策表最优特征子集理论与粗糙集理论的元素离散化方法相结合,在保证较高精度的运行点分类和稳定裕度计算的基
利用低温氮气吸附法系统研究了吸附聚丙烯酸 (PAA)的量对纳米碳管表面特征的影响 .分析结果表明 :当PAA吸附量增加到 2 68 98mg·g-1时 ,纳米碳管的比表面积下降了 46 97% ;