基于Web的数据挖掘研究与探讨

来源 :2008年国际应用统计学术研讨会 | 被引量 : 0次 | 上传用户:color5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Web的数据挖掘是一个结合了数据挖掘和WWW的热门研究主题。本文从Web数据挖掘的概念入手,介绍了Web数据挖掘的分类以及主工作流程,最后从数据源的获取、Web中客户身份的识别、数据的预处理等几个方面讨论了Web数据挖掘中几个关键问题及对策。
其他文献
本文以2002年中国投入产出表为基础,建立了一个22部门的动态可计算一般均衡模型,预测了2030年我国能源强度的变化趋势;该模型中,资本积聚是内生的,居民被分为城市居民和农村
会议
被动矩阵OLEDs已有许多应用,流行于如移动电话,汽车仪表板里等。与LCD-TFT相比,OLED技术有宽视角,高对比度,反映时间快和消除背光功率消耗的优点。然而被动矩阵的局限是显示
本文旨在借鉴西方经典的DLOQ量表,以我国非营利组织中的工作人员为分析对象,发展出中国情景下的非营利学习型组织量表。根据访谈和预试,初步确定非营利学习型组织问卷的题项,
会议
联合分析与方差分析都可处理因变量为数值变量而自变量为非数值变量的问题,虽然解决问题的思路略有不同,但直观上两者应殊途同归。本文尝试从理论分析入手,说明两者相似,并通
在多阶段抽样中每一级抽样都会带来一些误差,似乎增加一级抽样便会增加一些误差。多阶段抽样的抽样误差主来源于群间方差和群内方差。多阶段抽样虽然增加了误差来源,但不一定
1.症状特点白粉病是保护地草莓生产中的一种常见病害,主要危害叶片、果实、果梗。发病初期,叶片背面局部出现薄霜状的白色粉状物,以后迅速扩展至全株,随着病情的加重,叶片向
物流业的发展对经济增长的重性已得到广泛认同。本文根据协整检验和因果关系检验等计量方法,对我国1978年-2006年农业经济增长和物流发展水平、固定资产投资的年度经济数据对
基于2003-2005中国31省区创新数据,首先运用主成分分析方法定量研究中国31省区的创新环境并给出各区域的综合得分,然后建立最小二乘支持向量机区域创新能力预测模型。
企业文化是企业的核心竞争力,企业文化核心竞争力由引导力、激励力、凝聚力和扩张力组成。本文运用模糊综合评判法建立了企业文化核心竞争力评价指标体系和评价模型,并对同仁