【摘 要】
:
随着Internet的不断发展,WWW的应用也越来越广泛成倍增长的网络数据中潜藏着大量的商机,由此而产生的Web日志挖掘和网页预取也越来越成为热门的研究领域如何从海量的Web日志数
论文部分内容阅读
随着Internet的不断发展,WWW的应用也越来越广泛成倍增长的网络数据中潜藏着大量的商机,由此而产生的Web日志挖掘和网页预取也越来越成为热门的研究领域如何从海量的Web日志数据中发现用户的兴趣爱好,是实现个性化服务的关键因此,基于用户浏览特征的Web用户聚类和网页预测都备受关注准确而高效的Web聚类和网页预测可以为网站的结构调整系统性能改进和个性化服务等方面提供强有力的支撑,从而增强企业的竞争力,为新兴的电子商务增添新的动力本文首先分析传统Leader算法和κ-means算法的优缺点,提出了基于Leader算法的κ-means改进算法——LKκ-means算法,避免了初始聚类中心选取的边缘化和随意性在LKκ-means算法的基础上,提出了一种基于用户特性的RDPLKκ-means用户聚类算法该算法综合考虑了浏览时间和浏览频次两个因素对用户会话相似度的影响,并将用户个性或机器性能影响较大的浏览时间做了RDP处理,定义了新的用户会话相似性度量公式实验表明,该算法可以有效实现用户会话聚类,且聚类结果客观合理最后,以RDPLKκ-means算法聚类结果为依据,不同聚类用户的浏览特征通过不同的Markov链描述由于同一类别用户的浏览行为相似或相同,对应Markov链的状态空间集中且有限,与单Markov链相比,基于用户聚类的多Markov链预测模型不仅有效降低了空间和时间复杂度,还提高了预测的准确率和覆盖率
其他文献
独立计量区域(DMA)技术在城市供水系统漏损控制和管网优化运营管理中的应用取得了较快发展。但是,随着管网监测时间增加,数据量增大,采用人工手动逐项查询、计算、分析漏损情
目的:研究补肾方的抗老年性骨质疏松作用及机制。方法:通过老年性骨质疏松大鼠模型,观察骨密度、骨生物力学、骨代谢生化指标、血清激素水平、股骨骨矿元素含量等指标变化,综
现阶段,电力企业的工作压力逐渐增加,加强电力企业的网络信息化建设能够从根本上满足国民对电力的需求。本文通过对电力企业网络信息化建设过程中存在的问题进行简单的分析,
目的 比较芬兰版和中国版糖尿病风险评估量表在新疆社区糖尿病筛查中的应用价值,为新疆社区糖尿病筛查提供理论依据。方法 于2017年5月采用多阶段随机抽样法,在新疆乌鲁木齐
针对高校教室规模不断扩大,现行预约手续繁琐,易出现人为失误和预约冲突等问题,分析传统教室预约现状,对教室预约系统进行了可行性分析,从相关技术以及体系结构等方面论述了
在当今市场竞争日益激烈和信息化水平不断提高的新形势下,电力企业要想寻求稳健、平稳发展,就需要凭借先进的技术手段和措施,实施符合现代化发展的信息化管理,以达到降低生产
某船液压联轴节在改进其活塞螺母结构后连续发生拉伤故障。本文应用有限元技术,对螺母改进前后不同结构形式的液压联轴节进行安装和拆卸过程的仿真分析。通过对不同结构下,由于
一、考情聚焦(1)线面角的求法是高考命题重点考查的内容之一,在全国各地的高考试题中几乎每年都能见到它们的身影。(2)在各类题型中均可出现,特别以解答题为主,难易度属于低、中
<正>1.施好基肥基肥施入总量,有机肥和磷肥100%施入,氮肥30%施入、钾肥20%施入。在犁耙地或起垄时,每亩施农家肥3000~4000kg或商品有机肥150~200kg、亩施磷肥2~30kg。2.看苗
科学合理地规划建设新机场是扩大航空运输服务覆盖率,提高国民航空出行便利性的重要途径,是实现民航业可持续发展的关键。随着我国民航运输业的高速发展,现存的机场搭建形成