基于Web日志和网页特征内容的个性化信息推荐

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kzxs88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet全面迅速的发展,网络已经渗透至各个领域,成为人们生活工作不可或缺的一部分。一方面,网络提供了海量的图片、文字、音频及视频等丰富的信息,使人们能够有机会从中找到需要的信息;另一方面,面对如此多的信息,人们很难准确地获得需要的信息及信息之间潜在的知识。因此,信息个性化服务应运而生,实现了从“人找服务”到“服务找人”的转变。Web日志数据挖掘旨在通过对日志进行有效的数据挖掘,发掘隐藏在日志数据背后的规律和模式,通过对Web日志数据和用户对网站的访问频度、行为及内容等进行分析可以从中提取出有用的信息,并且从中分析得出用户的兴趣所在,从而可以根据用户的喜好为用户提供个性化的服务。为了能够有效地提供个性化推荐服务,论文针对系统关键环节展开了研究,论文主要贡献体现在以下几个方面:①由于各种搜索引擎的应用,网络爬虫在网站中活动频繁,同时在Web日志中留下了很多与用户行为无关的访问记录;另外,本论文中主要利用Web日志分析匿名用户的行为兴趣,网站管理员与商家管理员的行为日志记录属于无关记录。本论文在现有的数据清洗方法上,通过增加能够清除网站和商家管理员的方法和正确地识别与清除网站爬虫留下记录的方法,有效地解决了上述问题,提高了数据预处理的效率,也相应地提高了用户个性化推荐的准确度。进而,在不要求用户登陆或注册情况下,对清洗后的数据,根据记录中的信息和基于扩展日志的Cookie字段,给出了一种能够简单有效地进行用户识别和会话识别方法。②为了分析匿名用户对网站的兴趣所在,论文提出了一种基于Web日志并结合页面特征内容及用户浏览时间的用户兴趣度计算方法,建立了面向多维对象的兴趣度模型,其中二维用户兴趣度可以分别表征用户对主题类型和商家的兴趣度,三维用户兴趣度模型表征了用户在某主题类型上对某商家的关联兴趣度,模型能够很好地应用于网站的信息个性化推荐中。③在网站“重庆便民服务平台”中实现了对用户的基于环境的多方式个性化信息推荐服务。系统根据历史兴趣和用户实时点击相结合的方法并结合用户所访问网站的位置和状态有效地推荐出了用户感兴趣的服务类型和商家,以及商家发布的动态广告信息。本文尝试着从Web日志数据中挖掘出匿名用户对网站内容的兴趣度,进行个性化的信息推荐,并充分考虑了数据预处理中的效率问题。课题研究过程中,通过实验证明了推荐系统的有效性。
其他文献
Internet的高速发展和新型网络服务的出现,要求防火墙、安全网关等网络设备具有更强的数据处理能力。流分类能有效支持全方位的网络服务、提高网络设备的性能,是高速网络的关
随着新型网络业务、网络协议以及多核技术的发展和成熟,具有高速业务处理能力、高可编程性、基于多核处理器的网络分组处理端系统,成为学术界和工业界研究的热点。一方面,通
无线传感器网络(Wireless Sensor Network,WSN)是基于任务驱动的自组织系统,密切关注用户需求,通过中间节点大量传输数据。由于暴露在外部区域,时常会遭受恶意的攻击等危险行
防抱死制动系统(ABS)是在汽车制动过程中防止车轮抱死的闭环控制系统,最开始应用于火车和民航机上,现如今已经越来越广泛的被汽车所应用。ABS关系到汽车制动过程中的主动安全
图像半调技术和逆半调技术是图像处理技术的一个边缘分支。将噪声植入连续图像,变为二值图像的过程称之为半调过程,其逆过程称为逆半调过程。查找表法是逆半调技术众多方法中
随着电子书阅读器市场的成熟,电子书阅读器的功能也越来越强大,拥有了像WIFI,3G这样的高速网络通讯工具,因此要求各种各样的网络应用程序,像浏览器,邮件客户端等基础网络应用
随着计算机科学与技术的发展,计算机被应用到各行各业。决策支持系统(DecisionSupport System,简称DSS)越来越被人们重视,决策支持系统的模型系统也同样受到人们越来越多的重视
随着服务计算与云计算的发展,互联网上发布的Web服务数量也在迅速增长,通过调用不同的Web服务来快速搭建有创意的Mashup应用,引起了服务开发者的广泛兴趣,而如何帮助用户快速
近年来,在企业级应用开发环境中,面向对象的开发方式已成为主流,而关系数据库是目前使用最广泛的数据库,因此,在开发过程中通常会采用面向对象技术和关系数据库相结合的方式
随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基