基于Web客户端数据的个性化推荐技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:pangpang925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的迅速膨胀,人们从Web上获取感兴趣信息越来越困难。因此,为用户提供感兴趣信息的个性化推荐技术获得了广泛关注。目前个性化推荐技术多数是基于Web服务器端数据的,无法从根本上解决用户难以较好地获取感兴趣信息的问题。而Web客户端数据包含单个用户对多个网站的上网记录,其数据能更好地反映用户兴趣,因此本文主要研究了基于Web客户端数据的个性化推荐技术。   首先,研究了Web客户端的用户个性化信息提取。Web客户端的用户个性化信息主要从IE缓存、IE历史记录、收藏夹等获取,其中IE缓存上网记录较多、数据冗余较大等特点加大了用户个性化信息的提取难度。针对这一问题,本文研究了基于网页分块的网页正文信息提取方法,实现了从IE缓存中提取用户个性化信息。该方法引入网页分块的思想,通过使用正则表达式,实现了网页内容块抽取及其正文信息提取。实验结果表明,该方法能够较准确地抽取用户个性化信息,且具有较强的通用性。   其次,本文分析比较了现有几种基于空间向量模型(VSM)表示的用户兴趣模型,将互信息和层次聚类方法应用于用户兴趣建模。互信息的引入使用户兴趣模型中兴趣特征之间能够相互关联,而基于互信息的兴趣特征层次聚类又更好的将关联关系比较强的兴趣特征聚集在一起。实验结果表明,该用户兴趣模型能够较好地匹配用户感兴趣的信息。   最后,设计并实现一个以用户为中心的基于客户端数据的个性化推荐原型系统。测试结果表明,该原型系统能够从异构的Web客户端数据中提取用户个性化信息,并根据用户个性化信息进行用户兴趣建模,向用户推荐其感兴趣的信息。
其他文献
计算机视频取证是当前世界上机器视觉研究领域中的一个研究热点,它结合人工智能、计算机图形学、模式识别等研究领域的成果。主要研究目的是在海量的视频库中快速准确地定位犯
学位
基于内容的视频拷贝检钡(Content-Based Video Copy Detection)是视频版权保护与内容管理的重要技术手段之一,是通过屏蔽视频的视觉表现形式,提取视频内容信息指纹,度量指纹
随着网络带宽的飞速提升,利用可移动设备接收查看多媒体信息已经成为人们的迫切需求。传统多媒体文件通常体积很大,下载需要很长时间,而且只能先下载,存储在存储器上之后再播
边缘检测及定位技术在图像处理中占有重要的地位和作用,随着机器视觉技术在检测和测量中广泛深入的应用,人们期望能从图像信息中获取更为精确的物体的尺寸和位置信息,像素级
学位
随着LAMOST大型观测项目的开展,每个观测夜将获得上万条光谱。天体光谱蕴含着天体的重要信息,因此光谱分析在天体研究中占有重要地位。由于天文界对宇宙的认识还比较有限,LAM
随着计算机信息处理技术水平的不断提高及计算机应用领域的日益广泛,对于解决汉字教学中错字和古籍整理中的异体字等集外汉字的计算机处理问题的需求日益强烈。目前计算机还
本文是基于自己学校现状自主研发的网上办公系统(WebOffice)。为了适合本校的各项工作流程,本校计算机专业同仁共同努力研发出具有特色的学校网上办公系统。通过网上办公系统
空间数据挖掘就是从空间数据库中抽取隐含的、以前未知、潜在有用的知识的过程,其应用涉及到国民经济与国防军事的各个方面,如地理信息系统GIS、气象领域、远程遥感、交通控制
学位
传统的数据库信息安全研究主要集中在如何进行防御上,如认证、加密、访问控制、防火墙、入侵检测等,但并不是所有的攻击都能有效的被抵御,对于内部攻击更是无能为力,而且传统
数字水印的嵌入技术基本上可分为两类:时域法和频域法,时域法就是直接改变图像像素的灰度值,如直接4bit替换法,既是直接用秘密图像像素值的高4bit去替换载体图像像素值的低4b