基于搜索历史的用户兴趣建模

来源 :复旦大学 | 被引量 : 0次 | 上传用户:hou189
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,人们对个性化服务的需求越来越高。而目前的搜索引擎在进行查询-文档匹配时,并没有针对不同的用户作相应的处理。对同一个查询词,不同用户得到的查询结果是相同的,即便他们的兴趣和背景有着巨大的差异。这使得这些传统的信息检索技术不能很好地提供吻合用户个人需求的搜索结果。面对海量的网络信息,如何抓住用户的个人兴趣,为用户提供个性化服务已经成为当前Web技术研究的一个重要主题。个性化服务中,建立用户兴趣模型是至关重要的步骤。兴趣模型的好坏直接影响了个性化服务提供的准确性和有效性。用户兴趣建模的目标是从用户的历史记录数据中挖掘出有价值的数据,并用合适的模型来进行表示。本文的工作主要包括:·本文介绍了用户兴趣建模的研究现状,详细介绍了一些常见的模型计算方法,指出了现有方法的局限性。·提出了基于搜索历史的用户兴趣建模方法,通过从搜索引擎的搜索日志中获取用户信息进行兴趣建模。·提出了综合最近检索词向量,历史检索关键词向量,文档中心向量和类别特征树的用户兴趣模型。在模型计算过程中,根据搜索行为本身的特点,在传统的中文分词和文档向量模型作了改进。在通过检索分类计算类别特征时,采用了分类器和自聚类相结合的分类方法,得到的分类结果在互联网语料中更加准确。·提出了基于用户兴趣模型的个性化检索方案,包括检索词扩展和网页排序等。
其他文献
现在浏览器已经成为了电子邮件、网上银行、电子商务等众多网络应用的主要入口。但是浏览器的应用场景面临两大安全威胁。首先,键盘记录器是网络应用账号密码的最大安全威胁。
计算公路网络中两点之间的最短路径问题,由于其在很多地图服务和商业导航系统中有着广泛的应用,最近重新引起了大家的关注。当前的加速方法主要是基于预计算技术,大致可以分
随着半导体技术的发展,多核处理器逐渐取代单核处理器,成为新的工业标准。如何充分利用多核资源提供的计算能力,同时屏蔽底层细节以简化编程难度,是现今编译技术的研究热点和难点
传统的Web服务大多采用基于RPC交互模型,该模型在相对封闭、小的应用环境中取得了较大成功,但用在分布、开放的Web环境中带来了一些问题,如紧密耦合、接口复杂、可伸缩性差,
传统的互联网的搜索技术日趋成熟,而移动场景下的搜索技术则处于起步发展阶段。传统互联网搜索多为通用搜索,而在移动场景下,搜索更趋于垂直化,如本地生活搜索等;同时,移动终端固有
火力发电厂的存煤量是核算发电成本的一个重要的经济指标,而存煤量的盘点是困扰火电厂的难题,早期人们用推煤机将不规则煤堆整形,然后用尺子丈量,计算出煤堆的体积,再乘以煤的比重,得到存煤量,但是这种方法测量结果误差较大。随着科学技术的发展,出现了一些盘煤系统取代了人工盘煤,但构成比较复杂、安装复杂,成本较高等,不能适应复杂的煤场环境和不断变化的需求,因此,为了准确的获得火电厂存煤量,节省发电成本,火电厂
随着智能设备数量日益增加和功能日益增强,汽车已成为人们大量使用个人设备的场所,加之各汽车制造商对于汽车电子化,智能化的努力,汽车早已不只是一个简单的交通工具,而变成了流动
随着计算机硬件技术的不断发展以及虚拟化技术的日臻成熟,越来越多的公司和企业采用虚拟化技术作为资源管理方案,提高服务器的利用率和复用率。同时在一台物理机上能够部署更多
随着数据量的不断增长,关系数据分析系统面临着可扩展性和查询性能的挑战,许多查询任务都必须通过使用大规模的集群实现并行处理才能获得较好的查询响应时间。面对大数据处理的
随着服务计算和云计算的发展,具有相同功能属性、不同非功能属性的web服务出现了爆炸式增长,传统的web服务选择方法在应对海量服务数据时,无论是在性能还是效率保证方面,都面临着