个性化搜索中用户兴趣挖掘技术方法研究

被引量 : 0次 | 上传用户:jueduizhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统信息检索在一定程度上可以满足用户信息需求,但是,同样的查询对于不同时期、不同背景、不同领域的用户,他们搜索意图和目的是不同的。个性化搜索引擎针对不同用户,提供个性化服务,个性化搜索是一个重要的研究领域。如何有效识别用户兴趣偏好类别是一个具有挑战性的研究课题;能够有效识别用户兴趣偏好是个性化服务的关键技术;用户兴趣偏好挖掘需要解决的问题包括收集用户信息、如何收集这些信息、收集到信息如何组织、表示和存储;如何在收集到的信息基础上,采用合理的技术和模型进行分析和处理以获取用户检索偏好;用户的信息和兴趣如何自适应的跟踪、学习与更新等问题。本文提出了一种用户兴趣模型来学习用户的兴趣偏好算法,通过用户搜索历史分析用户兴趣类别偏好,该算法的主要特点是不仅可以有效识别普通类别用户兴趣偏好,同时可以有效识别兼类的用户兴趣偏好。本文对个性化搜索中用户兴趣挖掘技术方法进行研究,提出基于查询扩展技术和搜索历史自动挖掘用户兴趣方法。本文的算法思想是用户输入查询串到搜索引擎,由于查询能够表明用户搜索的意图,那么,本文通过查询进行挖掘用户兴趣类别,但是有些查询串较短,或者出现查询词歧义等问题。考虑到用户通过搜索引擎输入查询会返回一系列文档内容,将相关文档通过文本分类技术进行分类,有效识别文档的类别。然后,通过文档关系将查询映射到对应类别体系,进而识别用户兴趣类别偏好。进而能够更清晰识别用户兴趣类别偏好,同时通过查询扩展技术有效解决查询短和查询兴趣类别属于兼类的问题。由于用户兴趣随时间是变化的,用户兴趣模型的具有高效的更新学习机制,动态跟踪了用户兴趣变化趋势。用户兴趣模型的输入是用户查询及其浏览的相关文档,输出是用户兴趣类别,即用户兴趣类别偏好程度,简称兴趣度。该用户模型优点是克服了数据稀疏、类别偏差、扩展性差等缺点。本文的研究方法为个性化搜索排序以及信息推荐等技术提供了良好基础。
其他文献
目前商品混凝土养护的问题很多,必须认识到混凝土早期养护的重要性,保证商品混凝土进行湿养护和二次抹压的必要。商品混凝土养护的关键问题是可以控制的。对混凝土进行适当地
目的:探讨肌电图在腰骶神经根压迫性病变的诊断中的应用价值。方法:选取临床诊断为腰椎间盘突出症合并腰骶神经根压迫患者58例,进行神经传导速度测定、F波及针肌电图检查,并
本文对色拉酱在不同条件下的贮存效果进行了研究。试验表明:色拉酱在4~10℃条件下可安全贮藏五个月。60Coγ30万拉德的辐照对色拉酱无不良影响。室温贮藏样品不发生微生物引起的腐败变质
2002年1月美国总统乔治.W.布什签署了名为"不让一个孩子掉队法案(简称NCLB)"的教育法案,它旨在兼顾教育的效率和公平。然而在实际的操作中,该部法案的实施却出现了一系列的问
随机抽样一致性算法RANSAC(randomsampleconsensus)是在计算机视觉领域内应用最广泛的Robust估计算法之一,但是RANSAC算法计算效率较低.提出一种基于模型参数预检验的快速RAN
一、体能的概念体能是指人体通过先天的遗传和后天的训练获得的在形态结构方面、在功能及其调节方面、物质能量的贮存和转移方面所具有的潜在能力以及与外界环境结合所表现出
目的 探讨多时相头CT血管造影(CTA)在缺血性脑卒中侧支循环影像检查中的应用价值。方法 收集2015年12月至2017年7月收治的62例缺血性脑卒中患者为研究对象,患者入院后均完成CTA
本文从企业内部控制角度来分析三鹿集团失败的原因,按照企业内部控制的要素(控制环境,风险评估,控制活动,信息与沟通,监控)来阐明三鹿集团在这些环节上出现的问题,最后得出总
<正>日前,一份来自韩国媒体的报道显示,三星正考虑收购传统芯片设计厂商AMD。韩媒指出,在最终三星和AMD召开发布会证实宣布消息之前不会有太多细节。早在2007年的时候,三星一
我国的金融业即将融入全球竞争之中.面对世界各国集银行、保险、证券于一身的金融企业的激烈竞争,我国现行的分业经营、分业管理模式下的金融业在生存和发展上将面临巨大的威