个性化推荐和搜索中若干关键问题的研究

被引量 : 30次 | 上传用户:lovepc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对用户自身在实际需求,偏好特点和行为方式等方面的不同,个性化信息服务致力于满足用户个体的差异化信息需求。较传统的通用服务,个性化服务因为能够更好地表征、迎合用户的个性化偏好而受到了普遍的认可,个性化的相关技术也成为近年来一个新型的热门研究课题,受到了学术界和商业机构的广泛重视。本文围绕个性化技术中最为核心的两项,个性化推荐和个性化搜索中的若干关键问题进行研究、讨论,论文的主要工作包括以下内容:1.研究、探讨了协同推荐问题,在遵循基本协同的基础上,我们希望探寻、讨论新的有效推荐的研究思路。以此为基本出发点,本文提出了一种基于自低至高两个层面的多个BP神经网络进行项目评价预测的方法(Two-Level multiple Neural Networks-based Collaborative Filtering Recommendation Algorithm,简记为TMNN-CFRA)。两层面的多个BP神经网络协同工作,高层面BP网反向误差传播直至低层面多ANN进行网络权值修正,以此为基础借助用户评价等特征前向给出项目推荐预测。美国评测集Movielens上的实验评测验证了TMNN-CFRA算法的可行性和有效性。2.协作过滤推荐算法具有“冷启动”问题。“冷启动”问题的根源在于评价信息过于有限,推荐系统难以准确挖掘出用户偏好。本文提出了借助用户的模糊反馈信息改善冷启动推荐性能的基本研究思路(具体涉及2个算法)。对于项目推荐中棘手的冷启动问题可以从用户模糊反馈信息挖掘的角度展开研究,相对于完全地基于有限的项目评价本身的相似度测量改进等传统方法,这是一个相对比较新的研究基点,对于解决冷启动问题具有重要的意义。我们采用两个独立的算法研究、探讨了模糊反馈数据对于冷启动推荐的意义。其中,算法1采用后向传播的神经网络方法直接就模糊反馈数据本身进行学习,从“相对优劣”中挖掘用户对项目属性等的兴趣偏好;算法2对数据进行基础性变换,巧妙地从原本不具有可比性的模糊反馈数据和项目评价信息中抽取用户之间的相似度,以此为基础进行推荐预测。一般意义上而言,协作分析范畴的算法2较基于内容分析范畴的算法1具有更好的性能水平,初步验证了模糊反馈数据在冷启动阶段的积极意义。3.Web信息的爆炸式增长极大地激发了用户对于个性化的领域搜索服务的需求。本文提出并研究、实现了个性化的垂直搜索算法(Personazlied Vertical Search Algorithm,简记为PVSA),该算法以领域特征为出发点,借助领域主题偏好向量、领域元数据权重因子、检索名词差异化策略等4个策略有效挖掘、表征用户的领域个性化偏好,以此为基础生成基于用户偏好的垂直搜索算法,PVSA算法在个性化的领域搜索问题上取得了良好的效果。4.自动化的服务组合、服务推荐等是语义Web研究的重点。不同于完全地依赖本体进行服务推荐的思想,本文从统计学角度出发,提出了基于用户偏好的服务推荐算法(Preference-based Service Recommendation Algorithm,简记为PSRA),该算法首先基于Web服务语义进行无效后继服务过滤,然后基于职业本体、语义距离等针对人口统计学要素进行相似度计算,接下来融合人口特征至推荐评价,相对有效地给出综合人口统计学要素和评价信息的新的轻量的用户相似度度量,最后基于综合人口统计学要素和评价信息等特征的用户相似度给出满足用户个性化需求的后继推荐服务输出,PSRA在个性化服务推荐问题上取得了良好的效果。
其他文献
通过建立种质资源库和对比试验林,在一个生长周期内,对引进的各柳树品种(品系)的生长量、形态、抗性等指标进行记录分析,结果表明,旱×白606,蒙×旱330表现出较强的生
目前,国际化成为世界文化交流的总体趋势。很多好听的国外歌曲逐渐传入中国,并深受人民群众的喜爱。在歌曲中,歌词属于一种文体。通过分析和研究英语歌曲歌词的文体特征,我们可以
自1988年大陆第一条高速公路建成通车以来,由于我国高速公路的建设不断加块,通车里程不断的增加。由此带来的影响就是高速公路交通事故率也随之猛增,因为大雾引起的高速公路
目的分析子宫内膜腺癌患者血清和癌组织中催乳素(PRL)的表达情况。方法选取38例健康女性志愿者作为对照组,42例子宫内膜腺癌患者作为观察组,应用化学发光免疫法测定血清PRL水
薄壁轻钢结构住宅作为一种高科技、高性能、高效率、大规模、低能耗的环保住宅,符合发展低碳经济和节能省地新型住宅的要求,且薄壁轻钢结构住宅建筑带动了我国住宅产业化的发
随着信息技术的发展,未来战争的主旋律将是信息战,并且将会逐渐成为未来战争的重心。而作为目标信息主要探测设备的雷达也面临着前所未有的挑战。单部雷达的探测数据难以满足
我国正在积极的实现向绿色转型,积极的推进建设低能耗、低排放体系为特征的产业体系。据统计在基础设施建设当中仅住宅能耗就占全国总能耗的20%左右,同时在建设当中产生了巨
以电子信息媒介为中心的后媒体时代,改变了信息的传播和接收方式,同时人们的审美意识也在变化和发展。面对新时代的审美改变,字体设计正在突破传统设计理念的束缚,对设计语言
针对传统电机调整设计专家系统的缺陷。提出一种新型的,基于神经网络推理机制的电机调整设计专家系统模型.该模型将神经网络技术与专家系统技术、优化技术紧密结合,采用并行推
针对传统纸制技术资料在导弹测试及故障分析中存在的诸多缺点,提出了采用基于W eb的导弹测试故障辅助诊断IETM设计方法,将高复杂性故障诊断工作变成易行的、可视化的流程工序