论文部分内容阅读
在这个信息爆炸的时代,无论是信息需求者的用户还是信息生产者的媒体或商家都受到海量信息带来的新挑战。针对这个问题,各大电子商务平台纷纷引入个性化搜索和信息推荐技术。它能够根据用户预设的参数或者从网页访问记录中通过数据挖掘得到用户兴趣和使用偏好,帮助用户获得关注的信息,以解决互联网的信息过载问题,从而为用户提供符合其兴趣偏好的产品。理想状态下,这样的推荐系统能够大大地降低用户的搜索成本,为用户提供高效的个性化服务,从而提高用户对购物的满意度。传统的推荐系统根据用户的历史购买记录及其与用户兴趣相关的其他用户的购买信息提供产品推荐方案和意见。这种传统的推荐系统是基于协同过滤的算法,它考虑用户兴趣的相似性和用户对产品的偏好。但是,没有考虑到用户兴趣的动态性和用户搜索行为偏好的差异性。而且,传统的信息挖掘过程必须追踪用户的个人信息和购买记录,给用户带来隐私泄露的隐患,使得个性化的推荐服务往往没有达到预期的效果。因此,本论文针对上述现状和问题,在动态兴趣和复杂行为理论基础上,研究在基于用户动态兴趣和变权隐私信息保护的推荐算法,以实现跨平台的交叉推荐。利用用户的在线行为轨迹来估算用户搜索行为偏好和识别用户的动态兴趣,并且考虑变权安全多方隐私保护的推荐实现,以便有效改善现有推荐系统在用户稳态偏好和短暂行为偏好方面的不足以及用户数据收集成本高的问题,使推荐的结果更符合用户实时的个性化意图。具体的研究架构如下:首先,为了提供更高质量的个性化服务,需要构建更为细致、准确的用户模型,本论文从动态兴趣的获取视角,建立基于实时兴趣的图谱和用户动态兴趣的模型,然后对用户的行为兴趣进行相关性分析和聚类分析。接着,提出用户在网页的停留时间长短来推算用户兴趣度的“浏览时间评估法”,以及用户浏览关键词的速度来识别兴趣度变化的“浏览速度评估法”,并用实验的方法对上述方法进行验证。其次,利用安全信息论和秘密共享体制等相关理论作为基础,基于行为经济学非理性的效用计策分析中的体验效用、决策效用和预测效用来解释个体对隐私偏好具有“风险厌恶”的基本特征,以及货币效用函数曲线凹形使得对于额外的需求个体在不同情况下有不同的边际效用,设计安全多方计算的隐私信息共享机制,并分析每种算法的计算复杂度,实施的复杂度和安全性以及决策者的支出(搜索成本/决策成本),利用算法设计原理来探索出低复杂度且保证安全性的均衡点的共享机制。最后,本论文整合跨域跨平台的用户兴趣,对电子商务跨平台服务进行个性化推荐研究。探索跨平台服务模式下各平台之间的信息共享模型的形成机理,研究不同类型用户最终购买决策,以更好地实现跨平台的交叉推荐。本论文的主要创新性点是在用户搜索和浏览行为的基础上,通过实时用户查询和搜索交互,来提取用户真实的和潜在的购买兴趣,从而辨别用户的动态需求,和提高个性化服务的质量,具体将其归纳为以下三个主要贡献:(1)把用户的动态兴趣、兴趣递减规律和遗忘曲线函数引入到推荐系统的研究领域中,提出基于驻留时间的兴趣度估计方法和基于浏览速度的兴趣变化估计方法来识别用户的动态兴趣和搜索行为的偏好,实时捕捉和识别用户的兴趣,更加精准地为用户提供更好的决策方案和策略。(2)考虑在动态数据挖掘中的用户隐私保护问题,并提出变权安全多方计算的隐私保护推荐算法。然后,在Karmarkar算法的基础上,改进在大数据矩阵的计算成本和计算速度问题,以达到精确的个性化推荐的同时可以有高效的隐私保护。(3)提出基于隐私保护的跨电子商务平台的复杂网络推荐模型,实现碎片化“跨平台资源”的交叉推荐与运用,满足和提高的电子商务的服务价值,为后续的研究奠定理论和实践的基础。