推荐系统模型与学习算法研究

被引量 : 0次 | 上传用户:mimidong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐是指根据用户的兴趣特点和历史行为,为用户推荐用户感兴趣的信息或商品。因其具有重要的理论价值和广泛的应用前景,推荐算法的研究一直备受关注,它与许多机器学习和数据挖掘领域的基本任务(如分类、聚类等)密不可分。近年来,电子商务以及各种在线服务和应用的蓬勃发展对推荐任务提出许多新的挑战。例如,新用户不断涌现,传统基于分析用户历史行为的推荐算法无法为缺乏历史记录的新用户提供有效推荐;网络数据冗余度高,除了推荐结果的精度要求,多样性也成为影响用户体验的重要方面;网络数据日新月异,同一时间不同地点的数据也存在巨大差异,传统推荐算法无法适应数据在时间空间上的动态性,难以为用户提供及时的个性化的推荐结果;此外,随着数据规模的不断增大,如何加速推荐算法也成为重要的挑战之一。针对这些新形式下的挑战,本文的创新点可归纳如下:多样化推荐算法:本文提出基于熵正则化因子的多样化推荐算法。我们在物品特征矩阵上定义熵正则化因子,熵正则化因子的几何特性使它可以自然地刻画一个物品集合的多样性;它的代数特性使得我们能够设计有精确理论上界的近似算法来求解目标函数,找到符合用户兴趣特点且多样化的物品集合。冷启动推荐算法:本文提出基于内容的组合式多臂老虎机模型,并将其应用到冷启动推荐任务中。与标准的多臂老虎机模型不同,这种模型考虑以特征向量表示的组合式老虎机臂。基于这种老虎机模型的冷启动推荐算法为新用户推荐物品集合,收集用户的反馈,不断优化推荐结果。动态数据模型:本文提出基于函数式狄利克雷过程的动态数据模型。针对网络数据在时间和空间上的动态性,我们提出可随任意协变量(如时间、空间等)变化的非参数话题模型。这一模型可用来对文本、图像等数据建模,提取随时间或空间变化的话题,可用来提高推荐结果的满意度。快速聚类算法:本文提出基于稀疏嵌入的快速k均值聚类算法。k均值算法是最重要的聚类算法之一,在推荐任务中应用广泛。在本文中,针对高维网络数据,我们设计了快速有效地特征提取方法,使得压缩后低维数据的k均值算法的解近似原来高维数据的k均值算法的解。我们从理论上严格证明了该快速算法的近似比,从而保证算法的有效性和广泛适用性。
其他文献
本文通过对当前民事"执行乱"现象和民事执行监督现状的剖析,指出检察院和法院在民事执行问题上的不同看法和冲突做法,同时结合新颁布的《民事诉讼法》中关于民事执行方面的规
我国老龄化问题越来越突出,老年人的医疗看护问题迫在眉睫。老年人面临的一个常见问题是易跌倒且跌倒常会造成严重后果。作为人体的一项重要功能,平衡能力对于预测跌倒和疾病诊
随着电子商务和物流行业的迅速发展,越来越多的供应商或零售商在原有实体店的基础上开设网上直销渠道。本文针对供应商侵入(supplierencroachment)问题和双渠道的库存管理问题进
金属线阵列媒质(wire medium)作为一种基本而又重要的人工电磁材料(metamaterial),在新型天线设计、亚波长成像等方面有着非常广泛的应用。准确有效的、适用范围广的均匀化等效模
世界上大部分的能量来自于化石燃料的消耗,比如像天然气,石油和煤炭。然而,众所周知,这些能源是不可再生的,而且它们的燃烧产物对环境和人是非常有害的,比如雾霾天气的产生。因此,需
本课题主要针对手机天线的窄频带现象进行研究。近年来,随着移动通信的发展,平面单极子天线的研究和应用倍受关注。移动通信系统对天线提出了兼顾宽频带、小型化、辐射效率高的
随着多媒体技术的快速发展,数字图像已经成为人们接受外界信息的主要来源,因此图像质量的优劣将直接影响人们对图像信息的的正确理解和判断,这在交通目标检测、医学成像等领域具
以雪皮莲蓉月饼为代表,比较了桑叶粉的添加量对月饼焙烤前后的外观色泽、营养活性成分、质构和风味成分的影响。结果表明:高温焙烤能明显增加月饼饼皮的亮度、绿色和黄色,引
个人所得税是政府再分配的重要手段,在调节居民收入差距方面具有重要作用。然而,我国现行的分类所得税制由于对不同所得分类计征,分别适用不同的费用扣除标准以及税率,往往不能全