基于异构图的排序与推荐算法研究

被引量 : 0次 | 上传用户:lfwvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的日益普及,特别是移动互联网的“爆炸式”发展,互联网上的资源日益丰富,主要表现在两个方面:1、数据量呈现指数式的增长;2、数据来源的不断丰富,导致数据的类型日益增多。如何从多样化的海量数据中挖掘有价值的规律和内容变得越来越重要,吸引了众多来自学术界和工业界的学者的浓厚兴趣。随着人工智能的不断发展,尤其是机器学习技术的日益成熟,利用机器学习的方法从这样的海量数据进行挖掘已经变成了非常流行,且行之有效的方法。排序算法和推荐算法是从大数据中挖掘有价值的内容的两种常用的算法类型。本文的排序算法指的是搜索中的排序算法(ranking algorithm),在用户给出查询内容以后,把结果按照与查询内容的相关度排序,然后返回给用户。推荐算法则是根据用户的喜好,预测用户对物品或是信息的打分。排序算法和推荐算法都可以将用户想要获取的信息提供给用户,帮助他们找到所求,正是这样的应用价值,不仅使它们在工业界得到了广泛应用,在学术界的也受到了很大关注。本文的工作是基于异构图的排序和推荐算法研究。这类算法不仅可以利用机器学习的方法从数据中挖掘有价值的信息,而且通过使用异构图,还可以在设计算法时考虑不同来源的数据,使用更加丰富的信息,从而提高方法的效果。主要进行了两方面的研究:1)一种基于异构图的自反馈半监督学习图像重排序算法。基于图的视觉重排序方法由于出色的性能,吸引了很大的关注。在这类方法中,首先构建图,其中图的顶点是图片的视觉特征,边的权重是图片之间的视觉特征的相似度,然后运行一些算法来得到图中各顶点的排序得分。这类基于图的方法通常基于排序得分的一致性假设:相邻的顶点(边之间的权值小)有相近的排序得分。但是对于多媒体检索,例如图片搜索来说,仅仅使用单一模态的数据(例如视觉特征)的效果不是很好。所以本文提出的方法同时使用多种模态特征的图像数据,包括文本特征和视觉特征。基于下面的基本假设来进行建模:图像的视觉特征和文本特征只是图片不同角度的表现,它们在语义上是相似的,也就是说,图像的视觉特征和文本特征只是图像在不同空间的表现,它们的排序得分应该是相近的。基于此,提出了一种基于异构图的自反馈的半监督学习算法来进行图片的重排序,具体来说,首先使用视觉特征和文本特征来构造一个异构图;然后在异构图上运行一个带正则项的自反馈半监督学习算法来传播排序得分;最后根据学习的结果进行图像的重排序。2)一种基于异构图的融合隐式社交关系的混合推荐算法。最近越来越多的工作开始研究如何利用社交关系来提高协同过滤推荐(特别是矩阵分解)算法的性能。由于显式的社交关系并不总是容易获得的,一些作者开始研究在矩阵分解中使用隐式的社交关系。不过相关的工作只是利用了传统的皮尔逊相关系数和余弦相似度函数来挖掘隐式的社交关系,比较简单。本文的方法是首先构建包含数据库中丰富信息(包含用户,物品信息)的异构图,然后使用随机游走的方式来更好的挖掘隐式社交关系。基于使用随机游走方法挖掘的隐式社交关系,再结合基于记忆的推荐和协同过滤算法,提出了一种基于异构图的融合隐式社交关系的混合推荐算法。上面提到的两种算法在公开的数据与经典算法进行对比实验,对算法的有效性进行了验证。此外,排序和推荐算法在互联网行业中有广泛的应用,因此本文的研究内容具有比较好的应用前景。
其他文献
朱天文是华语文坛上最优秀然而也是最难解读的小说家之一。从都市书写、身体书写与语言书写三个方面深入探讨,由此发现其一以贯之的后现代抵抗姿态。朱天文书写的台北是都市
通过对公司治理、信息披露质量与知情交易之间关系的检验,发现股权集中导致的协同效应及壕沟效应同时存在,董事会规模及独立性对信息披露质量及知情交易的影响不明显,高管货
有机磷农药中毒是基层医院急诊常见的急症,病情危重多变,病死率高,及时有效的治疗与护理是抢救成功的关键。病人早期出现呼吸道大量分泌物,肺部布满湿性哕音,出现肺水肿,气体交换不
功能语法中小句的及物性系统可以用来表现语言使用者对主客观世界的认识和反映。本文作者通过对文本小句及物性系统的各个过程及其参与成分的分析,描述以失衡的方式突出的语言
论述了精准农业的发展现状及意义,探讨了我国精准农业的发展步骤和研究应用重点.
实体与关系提取作为信息抽取领域的重要研究课题之一,其主要任务是从非结构文本中抽取出命名实体并判断其类型,以及识别一对命名实体是否存在联系并判断其关联类型。高精度实体与关系提取模型的构建,既是知识图谱、智能搜索、自动问答等自然语言应用的基础,同时也能为金融、医疗、电商等垂直领域做出贡献。随着数据时代的迅猛发展与网络信息的飞速扩张,人们对海量数据的信息抽取有了更为迫切的需求,不同于较难作用于大量文本数
<正>我感到今年我们论坛更加聚精,更加聚焦,更加聚力,更加聚气。聚精体现了我们对论坛的关注度,无论是国际还是国内的,还是各个方面的代表,都更加关注"一带一路"建设当中的社
为了实现注汽锅炉蒸汽干度的高质量控制,提出一种蒸汽干度控制方法.该方法采用基于T-S模糊模型的模糊预测控制获得主回路控制量,来自水流量的前馈控制量与主回路控制量相乘,
<正>语言表达与运用题是高考的试验田,新题型层出不穷,对学生的能力要求很高。笔者认为逐渐受到命题者青睐的"评论"这一题型,能够很好地考查学生各个方面的能力,是一种不错的
随着医药、农药、材料等领域对含氟化合物日益增长的需求,发展向有机分子中直接引入氟原子和含氟基团的方法受到了化学家们的广泛重视.近些年来,过渡金属催化的氟烷基化反应,