基于用户上下文感知的软件服务推荐方法

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:smilezhangnan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“云大物智移”等新一代信息技术的迅猛发展,以及万物皆服务理念的快速普及,智能手机在人们的生活中变得越来越重要。相应的,移动应用市场中的软件服务(即移动端应用软件)数量也在持续增长,而在从这样巨大的候选软件服务集中进行选择时,用户往往无法便捷地找到合适的软件服务。因此,如何为用户高效地推荐合适的软件服务已经成为了推荐领域的热点问题。为了满足用户便捷地找到合适软件服务的需求,很多学者都对服务推荐问题进行了探索。但目前的经典推荐方法,普遍存在推荐结果准确率不理想、用户个性化特征考虑不全以及冷启动问题难以缓解等问题。为此,本文从移动应用市场运营者的视角,在推荐软件服务的过程中充分感知了用户的上下文信息,进而高效地实现了软件服务的个性化推荐。本文主要包括以下内容:(1)通过收集用户的基本信息、评价信息、下载信息等上下文,从基本属性、行为属性和心理属性三个维度对用户进行画像。其中,对于长文本的评论信息,利用DT-kmeans算法进行标签聚类。接着,计算用户画像相似度,并将其与用户评分相似度结合,提出一种融合用户画像的协同过滤算法。与经典协同过滤算法相比,该算法推荐结果准确性更好,也能更好地缓解冷启动问题。(2)目前,研究者大多将通用知识图谱或领域知识图谱应用到服务推荐领域,但这样导致对用户的个性化特征考虑不足。为了解决此问题,本文首先通过自然语言处理(Natural Language Processing,NLP)技术对软件服务领域知识图谱进行语义抽取;然后通过同义词林对用户画像中的用户特征词进行扩充并与知识图谱中的节点进行语义匹配;最后通过知识图谱路径对结点进行扩充,利用Trans方法对知识图谱关系进行补充,形成具有用户特征的个人知识图谱。(3)将基于项目实体的相似度、基于知识图谱实体相似度以及基于用户评分的相似度相结合,提出一种充分的考虑了用户上下文信息的融合知识图谱的混合推荐方法。该方法在推荐结果的准确率和新颖度方面都优于经典协同过滤方法以及仅融合用户画像的推荐方法。本文通过建立用户画像,并基于构建的用户画像对领域知识图谱进行结点选择、剪枝、重连接等操作形成具有用户特征的个人知识图谱,进而为用户推荐软件服务。通过实验验证,本文所提方法缓解了经典协同过滤算法中存在的冷启动问题,在推荐结果的准确性和新颖度方面都有所提升。
其他文献
近年来,随着三维技术的不断发展,三维模型逐渐走入了大家的视线中,在传统制造业、机械自动化、自动驾驶、虚拟现实(VR)等领域扮演着重要作用。大众在检索信息时也不只依赖于传统方式,如文字、图像等,作为视觉信息的主要载体之一的三维模型也逐渐被关注。因此,如何能在大量数据中找到理想的目标模型成为了计算机视觉领域的热门课题。由于草图是人脑意识的一个直观表象,因此基于草图的三维模型检索方式既简单,又能够清晰地
学位
互联网技术的跨越式发展和信息的交互共享使得代码抄袭情况以各种各样的方式出现,而涵盖整个抄袭研究领域是非常困难的,所以本文重点对学术界中发生的代码抄袭问题进行检测。本文针对C语言源代码作为研究对象,并对其进行代码相似度检测研究,得出的评判结果辅助后期人工评判。本文首先提出了一种结合抽象语法树(Abstract Syntax Tree,AST)与Token的代码相似度检测方法。首先,将源代码进行预处理
学位
随着城市交通拥堵问题日益显著,年轻人更多选择摩托车作为出行工具。头盔作为摩托车骑手必备的防护工具,对保护骑手生命安全的重要性不言而喻。研究利用计算机视觉技术检测摩托车骑手是否佩戴头盔具有重要的现实意义。深度学习技术的快速迭代推动了摩托车头盔佩戴检测相关研究的发展,但现有检测算法仍存在很多不足。首先,现有方法大多是针对单个骑手进行头盔检测,针对多个骑手的研究方案较少;其次,在交通拥塞和摩托车密集等复
学位
随着人工智能的发展,计算机处理数据、分析数据的能力呈指数级增长。医学数据具有特殊性和复杂性,要想挖掘出医学数据背后潜在有用的信息,对于算法的速度与精准度都有着更高层次的要求。为了提供更加科学有效的医疗服务,本课题从特征工程、梯度下降优化算法以及预测模型这三个方面进行研究,建立心血管疾病风险预测模型辅助医生决策。首先,在特征工程阶段,构建强特征向量并且融合随机森林进行特征选择工作。该阶段基于疾病预测
学位
随着计算机视觉的不断发展,三维扫描技术日新月异,伴随而来的是三维模型的数量与日俱增。一个工程往往是由来自不同学科、不同领域的工程师共同设计的,这些人只具备自己领域的专业知识,因此他们只使用自己领域的三维模型进行设计。当设计新产品时,重用已有的模型可以大大提高开发的效率,并降低开发成本。于是,如何高效、准确地对这些三维模型进行分类成为一个亟待解决的问题。本文主要研究了三维模型体素化方法以及全局形状分
学位
<正>博物馆一线展陈人员都深知一个道理:绝对没有一个时刻,展览是彻底完成的。开展前一晚的展厅一定能看到工作人员最后的忙碌,并不是准备的太晚,也不是时间节点没卡准。只是在展览不断实现的过程中,一定有更多的灵感不断闪现,更多的思路不断更新,也一定有更多的细节被不断怀疑、不断推翻。在展览工作进程中,似乎前置性的研究工作一直不是必需的,无论前置性研究的结果如何,大部分展览都会如期推进。
期刊
以草图为输入的三维模型检索便于用户表达搜索需求,已成为一个研究热点。利用草图检索三维模型已经在图形学、图像检索和计算机视觉等领域得到了广泛的关注。草图相较于其它用于检索的手段有着巨大优势,如直观性,便利性等,但是它仍存在着一些缺点,如草图只是三维模型一个视点下的粗略描述,具有很高的抽象性和主观性。而且草图和三维模型为非同源数据,二者存在巨大的域间差异。这些导致了目前的草图检索准确率低。为解决这一问
学位
词义消歧是自然语言处理领域的一个常见问题。词义消歧问题的目的是从歧义词的多个词义列表中识别正确的词义,消歧模型往往需要根据目标词汇的上下文来作为判断依据。词义消歧影响到自然语言处理中很多任务的性能,包括机器翻译、文章分类、情感分析、语音识别等。消岐准确率不高是自然语言处理领域急需解决的问题。为了解决消歧准确率较低的问题,本文使用transformer模型、LSTM模型、注意力机制来构建消歧网络。在
学位
宫颈癌原发于子宫颈部,是女性生殖道中发病率最高的恶性肿瘤。宫颈癌细胞病理辅助诊断系统可以实现宫颈癌的早诊断、早治疗,从而控制病情进展,改善预后。虽然该系统临床效果不错,但依然存在很多不足。尤其是宫颈细胞图像存在一些问题,影响了系统诊断准确率的提升。首先,系统中硬件滤光片的使用会使宫颈细胞图像丢失部分颜色,从而会改变图像中细胞原本的颜色,并且降低图像各部分的对比度,给人工阅片增加困难,进而增大漏诊、
学位
滚动轴承是现代旋转机械设备中最重要的部件之一,在机械运转中起着重要作用,并广泛应用于现代工业设备当中。据统计,近一半的机械故障均是由于滚动轴承故障而造成的,轴承故障使得机械设备无法正常高效运行,安全性降低,使用寿命缩短,及时的预防和诊断滚动轴承的故障也将大大的减少旋转机械的故障,减少安全事故和挽回经济损失。因此,研究和开发滚动轴承的故障诊断方法具有十分重要的意义。在现实场景的工业应用中,因为工作条
学位