基于地理-社会-评论关系的典型化兴趣点推荐方法

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:wuming66666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前的兴趣点推荐方法大多利用兴趣点的位置信息和用户的社交关系提升推荐质量,但忽略了用户对兴趣点评论信息的重要性,实际上评论信息对用户做出选择至关重要;此外,现有方法推荐的兴趣点之间通常比较相似,彼此间不具有差异性和代表性。针对上述问题,本文首先融合了兴趣点的地理位置信息、用户社交关系以及兴趣点的用户评论文本,提出了一种新的兴趣点相关度评估模型,称为地理-社会-评论关系模型,并给出了一种新的评论文本相似度度量方法。根据兴趣点之间的地理-社会-评论相关度,提出了基于谱聚类的兴趣点聚类方法和基于概率密度估计的兴趣点典型化选取方法,以便从不同聚类中选取一个具有代表性的兴趣点。在此基础上,采用概率因子模型来拟合用户访问兴趣点次数矩阵,从而对典型化兴趣点进行个性化排序。实验结果表明,本文提出的地理-社会-评论关系模型对兴趣点的相关度评估更为合理,提供的推荐结果在多样性和准确率方面都取得了更好的效果。另外,针对传统文本相似度评估方法存在的文本向量维度大、数据稀疏、未考虑单词语义与文本语法等问题,本文提出了两种用户评论文本相似度评估方法:(1)基于WordNet与字符串匹配的短文本相似度计算方法(WN-SS),该方法融合了词汇间的字符串相似度和语义相似度,充分考虑了语义信息,并在一定程度上解决了单词误拼问题;(2)基于LU-CNN的短文本语义相似度计算方法,该方法融合词向量和卷积神经网络,通过对文本深度特征充分提取,解决了传统模型中丢失语义语法信息的问题。经实验测得,这两种算法与人工标注的结果更为相似,具有更高的准确性。该论文有图24幅,表16个,参考文献55篇。
其他文献
非均衡数据场景在现在的大数据处理,机器学习任务中十分常见。标准的机器学习算法一般都是以样本数据分布大致均匀为前提建立的,然而当样本数据分布不均衡时,算法的准确度会
当今计算机软件面临的安全防护挑战主要集中在内存相关的溢出攻击上,为了绕过“数据段不可执行”等经典防御机制,入侵者往往会选择代码复用的方式实现攻击意图。面向返回编程
近几年来,随着全球经济形势的日益严峻,企业在劳动力和资源方面的竞争逐步升级,越来越多的企业向着科技进步,创新型管理的低成本、高效率、高质量、注重环保的精益发展模式转变。生产线优化逐步成为制造企业转变的主要方法,具有投资少、效果好的特点。A公司作为电流互感器制造企业,处于产业链的中间环节,不仅受到上游成本和下游价格的双重压力,还面临市场反应慢、生产周期长、交货不及时等问题。因此对A公司生产线进行优化
人脸识别技术是指利用计算机分析人脸图像,提取有效的人脸描述特征进行身份鉴定的技术。人脸图像受到表情、光照、姿势、遮挡等因素的影响时,传统的人脸识别技术不能快速有效地对人脸图像进行识别。稀疏表示是近年来人脸识别中一种备受关注的主流理论,该理论在样本数量较多的情况下对光照、噪声、遮挡具有一定的鲁棒性。为了在训练样本不足的情况下提高稀疏表示理论的鲁棒性,本文对基于稀疏表示理论的人脸识别算法加以改进,主要
卟啉和席夫碱都是功能性含氮有机配体,在材料、医学、催化等领域应用广泛。通过配体的结构修饰调控其金属配合物的结构和性质,进而扩展其应用是合成化学的重要课题。本论文分
消费电子设备的逐渐普及与日常生活的各种需求都给视频压缩技术不断提出新的挑战。可视电话、远程教育、远程医疗、视频直播、数字图书馆、交互式视频游戏等等都已经十分常见
信息素养是科学研究和知识创新的基础,是高素质和创新型人才的必备素养。信息素养教育在高校人才培养中发挥着重要作用。高校图书馆是学校的文献信息资源中心,是为人才培养和科学研究服务的学术性机构,拥有丰富的文献信息资源和专业的馆员队伍,承担了信息素养教育的主要职责。信息素养教育在新的信息环境下有了新的要求,信息素养教育内容由信息的获取和利用向“数据素养”、“科研素养”和“创新素养”拓展。高校图书馆通过信息
互联网经济一直是推动经济增长的重要动力,国家一直鼓励支持互联网企业的创新与发展,可以说互联网企业不但能够成为国家重要战略的一部分,而且可以为普通百姓提供更加便捷的
科技领域视频是创新技术和科普知识的产生和传播的重要载体之一,但是绝大部分视频数据都需要进行处理,才能形成可传播的知识。科技领域视频文本的自动标注并分类对检索科技领
通信技术日益发展,目前的第五代移动通信(Fifth Generation of Mobile Communication,5G)已经开始普及。与可打电话的2G、能够上网的3G、满足移动互联网用户需求的4G相比,新一代的5G拥有三大特性:大容量、高速率、低延迟。得益于这些优势,越来越多的设备可以轻松连接到通信网络之中。但是,随着设备数量的增多,海量的设备遍布在人们生活的各个角落,如何才能确保设备之间