基于语义类别的预训练兴趣点表征的可解释性方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wangkaidi58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球定位系统、移动设备和遥感等多种定位技术的快速发展,基于位置的社交网络(LBSN)日益普及,产生了大量的签到数据。从数据中挖掘有价值的知识对现实世界的应用至关重要。现有方法通常通过对这些签到进行建模,产生密集的兴趣点表征,然后再进行下游数据挖掘任务。然而,这些表征中的坐标没有任何有意义的解释,现阶段关于兴趣点表征的可解释性问题鲜少被学者关注,而这种不可解释性将对于下游数据挖掘任务性能的提升产生不利的影响。针对上述提到的关于兴趣点表征的不可解释问题,在这项工作中,本文提出了三个模型,通过具有语义的类别以使这些兴趣点表征具有可解释性,从而提高下游数据挖掘任务的性能。本文的主要工作包括:1.提出了一个名为“CEM”的类别感知的签到嵌入模型,以生成兴趣点的表征。CEM模型捕获了签到数据中的序列化模式以及兴趣点的语义类别信息,同时生成兴趣点和类别嵌入向量。2.提出了一个名为“XEM”的具有可解释性的兴趣点嵌入模型,通过使用具有语义的类别来解释兴趣点表征的每个维度来使得其表征具有可解释性。具体来说,我们将这些类别作为语义锚,并根据从CEM中学习到的嵌入向量来计算一个兴趣点和这些锚点之间的相似性。然后,将这些相似性分数作为其表征的数值,其中表征的每个维度都对应一个语义锚点(即一个类别),并且可以被解释为一个连贯且易于理解的主题。3.针对XEM中大量类别造成的高维度和冗余的问题,本文在XEM模型的基础之上,提出了一个名为“XEM-C”的基于类别簇的可解释性模型。该模型通过聚类将所有类别归为群组,并将这些集群作为语义锚,同—类别簇内的类别之间语义相似,不同簇之间的类别语义不同。XEM-C会产生新的兴趣点语义表示,每个维度的值由兴趣点和这些语义锚之间的相似性决定。XEM-C模型将兴趣点表征的每个维度解释为一组语义上相似的类别。本文在两个真实世界的签到数据集上对提出的模型进行了性能验证,包括定性任务和定量任务(兴趣点相似度实验和兴趣点语义注释实验)。实验结果表明,为兴趣点表示引入可解释性可以提高各种下游任务的性能。
其他文献
<正> 1983年3月25日~26日于意大利首都罗马,在意大利卫生部领导支持下,由最高卫生研究所邀请中国、苏联、美国、匈牙利、印度五国专家教授6人参加国际天然医学讨论会。
期刊
随着科学技术的不断发展,人类即将进入元宇宙时代。扩展现实技术作为元宇宙的核心技术之一,其将为用户提供更好的沉浸式交互体验。手势作为人类最为直观的交互方式之一,其在虚拟现实、增强现实等交互式领域中拥有举足轻重的地位。与此同时,手势已经在手语翻译、机器人控制、体感游戏等各类场景中得到了广泛的应用。因而,手势识别不仅具有深远的理论研究意义,还具有重要的现实研究价值。随着低成本深度传感器的出现,更高效的三
学位
小麦制粉企业在生产的各工段,根据企业自身的生产经营特点、产品市场定位等选用合适的设备和处理工艺,最大程度降低费用,提高产品质量。
期刊
目标检测是在图像中找到被测目标,对目标进行分类并将目标标注出来。随着深度神经网络技术的成熟,越来越多的目标检测应用出现在人们的生产、生活中,例如汽车流量检测、是否佩戴口罩检测、危险区域人员闯入检测等,目标检测技术的应用有着非常重要的实际意义。但是现有目标检测算法往往精度较高或检测速度很快,速度和精度之间往往达不到很好的平衡。基于深度学习的目标检测算法根据是否首先提出候选区域,可以分为二阶目标检测算
学位
我国肥料用量巨大,单位面积肥料施用量已超越欧美发达国家,过量的肥料投入导致肥料利用率低下,对生态环境也造成巨大威胁。为实现减肥增效目标,探究腐植酸、海藻酸和氨基酸增效复混肥料在相同或减量养分施用条件下发挥的增产、增效作用,本文采用田间试验方法,研究腐植酸、海藻酸和氨基酸增效复混肥料及其减量对玉米和小麦产量、养分吸收利用、肥料利用效率和土壤培肥的影响,评价其应用效果,揭示增效复混肥对“肥料-作物-土
学位
<正> 安徽省中西医结合研究会筹委会最近正式成立。筹委会由11位委员组成,安徽中医学院附属中医院院长李毅为主任委员,聘请安徽中医学院孟昭威教授、名中医陈可望担任顾问。中西医结合研究会是从事中西医结合工作者的学术性群众团体。1980年11月下旬,在合
期刊
自1998年我国建立个人住房贷款制度以来,我国商业银行个人住房贷款余额快速增长,在金融机构贷款业务中的重要性日益攀升。但由于商业银行特别是一些分支机构忽视对个人住房贷款业务的风险管控,使得该业务的潜在风险不断累积,如管控不当不仅极易引发银行业务的系统性风险,而且可能诱发房地产市场动荡和土地利用浪费等问题。因此,深入分析商业银行个人住房贷款面临的风险及其影响因素,研究提出个人住房贷款风险管控对策建议
学位
耕地的细碎化是与耕地规模经营相对应的一种土地利用格局,是影响农业生产效率和农业竞争力提升的重要因素之一。为改善农业生产条件,降低耕地细碎度,中国开展土地整治和推进农地流转。党的十九大报告再次提出加强土地整理和土地经营权流转,实现小块变大块。耕地细碎程度如何,土地整治活动是否对耕地细碎状况有改善作用,改善程度有多大,已成为亟需研究的重要科学课题,这对掌握我国耕地细碎状况、科学评估土地整治绩效和改进土
学位
数字化正畸是近年来在口腔正畸领域出现的一种先进的计算机辅助诊疗技术。相比传统口腔正畸中高度依靠牙医经验进行正畸治疗的方式,数字化正畸以数据为基础,依靠各种数字化与智能化技术,极大地减少了人力资源投入,缓解了目前在口腔医学领域广泛存在的人力资源短缺问题。牙齿分类任务是数字化正畸的关键步骤,数字化正畸系统要在分类结果的基础上,再进行进一步的数字化正畸诊断,最后才能提出正畸方案以及实施正畸治疗。因此,牙
学位
作为计算机视觉最重要的研究方向之一,细粒度图像分类是识别图像具体属于哪一种基本类别的子类别。对于细粒度图像分类来说,不同子类别的目标对象之间差异细微,而相同子类别的目标对象会因光照、姿势、角度等存在明显差异。因此,细粒度图像分类仍具有很大的挑战。为了解决上述挑战,学习细微的类间差异是细粒度图像分类的关键。目前主流的细粒度图像分类算法通常先定位有判别力的区域,再通过基于判别部位的特征提取进而学习到丰
学位