论文部分内容阅读
随着互联网技术的发展,社交网络已成为人们获取知识和交流信息的重要来源。然而面对网络数据的爆发式增长,人们难以有效地检索和利用信息,严重影响了用户体验。推荐作为社交网络中的一种语义分析技术,能够帮助用户过滤无效数据并推荐其感兴趣的信息,极大地提升了用户效率。但是,传统推荐技术中存在数据稀疏、马太效应等问题,知识图谱的应用可以为其建立字符串描述到结构化语义描述的映射,通过引入更多的语义信息为用户提供精准的推荐。因此,基于知识图谱的社交网络语义推荐研究具有重要的研究价值。本文主要通过构建社交网络知识图谱,有效利用知识的语义关联信息开展基于知识图谱的推荐系统研究。主要工作如下:首先,针对BERT模型中存在的结构复杂、计算效率低以及难以广泛应用的问题,本文提出一种基于知识蒸馏的BERT模型用于社交网络实体抽取。该方法分析了 BERT现有解决思路中存在的问题,同时结合新浪微博具体场景,将多层的BERT模型中的知识蒸馏到较少层的轻量模型中对模型进行轻量化。在GLUE基准集的实验证明,该模型在保留95%以上精度的同时,能够大大压缩结构,计算效率提升5倍左右。其次,本文基于改进BERT模型抽取的实体,通过引入相似度、香农熵、相对距离三个指标来挖掘实体关系语义信息,进而构建社交网络知识图谱,为推荐系统提供高质量的语义辅助信息。最后,针对传统推荐系统随着时间的推移,倾向于推荐与用户历史记录类似的项目,进而出现闭环现象和马太效应的问题,本文提出一种基于新颖度的微博社交网络推荐方法。该方法通过引入新颖度概念,加入用户活跃度、从众性、创新者指数等指标,同时借助知识图谱的辅助语义信息来挖掘用户的潜在兴趣。实验表明,本文方案能够在新颖度和准确度之间取得平衡,推荐的冷门项目增加了 10个百分点,有效避免了推荐系统中的马太效应。综上,本文通过构建知识图谱并利用其语义信息挖掘用户兴趣,有效解决了推荐系统中的马太效应,通过微博数据集验证了方案的有效性,对社交网络的语义研究具有一定的理论意义和应用价值。