基于知识图谱的价值观标签推荐方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bo0316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当代中国正处于百年未有的重大变局之中,国家、社会、个人三个层面皆面临着价值重塑的问题。对主流价值观的传播直接切中中国特色社会主义建设最深层次的问题。同时,互联网和多媒体技术的迅速兴起使得文本数据呈爆炸式增长,如何合理有效地实现内容的主流价值观认知理解是一项极具挑战性的难题,在主流价值观上的相关研究对于净化网络空间,维系和谐稳定的社会环境,具有重大的现实意义。本文首先构建了一个主流价值观知识图谱,并通过预处理得到了一个价值观多标签推荐数据集。基于社会学专家提供的价值观知识体系,利用知识图谱可以包含丰富知识的特点,本文设计了合理的数据模式,构造了一个主流价值观领域的知识图谱。同时,为了在价值观领域进行下游任务的研究,本文使用了一个价值观领域的多标签推荐数据集,并对其进行特点分析以及预处理和划分统计等操作,为后续实验方法的选择和模型的构造打下铺垫。其次,本文选择了常见的基于类别思想的模型在价值观数据集上进行了实验对比。基于前面获得的数据基础,同时面向价值观这个较为崭新的任务背景,选择使用了常见的多标签推荐模型来进行实验,基于将标签视为二元类别的思想,具体包括浅层神经网络模型Fast Text和Text RCNN,以及深层神经网络模型Transformer和Bert,实验结果表明使用简单结构的Fast Text和基于大规模数据训练的预训练模型Bert取得了较好的结果,为后续选择更加符合价值观多标签推荐数据集特点的模型提供了思路。最后,本文还使用了融合价值观标签语义知识的多标签推荐模型进行实验。面向前面将基于标签类别思想的模型实验结果,考虑标签本身具有的语义信息,期望捕获标签之间的相关联系,模型通过两种策略利用了标签语义知识。其一,利用标签语义信息进行文本表示学习,获得每个标签对于文本中不同词的重要程度;其二,利用标签的语义知识,计算标签与文本的语义相似度,并与主模型结果融合。同时,本文还针对第二种策略进行了消融实验和“尾标签”有效性证明实验。实验结果证明了融合标签语义知识模型的有效性,且模型可以较好地缓解标签样本分布不均以及“尾标签”问题。
其他文献
作文写作是语文教学中不可或缺的重要组成部分,写作能力是学生语文能力的综合体现。相比于通用领域的文本生成而言,中学生议论文话题范围相对更小、格式更加明确,对中学生议论文进行建模并研究相应文本生成方法,可以综合考察当前模型的语义理解能力,并为其他文本生成方法提供借鉴。本文研究如何在给定题目以及首尾段关键词后生成完整的中学生议论文。受限于训练集规模,直接进行长文本生成可能会导致方法性能不佳,因此将其拆分
学位
儿童绘本一直以来都被认为是最适合儿童阅读的书籍。儿童绘本有别于其他类型的图书,其多以色彩鲜明的绘画为主,并配有少量的文字说明,借助图文的视觉和美学效果来激发孩子们的空间想象。随着人工智能的飞速发展,儿童绘本在创作和设计形式上发生了深刻的变革。智能化语音功能能够帮助儿童更为高效地阅读,多彩的人物画面、故事情节也能全方位提升儿童的感官体验。基于此,本文详细分析了人工智能背景下儿童绘本的设计趋势以及设计
期刊
关系抽取任务作为自然语言处理领域一项重要的研究内容,目的是判断文本中实体之间的语义关系,被广泛应用于知识图谱、智能问答等领域中。传统的有监督关系抽取方法需要使用带有标签的数据对模型进行训练,而数据中的标签需要人来手动进行标注,这无疑会消耗大量的人力资源。因此,远程监督方法受到了大量学者的关注。远程监督不需要人工对数据集进行标注,它依赖于现有的知识库,通过远程知识库对文本进行自动标注。但远程监督自动
学位
<正>中国移动董事长杨杰表示,信息通信业要主动把握机遇、寻求突破,着力推动“CT、IT、DT技术融合”“连接、算力、能力服务融合”“推动新一代信息技术与生产、生活、治理应用融合”,力争在新一轮科技创新浪潮中发挥更大的作用、实现更快的发展。
期刊
已勘探出松辽盆地南部赋存着丰富的地热资源,地温场特征以及岩石圈热结构的研究在地热资源研究中占有重要地位。关于松辽盆地南部中央坳陷区现今地温场以及岩石圈热结构研究较为薄弱,缺少平面上和剖面上系统的分析和研究,制约了热历史的研究和油气勘探。本论文分析了研究区地温场参数,展现了研究区现今地温场分布、岩石圈热结构等地热特征。样品生热率测试结果表明松辽盆地南部中央坳陷区岩石生热率介于0.4~2.2μW/m3
学位
数字政府建设是顺应经济社会数字化转型的新趋势,也是推进国家治理体系和治理能力现代化的新途径和新方式。从数据生产力的理论视角出发,重点剖析数据生产力驱动数字政府建设的实践逻辑与运作机理,以此为数字政府高质量发展提供理论依据。研究发现,当前数据生产力驱动数字政府建设的形态表现为高效政府、阳光政府、整体政府、智慧政府,且呈现出数据全域标识、状态精准感知、模型科学决策、智能精准执行的特征。在此基础上,理念
期刊
综合材料作为绘本创作的一种形式语言,在满足读者更高层次阅读需求的同时,也更好地表达了绘本的故事内容与情感。文章概述综合材料绘本的缘起发展,分析综合材料在绘本创作中的应用价值,探究综合材料在绘本创作中的应用技巧,以及如何展现其生命力与艺术价值,旨在为绘本的创作提供多元化的发展途径。
期刊
交互式绘本是传统绘本在数字媒体技术下的延伸,是基于用户体验下的绘本创新设计。上元节是中国传统节日的重要组成部分,以唐代上元节为内容进行交互式绘本设计,能进一步探索传统文化的视觉元素在儿童绘本中的应用途径,也能有效地激发儿童的阅读兴趣。文章首先采用文献资料法介绍唐代上元节习俗,然后通过案例分析法阐述交互式绘本的意义,最后用以小见大的设计手法进行绘本的初步设计。旨在通过唐代上元节的交互式绘本设计,达到
期刊
随着AR技术的广泛应用,交互式绘本作为一种新媒体形态正在被越来越多地使用到儿童的阅读教学中。文章将α世代的儿童群体作为研究对象,结合AR技术与儿童绘本,从阅读载体、视觉形式和虚实结构三个方面来探讨AR技术带来的新兴数字化阅读体验,探索儿童交互式绘本的交互体验,同时总结出α世代儿童交互式绘本的设计原则与策略。
期刊
篇章级事件抽取是信息抽取技术的一个分支,可以从篇章文本中自动抽取出用户感兴趣的结构化的事实信息,目前已经在金融、法律、医疗、新闻摘要等领域有着极高的应用价值。本文在分析当前流行的句子级和篇章级事件抽取方法的基础上,以解决篇章级事件划分和论元分散等问题为目的,我们提出了基于论元粒度的统一评价指标,并从以下三个方面做了充分研究:(1)基于阅读理解技术的流水线式篇章级事件抽取方法研究。本文提出了一种基于
学位