基于用户个性的微博文本自动生成研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:tina_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及与大数据时代的高速发展,微博由于其完善的社交功能与便捷的参与方式,极大程度地丰富了人类的日常社交活动,受到了大多数人的青睐。人们在微博中通过发帖可以表达日常分享,参与时事讨论,以及评论产品优劣等。自动化文本生成技术作为人机交互的重要方式之一,已经广泛应用于机器自动翻译、线上聊天机器人、电子商务系统及推荐创意广告等场景中,有效地提高了用户的写作效率与改善了写作质量。但是由于使用人群的多样性,即兴趣爱好、职业年纪、地域风俗等差异,对于同一主题,不同用户的博文都大不相同,这些差异正是用户个性的写照,能够折射出用户的风格品味层次。因此,如何高效、精确地生成个性化微博文本已经成为了国内外研究的难点、热点问题。在此背景下,针对微博文本的开放性以及自由度较高的特性,采用中间微调的训练方法,使用大规模高质量的微博语料训练域适应语言模型,保证模型对微博域特征的学习能力。然后在此基础上,针对如何生成具有用户个性化特征的微博文本,提出了一种用户粒度级的控制生成模型,以GPT2模型为基础构建Encoder-Decoder结构作为整体框架,在Encoder端编码建模用户的静态个性化信息;然后在Decoder端添加双向独立的注意力模块,用于接收已编码的静态个性化特征向量,原始结构中的注意力模块则负责从用户的历史博文中捕获动态个性化特征;接着采取动态加权的方式对静态、动态个性化特征进行融合后馈送到后续的解码层,实现了多源(多条件)指导信息对博文生成的先验指导,另外,由于用户静态个性化特征的语义稀疏性,可能会导致生成文本与事实不符,因此,基于BERT模型设计了一致性理解生成模块,通过微调其生成目标与损失函数,将一致性理解任务与生成任务相独立,对Decoder端输出文本与用户静态个性化特征进行一致性理解的二次增强生成,实现了博文生成的后验指导,最终生成与用户个性化特征一致且符合用户兴趣爱好与行文风格的个性化微博文本。实验表明,对比GPT2基线模型,该模型流畅度提高了0.3%-0.6%,且在不损失语言流畅度的基础上,模型生成的微博文本能够具有显著的用户个性化特征,其中个性化和一致性两个评价指标都有8.4%、9%的明显提高;就平均融合与本文动态加权的方式,以不同体量的数据集进行实验对比,验证了动态加权融合策略的有效性;同时与个性化文本生成领域已有的模型算法进行充分对比,验证了模型整体的生成性能。
其他文献
坚定理想信念,就是坚守“共产主义远大理想”、“新时代中国特色社会主义共同理想”,并立足于理想,促进“知情意行”的实现。理想信念作为中国共产党人精神上的“钙”,是我们赖以生存的政治灵魂,也是我们源源不竭的精神动力。没有坚定的理想信念,就会缺“钙”,就会得“软骨病”。大学生作为社会变革的“晴雨表”,能够从侧面反映出整个社会现代化的状况,因此坚定大学生理想信念是关系到国家前途命运的重大课题。作为新时代的
学位
党的十八大以来,习近平总书记高度重视雷锋精神在新时代的传承和弘扬,就雷锋精神做出多次重要论述和重要指示。雷锋精神作为第一批纳入中国共产党人精神谱系的伟大精神之一,具有强大的时代价值和影响力。雷锋精神根植于五千年优秀中华文化和红色革命文化,是民族精神与时代精神的生动写照,是社会主义核心价值观的生动体现。新时代大学生,身处伟大梦想从理想变为现实的历史进程中,应当主动传承雷锋精神。用雷锋精神对标自己,做
学位
谈心谈话法是高校辅导员从事思想政治教育工作最基本的工作方式和方法,是高校辅导员素质能力的基本要求,是提高思想政治教育效果和质量的关键环节。从思想政治教育方法论的角度来讲,谈心谈话法是思想政治教育的认知方法及实施方法。作为一种方法,谈心谈话法具有自身的理论基础、具体运用、类型特征以及艺术运用等。当前,高校辅导员在认知和运用谈心谈话法及工作实效性方面,仍存在很多亟待解决的问题,恰当运用谈心谈话法,通过
学位
为优化就地热再生施工参数,降低再生施工费用。分析了压实度与碾压温度、再生剂用量、温拌剂用量之间的关系,建立就地热再生沥青路面压实度的预测模型。此外,构建了沥青路面就地热再生施工的费用模型,并据此形成了施工参数的多目标优化模型。在此基础上,考虑施工时路表温度范围,选择38 ℃、60 ℃路表温度,通过遗传算法揭示了目标压实度与施工费用的内在关系,探明了最优施工参数,评估了参数效益。最后,依托泉南高速石
期刊
在带钢的热轧过程中,由于板坯温度分布不均衡、中间坯运行不对称、轧制压力设置偏差等因素的影响,会导致带钢中间坯出现镰刀弯现象。由于热轧线上温度过高,接触式测量方法不利于实施,故本文针对热连轧车间里带钢的镰刀弯检测问题,提出基于机器视觉的镰刀弯在线检测方法。本文针对镰刀弯视觉检测问题进行研究分析,并根据镰刀弯视觉检测中存在的一些问题,设计出稳定、精确、快速、高效的镰刀弯检测算法。针对传统的镰刀弯视觉检
学位
目的:本实验通过以诱导SD健康雄性大鼠抑郁为基础,加以注射盐酸异丙肾上腺素,建立抑郁合并冠心病的大鼠模型,探讨电针疗法对抑郁合并冠心病的大鼠模型线粒体自噬及氧化应激相关蛋白CAT及LC3B蛋白表达量的影响,并探究电针治疗抑郁合并冠心病的作用机制,验证电针的治疗作用。材料与方法:健康SD雄性大鼠适应性饲养3天后,对大鼠进行体重测量、旷场实验评分、糖水偏嗜实验评分,然后以随机数字表法将综合评分相近的8
学位
随着技术的更新迭代,井下定位技术慢慢从传统的有线通信技术过渡到无线通信技术。其中,利用无线信号即可以通信,又能够进行测距、定位等日常活动,成为生活中非常重要的资源。无线信号具有灵活性好、传播快、覆盖范围大、能耗低等特点,实现定位的硬件设施要求低,比如携带传感器的智能手机、平板等,是实现不同环境下定位的一种重要方法。然而,煤矿井下环境与一般的室内环境不同,它的环境不确定性更大,井下工作人员的活动以及
学位
炼钢终点预测是目前转炉炼钢行业中影响性能指标的重要一环,精准的炼钢终点预测对整个炼钢过程有极为重要的意义。在影响钢材质量的炼钢终点的成分中,除了碳含量和温度以外,还存在磷、锰等多种化学元素,目前炼钢终点预测主要集中在对碳、温的预测研究,对炼钢终点磷含量和锰含量预测研究较少。因此,在逐步提高炼钢终点碳、温度预测精度的同时,进行终点钢水磷、锰含量预测建模研究,推进对转炉终点的全面识别,指导操作人员提高
学位
层流冷却技术是目前国内热轧带钢加速冷却装置采用最多的冷却方式之一,而其冷却关键就是对带钢卷取温度的准确控制。但由于生产现场环境的恶劣性,保障带钢质量主要存在两个难点,一是由于对带钢进行冷却过程中存在大量水雾,难于实现实时带钢温度准确检测,而现有的控制方法都过于依赖带钢温度模型,但模型中带钢温降与冷却水量之间的关系很难精准的表述出来,因此对层流冷却中段温度和卷取温度的准确预测就是实现卷取温度控制的关
学位
以异型焊接承载件原位自动超声相控阵检测为研究背景,由于检测过程中原位检测位置有限,异型焊接承载件的形状较为复杂,存在极端的多反射结构特征,必须识别和定位待检测特征,在多个待检测特征中规划最优检测路径,在复杂环境中对焊缝缺陷超声图谱多尺度目标进行检测。本研究主要针对异型焊接承载件的多孔位置识别及其检测路径规划,以及缺陷图谱的智能识别。为此,提出了一种基于点云的多特征轮廓识别定位算法,可同时提取和定位
学位