面向招聘领域的多轮对话系统研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zkry123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相对于任务型单轮对话系统来说,任务型多轮对话系统更加符合人类日常对话逻辑,具有广泛的应用前景。然而,目前主流任务型多轮对话系统利用复杂的深度学习模型和大量语料进行训练,模型训练时间成本高,训练得到的模型计算复杂。对此,论文展开了深入研究,采用简化的深度学习模型进行多轮对话系统的训练,分别对意图识别与槽填充任务、对话状态跟踪任务、对话策略生成任务提出了优化设计,构建面向招聘领域的多轮对话系统。构建了面向招聘领域的知识图谱,采用自顶向下的方法构建领域知识图谱,通过网络爬虫、实体关系抽取、知识融合等技术获取三元组知识,基于Neo4j构建了招聘领域知识图谱。设计了一种基于深度学习的意图识别与槽填充的联合模型,将经过ngrams编码的稀疏向量与经过预训练词嵌入模型编码的稠密向量融合增强输入的语义信息,利用门控槽机制增强意图识别与槽实体识别的关联性。设计了一种基于槽位表和Transformer多轮对话管理机制,对话状态跟踪上采用基于槽位表记录的方式进行对话状态的维护与更新,对话策略生成模型利用Transformer模型进行编码,利用最大点积相似度对对话将要执行的下一步动作进行预测。意图识别和槽填充的联合模型在SMP数据集上设置对比实验,模型在意图识别任务和槽实体识别任务上F1值分别优于Bi Ass-Gate模型1%和4%,在槽实体识别任务中优于Joint Bert模型近1%。对话策略生成模型在Multi WOZ 2.1数据集上进行了对比实验,相对于文献52的基于Transformer的模型,模型在小样本下准确度高0.12,在预测速度上要快近1/4。设计和实现了面向招聘领域的多轮对话系统。应用优化的意图识别与槽填充模型、对话状态跟踪模型和对话策略生成模型构建问答系统。并将问答系统与知识图谱、语音交互系统、安卓系统、微信小程序相融合,利用编程语言、推理框架,设计和实现了一套面向招聘领域的多轮对话系统,通过测试验证了系统的有效性。
其他文献
以联邦学习为代表的协作学习框架,能在保护数据隐私的同时,深度挖掘多方医疗机构数据所蕴含的知识。在各方医疗数据质量良莠不齐的情况下,如何为协作学习选择可靠的参与方,提升深度学习模型性能,是多方医疗数据协作面临的重要挑战。现有方案主要通过计算参与方的数据贡献来反映数据质量,并进一步根据贡献阈值选择可靠参与方,存在两个问题:一是数据贡献计算指标单一,不能全面满足医疗领域模型性能评价的需求,二是难以制定统
学位
视觉问答是一个涉及图像和文本两种模态的任务,需要模型对图像和问题内容都有细粒度的理解能力,十分具有挑战性。视觉问答不仅在工业界有广泛应用场景,在拓展人工智能的边界上也具有重要意义。现有视觉问答算法普遍依赖于注意力机制,其中基于视觉-语言预训练模型的视觉问答算法是目前准确率最高的算法。然而,视觉问答任务和预训练模型中的预训练任务输入形式差异较大,同时视觉问答任务本身与预训练任务差异也较大,这限制了预
学位
数控机床加工过程的监测对保证工件质量和机床安全有着很高的现实意义。传统的基于力信号和振动信号监测方法有其局限性,近年来基于驱动电机电流信号的间接监测方法受到关注并取得了一定成效。但在机床切削负载较小条件下,传统的特征提取等处理方法无法很好地区分机床电流信号中噪音波动和加工状态变化带来的波动,并且切削负载较小时,仅选择主轴电流也不足以表征机床加工状态变化。如何选择合适的驱动电机电流也成为一大难题,不
学位
广域测量系统(Wide-Area Measurement System,WAMS)中提供的数据在如今的电力系统中已经有了诸多的应用,具有实时采集和上传等优良特征。然而,部分从相量测量单元(Phasor Measurement Unit,PMU)中采样得到的数据与WAMS数据中心汇总后得到的数据存在差异,实际获得的数据存在数据丢失、采样值偏差和跳变等的数据质量问题,形成不良数据,这些数据质量问题会使
学位
在图像合成或电影制作中,经常会有对目标物体的背景进行替换的需求。人像抠图是自然图像抠图领域中的子任务,该任务除了需要预测复杂图片中人物前景的不透明度外,还需要让预测达到发丝级的精度。在现有的大多数人像抠图算法中,遮罩的预测需要额外的三元图作为输入,并且具有较慢的推理速度,这使得算法难以在实时性应用中得到使用。目前,MODNet是一种无需额外输入,并兼具快速推理和精确预测能力的深度学习人像抠图模型。
学位
“刻地”是古籍版本著录的重要内容。文章从历史源流、中外学者论述、古籍编目标准化、学科发展等角度论述了著录“刻地”的必要性,参考四川省11家收藏单位的古籍普查数据和《中国古籍总目》的抽样数据,统计了其中的“刻地”著录比例,了解了当前古籍编目中“刻地”著录的实际状况。文章以清代四川刻本为实例,提出鉴定与考证“刻地”的具体方法,并对考证过程中容易出现的错误因素进行了举例说明。
期刊
随着大数据时代的到来,金融行业依托互联网实现飞速发展,产生了海量金融文本信息,人们开始通过实体抽取和关系抽取技术自动从非结构化金融文本中提取有价值的信息,为构建金融问答系统、知识图谱等提供数据基础。在构建实体抽取和关系抽取模型时,存在文本中的实体对上下文的长距离依赖、实体抽取结果未被关系抽取模型有效利用的问题,此外由于金融文本的特性,还存在嵌套实体实例多、复杂关系类型分布广泛的问题,增加了面向金融
学位
为了应对摩尔定律失效,芯粒(Chiplet)技术被提出。Chiplet需要使用片上网络(Network on Chip,NoC)互联,以实现大规模集成和高效通信。基于Chiplet的异构架构通常由不同功能、制程的模块互联而成,例如中央处理器(Central Processing Unit,CPU)与加速器的互联。然而,在面向Chiplet互联结构的模拟中,NoC比CPU等模块的功能模拟速度慢几十倍
学位
数字化是供应链转型的主要方向,必然会对商贸流通业发展产生影响。本文以长江经济带沿线省域为例,通过构建并测算供应链数字化转型水平基础上,实证考察了供应链数字化对商贸流通业发展规模和效率的影响及其异质性。研究发现,2016-2022年,长江经济带沿线省域供应链数字化转型整体上获得了较好发展并保持了持续增长态势,但不同省域之间供应链数字化转型水平存在较大差距。具体来看,下游地区的江浙沪供应链数字化转型走
期刊
随着计算设备的广泛应用,传统的人机交互方式已不能满足人们需求,基于动态手势识别的人机交互因其自然、便捷的操作,已成为一种新兴的人机交互方式。但现有的动态手势识别研究主要面向离线识别,难以应用在实时系统中,一方面,实时视频流中没有手势开始和结束位置标志;另一方面,现有识别方法计算资源消耗较高,且存在重复识别问题,难以满足实时系统的要求。因此,如何准确定位视频流中的手势,并在识别过程中兼顾实时性和准确
学位