PCC:一个对单用户建模的个性化对话系统

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：lzh8608

【摘要】

：

【作者】

：

郭宇窦志成文继荣

【机构】

：

中国人民大学信息学院,北京100086;大数据管理与分析方法北京市重点实验室,北京100086;中国人民大学高瓴人工智能学院,北京100086;大数据管理与分析方法北京市重点实验室,北京100086;

【出处】

：

中文信息学报

【发表日期】

：

2021年12期

【关键词】

：

个性化对话系统生成式模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

对话系统是自然语言处理(NLP)领域中一个重要的下游任务,在近几年得到了越来越多的关注,并取得了很大的发展.然而尽管对话领域已经取得了许多优秀的成果,现有的对话模型在拓展个性化方面依然有很大的局限性.为了使对话模型更符合人类的对话方式,拥有更好的个性化建模能力,该文提出一种新的对单个用户建模的个性化模型PCC(a Personalized Chatbot with Convolution mechanism).在编码端,PCC通过文本卷积神经网络(TextCNN)处理用户历史回复帖子以得到用户兴趣信息;在解码端,使用相似度搜寻用户历史回答中与当前问题最为匹配的回复和用户ID 一起指导生成.实验结果证明,该文模型在生成回复的准确性和多样性上均有较大提升,证明了历史回复信息在个性化建模方面的有效性.

其他文献

慢性冷暴露对小鼠肝脏抗氧化功能的影响

本试验旨在探讨慢性冷暴露对小鼠肝脏抗氧化功能的影响.体内慢性冷暴露模型建立:试验将12只3周龄C57BL/6雄性小鼠饲养1周后随机分为2组(对照组和冷暴露组),每组6只.冷暴露组小鼠每日随机放置在4℃环境中3 h,连续4周.冷暴露结束后将所有小鼠同时安乐死,并收集其血液和肝脏.体外冷暴露模型建立:将小鼠肝细胞系AML12细胞随机分为4组(对照组、冷暴露1 h组、冷暴露3 h组、冷暴露6 h组),先在37℃培养箱中培养24 h,然后将冷暴露组细胞置于32℃培养箱中分别亚低温冷刺激0、12、24、36 h,冷

期刊

冷暴露抗氧化硫氧还蛋白-1硫氧还蛋白互作蛋白肝脏

以全面推行林长制为契机构建高效森林资源保护管理体系

福建是习近平生态文明思想的重要孕育地和实践地.习近平总书记在福建工作期间,极具前瞻性地提出建设生态省的战略构想,亲自擘画、亲自部署、亲自推动生态省建设和集体林权制度改革.党中央作出全面推行林长制战略部署后,福建省委、省政府立即启动实施林长制,全省上下行动在深入贯彻落实习近平总书记来闽考察重要讲话精神的浓厚氛围中,加快建立省市县乡村五级林长责任体系,完善工作制度,创新工作机制,夯实基层基础,强化保障措施,构建了高效的森林资源保护管理体系,有力地促进了生态文明建设.

期刊

融合术语信息的新能源专利机器翻译研究

传统的神经机器翻译模型是一个黑盒子,并不能有效把术语信息添加进去.而利用用户提供的术语词典来联合训练神经机器翻译模型具有实际意义.据此,该文提出融入术语信息的新能源领域Transformer专利机器翻译模型,使用将源端术语替换为目标端术语以及在源端术语后增添目标端术语两种手段进行术语信息融合,实验表明,在构建的新能源领域专利汉英平行语料库和术语库上,提出的专利翻译模型优于Transformer基准模型.并评测了其在人工构建的数据集、中国专利信息中心的数据集及世界知识产权局的数据集上的翻译效果.

期刊

新能源专利神经机器翻译术语Transformer

基于多任务学习的生成式阅读理解

生成式阅读理解是机器阅读理解领域一项新颖且极具挑战性的研究.与主流的抽取式阅读理解相比,生成式阅读理解模型不再局限于从段落中抽取答案,而是能结合问题和段落生成自然和完整的表述作为答案.然而,现有的生成式阅读理解模型缺乏对答案在段落中的边界信息以及对问题类型信息的理解.为解决上述问题,该文提出一种基于多任务学习的生成式阅读理解模型.该模型在训练阶段将答案生成任务作为主任务,答案抽取和问题分类任务作为辅助任务进行多任务学习,同时学习和优化模型编码层参数;在测试阶段加载模型编码层进行解码生成答案.实验结果表明,

期刊

多任务学习生成式阅读理解

基于中文字形的ELMo在电商事件识别上的应用

挖掘电商评论文本中的电商事件对分析用户购物行为和商品场景分类有重要帮助.该文给出电商事件的定义,将电商事件识别问题转换为序列标注问题,构建了一个基于电商评论文本的电商事件标注数据.该文首先在基于字符的BiLSTM-CRF神经网络模型上进行扩展,加入语言模型词向量(Embeddings from Language Models,ELMo)来提高识别性能.进而考虑中文字形特征,包括五笔和笔画特征.提出两种引入字形特征的新模型,即在预训练语言模型中结合事件的字形信息进行建模.实验结果表明融入字形特征的ELMo可

期刊

电商事件序列标注字形特征ELMo

菊粉对克氏原螯虾消化酶活性、肠道组织形态和非特异性免疫能力的影响

本试验旨在研究饲料中添加不同水平菊粉对克氏原螯虾消化酶活性、肠道组织形态和非特异性免疫能力的影响.试验选用240尾平均体重为(6.58±0.16)g的克氏原螯虾,随机分为6个组,分别饲喂在基础饲料中添加0(对照组)、0.20％、0.40％、0.60％、0.80％和1.00％菊粉的饲料,每组4个重复,养殖密度为10尾/箱.试验期7周,试验结束后测定胃组织中的消化酶活性和肝胰腺中的免疫酶活性,并用显微镜观察后肠的组织形态.结果表明:1)与对照组相比,0.40％～1.00％菊粉添加组胃组织中淀粉酶、脂肪酶和蛋白

期刊

菊粉克氏原螯虾消化酶肠道形态免疫酶

重采样在微博机器人识别中的应用研究

随着微博机器人账户的不断增多,对其识别检测已成为当前数据挖掘领域的热点问题.已有的微博机器人识别研究多使用爬取搜集的相关数据,在小规模平衡分布的机器人与普通用户数据集上训练并验证算法模型,在样本分布不平衡的真实情况下存在局限性.重采样是一种针对不平衡数据集分类的常用技术,为探究重采样对相关监督学习机器人识别算法的影响,该文以微热点数据挖掘竞赛的真实数据为基础,提出一种结合重采样的微博机器人识别框架,在5种不同采样方式的基础上使用多种评价指标,综合评估了 7种监督学习算法在不平衡验证集上的分类性能.实验结果

期刊

微博机器人类别不平衡学习重采样NearMissADASYN

语义图驱动的面向复杂逻辑关系的自然语言问答

传统的基于知识库的问答难以处理具有复杂逻辑关系的自然语言问题,而此类问题在实际应用中广泛存在.为此,该文提出了语义图驱动的自然语言问答框架.框架核心是用主链、支链、环结构等图形化结构及其拼接,表达领域中的事件及事件之间的语义关系.进一步的,构造语义图的线性编码形式,利用路径生成模型将复杂自然语言问题翻译成语义图的线性序列.为验证框架有效性,该文面向公开的医疗领域数据,半自动地构建了3 000个具有复杂逻辑关系的问题与答案.将问句进行实体识别、实体对齐,得到语义图线性序列,最后通过槽填充后在知识库中查询得

期刊

语义图自然语言问答深度神经网络

《中国重型装备》投稿须知

期刊

开卷机后反弯辊结构优化及设计

将开卷机后反弯辊优化为单辊式结构,并且给出了单辊式反弯辊辊子直径的设计方法,减少了安装与维护时间,为类似机组的辊子直径设计提供了参考.

期刊

开卷机后反弯辊单辊式反弯辊反弯辊辊子直径

PCC:一个对单用户建模的个性化对话系统

与本文相关的学术论文