基于推荐的引导式对话技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：dddnnn111111

【摘要】

：

【作者】

：

朱才海

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2021年01期

【关键词】

：

对话推荐强化学习分层强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着深度学习技术的蓬勃发展,对话系统的研究和应用迅速增长,如Siri、Cortana、谷歌助手等。相应地,这些产品也成为长辈和孩子的情感伴侣、在线客服、移动终端中的虚拟助手和网上购物和消费的智能指南。与前面提到的虚拟助手不同,智能导购的应用刚刚受到产业界和学术界的关注,亚马逊、Ebay、淘宝、京东、Yelp等智能导购通常扮演店员或顾问的角色,为移动终端用户推荐商品、店铺、餐厅、服务等,让他们的日常生活更加便利。所以这些产品通常需要引入推荐系统来完成推荐这个行为,于是逐渐延伸出了面向推荐的对话这个任务。与面向任务的对话不同,首先,用户的目标通常是不明确的,期望通过面向推荐的对话来确定。其次,在面向推荐的对话中,推荐对象可以是最终结果,也可以是澄清或确认用户意图的中间动作,从而允许在对话会话中进行多次推荐。最重要的是,与假设用户完全了解任务的槽位和值的面向任务的对话系统不同,面向推荐的对话系统中的用户通常不熟悉推荐对象的槽位和值。因此,面向推荐的对话系统输出的语言与用户的理解之间可能存在信息差距,这使得用户的意图具有不确定性。为了研究如何更好地与用户交互,弥补对话系统和用户之间的信息差距,我们将研究以下三个目标:基于简单强化学习的对话式推荐、基于简单强化学习的引导式对话以及基于分层强化学习的引导式对话。基于简单强化学习的对话式推荐会基于商品的属性空间去进行提问,将提问得到的结果作为当前的状态进行动作的选择,策略系统会决定进行询问问题或者进行推荐。需要注意的是,一旦系统选择了推荐动作,无论用户做出何种反馈,会话都会结束。基于简单强化学习的引导式对话通过策略系统将推荐系统和对话系统融合到一起,在对话决策中加入推荐动作。当用户由于对槽位术语不理解或不明确自己的偏好时,系统可以基于目前对话得到的信息,选择向用户进行推荐来引导用户明确自己的偏好,提高对话的成功率,并且能够降低完成对话的轮次。基于分层强化学习和引导式对话利用分层强化学习主要用于解决状态或者动作空间过于庞大导致的维度灾难问题,实验中也取得了不错的效果。

其他文献

基于深度学习和探地雷达三维图像的地下管线识别研究

在城市建设和老旧管道维护改造施工中,需要准确掌握施工位置地下管线的位置走向等信息。近年来探测雷达作为一种无损快速的探测技术,已广泛应用于地下管线检测中。特别是2018年以后车载阵列式探地雷达的应用,可以方便地采集到反映地下目标和结构的三维图像,相比于二维图像更能反映出地下目标的形态特征。车载阵列式三维探地雷达的应用,虽然极大提高了路上检测效率,但是检测后管线目标的分类识别还是依靠人工后期进行判读,

学位

阵列式探地雷达深度学习三维卷积神经网络地下管线

一种微型仿生水面扑翼飞行机器人的研究

目前微型水面运动机器人的运动形式以滑行和跳跃为主,而扑翼飞行能够扩大机器人的运动空间范围,提高机器人的机动性和灵活性,成为微型水面运动机器人发展的必然趋势。然而机器人要实现水面扑翼飞行不仅需要较大的升力,同时由于扑翼运动的冲击,还需要水面为机器人提供较大的支撑力,这其中涉及复杂的非定常空气动力学和水-空气界面流体力学。因此要在水面上实现机器人的扑翼飞行需要解决很多关键技术,目前仍缺乏成熟的理论和技

学位

微型机器人仿生机器人水面扑翼飞行优化设计动力学仿真

基于可达性分析的时间最优轨迹规划及轨迹跟踪控制研究

随着工业生产任务的加重以及生产需求的变化,用户对机器人的要求也不断增多,机器人不再是单纯地替代人工。如今,工厂对机器人的快速性、准确性和安全性等性能提出了更严苛的要求。因此,本文针对多样的笛卡尔空间路径,在时间最优、轨迹准确和安全运行等方面展开了研究。首先,从运动学和动力学两方面对机器人进行分析和建模,为轨迹规划和轨迹跟踪研究奠定数学基础。本文依据机器人的几何结构特征,建立了正运动学模型。又根据机

学位

工业机器人动力学轨迹规划时间最优前馈控制

电-气复合执行器的研制及其在助餐机械手上的应用

电动执行器具有定位精度高、响应速度快的优势,但电动执行器普遍输出能力较弱且输出特性较“硬”。气缸具有结构相对简单、输出能力强且输出特性“软”的优势,但其定位精度与电动执行器相比有较大差距。本课题设计的电-气复合执行器则是将电动执行器和气缸在结构和控制系统上相结合,使其兼具电动执行器的定位精度和气缸的输出特性。此外,随着社会的持续发展和人民生活水平的不断提高,我国逐渐进入老龄化社会,随之而来的就是需

学位

电-气复合执行器助餐机械手位置控制阻抗控制

基于动态运动基元的机械臂避障算法研究

为了利用机器人代替人类完成复杂的生产生活任务,工业上通常要求机器人在运动规划层面具有较高地适应性和可靠性。传统的运动规划方法存在收敛速度慢、容易陷入局部最优解状态等缺点,相比之下,示教学习的方法可以赋予机器人“仿人”的特性,能够直观方便的让机器人去模仿并复现示教得到的轨迹,以一种高效、合理的方式完成任务要求,同时可以在原始示教轨迹的基础上泛化,从而产生能够适应新环境的轨迹。然而实际任务环境并非一成

学位

机械臂运动规划示教学习避障

大挠性卫星高精度姿态控制技术研究

随着科学技术的发展和人类社会的进步,近代的航天事业得到了飞速发展,近代卫星具有大型化、复杂化、挠性化等特点。航天任务趋向复杂化,因而对卫星的姿态控制提出了新的更高的要求。因此,本文针对大挠性卫星高精度姿态控制问题的研究具有重要的研究价值和应用背景。研究内容主要包括以下几方面:针对中心刚体与挠性附件组合的挠性卫星,给出了其姿态的数学描述方式,基于欧拉角和四元数理论推导了其欧拉角形式和四元数形式的姿态

学位

挠性卫星姿态控制振动测量滑模变结构最小二乘

配送机器人导航控制方法研究

新型冠状病毒疫情肆虐,减少接触是防止疫情扩散的最根本手段。在此基础上,无人配送便成为了大家运输物品的最优选择,因此无人配送行业获得了前所未有的发展。在无人配送行业中,室内的无人配送场景由于受光照影响小,成本较低,安全性较高,需求量较大,所以其具有广阔的应用前景。室内的无人配送主要依靠无人配送机器人,无人配送机器人是搭载了激光雷达或相机等传感器,可自主导航完成配送任务的移动机器人。本课题的目的便是设

学位

无人配送定位建图导航控制

FAST馈源支撑缆索及滑车检测机器人设计

五百米口径球面射电望远镜,简称FAST,是我国的重大科学基础设施,它在观测脉冲星等方面创造了巨大的科学价值。其中,馈源支撑系统作为FAST望远镜中对馈源舱进行高精度位姿调节的重要部件,必须对其开展定期的安全检测与维护,以保障射电望远镜能够正常地进行观测任务。因此,本文针对FAST望远镜中的馈源支撑缆索及滑车,设计能够自主进行缆索缺陷检测的机器人系统。本文首先对机器人进行了总体设计,根据FAST馈源

学位

检测机器人缆索检测越障牵引驱动

飞机内部顶铆并联机器人关键技术研究

本文从一种平行导路的6-HTRT并联机器人出发,以其在飞机蒙皮铆接中作为内部顶铆机器人的实际应用为目标,研究了并联机器人位置正逆解、力学分析、误差标定补偿,控制系统研发等关键技术。在稳定可靠的前提下,尽量发挥并联机器人的结构优势,与其它设备协作实现飞机装配自动化。首先,研究了6-HTRT并联机器人的位置正逆解。位置逆解使用几何矢量法,并编写3D可视化程序验证逆解的正确性。位置正解使用了线性化的思想

学位

飞机装配6-HTRT并联机器人运动学凯恩法误差补偿

基于FPGA的关节伺服系统研究

机械臂因为能够代替人类执行一些复杂和较难的任务,被越来越多地应用在工业机器人、医疗机器人等机器人领域。轻型机械臂具有体积小、重量轻、操作灵活等特点,一般由6～7个旋转关节串联构成,从而实现多自由度运动,因此提高机械臂控制性能的关键在于提高机械臂每个关节的控制性能。本文以实验室自研的7自由度轻型机械臂为研究对象,为其设计了一套电流、速度双闭环的关节伺服控制算法,并将算法用Verilog硬件描述语言实

学位

FPGA关节伺服系统抗干扰控制陷波滤波器

基于推荐的引导式对话技术研究

与本文相关的学术论文