聊天机器人中用户出行消费意图识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:QINSHAOKUN1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术尤其是人工智能技术的快速发展,聊天机器人这一新形态的智能对话系统出现并普及,基于此,本文提出“用户出行消费意图识别”任务。所谓出行消费意图,是指在聊天机器人中,用户为了满足出行的需要,通过文本表达出对出行类产品或者服务的购买意愿。识别出用户的出行消费意图,不仅能丰富聊天机器人的对话策略,还能辅助之后的产品推荐工作,具有重要意义。本文将出行消费意图识别任务看成一个分类问题,首先使用基于特征工程的机器学习方法进行出行意图识别。经过分析,用户的聊天文本一般较短且口语性较强,识别起来十分困难。因而本文尝试使用共现关系挖掘Apriori算法以及主题挖掘LDA算法,对用户的聊天文本进行内容和语义话题两方面的扩充,丰富用户的表达并完善聊天信息,使模型更易于识别出用户的出行意图。实验结果表明,基于内容与主题扩充的识别策略对最终结果有一定提升。由于基于特征工程的机器学习方法十分耗费人力并且有较强的局限性,即便对聊天内容进行扩展,在刻画文本的深层语义信息上依然比较困难。进而本文尝试使用端到端的深度学习模型进行特征抽取与出行意图识别工作。具体而言,本文构建了基于卷积的长短期记忆神经网络(Convolutional-LSTM)模型进行出行消费意图特征挖掘与识别,首先通过卷积神经网络(CNN)对用户的聊天文本进行特征抽取,随后进行特征组合后送入长短记忆神经网络(LSTM)进行特征表示学习,最后输出识别结果。实验结果表明,在出行消费意图识别任务上,基于Convolutional-LSTM的模型相对传统特征工程方法有较大提升,并相比CNN与LSTM模型表现也有优势,在出行消费意图识别任务上是行之有效的。出行意图包含多个领域,在实际的意图识别过程中,某些意图领域的语料十分稀少,而且获取比较困难,这就给意图识别的领域扩展带来了诸多不便。本文尝试使用底层参数共享与多任务学习两种不同的迁移学习方法,在新的意图领域利用小规模的标注数据进行迁移学习工作,并取得了较为理想的结果。最终,本文将论文所研究的内容应用在聊天机器人“笨笨”上,通过对用户聊天文本的识别以及与用户的交互,最终确定用户出行意图。经线上测试,出行消费意图模块在聊天机器人中表现良好,能够满足实际需要。
其他文献
走进灌阳县黄关镇中心小学,抬眼望去,一道百米长的“德育墙”顿时映入眼帘。“德育墙”是一道长达百米的黑板墙报。近年来,黄关镇中心小学致力于加强和改进德育工作,在坚守课堂教
1971年,美国巴克莱投资管理公司发行了世界上第一只指数基金,这是量化投资的开始,经过30多年的发展,量化投资已经成为国外资本市场中又一重要的投资方法,相比之下我国的量化
为了构建可在人喉癌细胞中稳定表达IFI16基因短发夹RNA(shRNA)的表达载体,设计合成的IFI16基因shRNA片段,连接到经BamHI和EcoRI双酶切的pGreenPuroTMshRNA表达载体中,连接产
目的:探讨红细胞分布宽度(Red blood cell distribution width,RDW)与IgA肾病(IgA nephropathy,IgAN)患者临床、病理表现的相关性。方法:回顾性横断面研究。纳入2008年8月-20
基于研究与开发的战略联盟已成为发达国家技术创新的主要趋势,高技术企业由于其自身的特点决定了R&D在发展战略中的重要地位。从高技术企业研发联盟的动因和模式入手,对高技术企