有说服力的产品描述生成

来源 :厦门大学 | 被引量 : 0次 | 上传用户:playmud
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展,人们在努力使机器变得更加人性化,因此,本文研究如何让机器智能地生成有说服力的自然语言描述的问题,该描述既要传达产品信息,又要提供与用户需求相关的解释。这个问题可能会受益于当前大量关于端到端深度神经网络的研究工作。然而,深度神经网络的成功归功于海量训练数据的支撑,我们无法获取大规模的具有说服力的文本描述,因此,缺乏标记数据和主观判断对训练这样一个模型提出了严峻挑战。针对以上问题,我们将系统分为两部分,第一部分是弱监督框架,通过分析外部数据源中有说服力文本包含的修辞手法,词汇特征与语法特征,我们编写了一组具有高覆盖率和低准确度的规则,弱监督框架依据这些规则给未标注数据进行自动标注,生成带概率标签的训练数据,从而取得后续深度模型的训练数据,这是数据层面的解决方案。第二部分是生成模型框架,为了加强用户消费场景与产品属性之间的关联,我们探索基于知识图谱的表征方式,以整合从异质信息源获得的知识,这是知识层面的解决方案。在模型层面,我们设计了编码器-解码器的框架,在编码层,我们提出了 Global-Local模块来克服弱监督问题和场景和商品之间的依赖性,在解码层,我们增加了 Copy机制来更好地处理OOV问题,使生成的文本描述更流畅。通过与多种对比方法进行比较证明了我们系统的有效性和优越性。
其他文献
随着4G、5G技术的普及和移动互联网的高速发展,人们信息交互变得更加迅捷。视频逐渐变成了人们生活中不可或缺的一部分,然而随着视频的数量呈指数式增加,如何对视频的内容进
介质阻挡放电(Dielectric Barrier Discharge,DBD)因具有装置简单、易实现均匀稳定放电等优点,而被广泛研究并在多个领域中得以应用。但是,由于DBD的放电过程较为复杂,涉及到相
近年来,深度学习技术获得了快速发展,机器翻译领域中的相关研究也不断深入。其中,前几年出现的基于注意力机制的编码器-解码器神经机器翻译框架,在效果上彻底超越了传统的统计机器翻译框架。而最新的Transformer框架,更是将神经机器翻译的效果提升到了新的台阶。由于受到训练方法的限制,这些先进的框架在翻译的过程当中都是将句子作为一个整体来考虑的,而在实际的翻译过程中,我们面对的文本往往是由多个句子组成
东营凹陷永559区位于济阳坳陷的东南部,为北陡南缓的不对称箕状盆地,砂砾岩储层,岩体分布复杂,非均质性较强,孔渗相对较低,油气分布明显受沉积相控制,不同的相带储层物性差异
现有的指纹识别算法应用于低质量指纹图像时,由于指纹图像存在污损、断裂、伤疤和形变等问题,能够提取的有效特征变少或者伪特征变多,从而导致了指纹识别变得十分困难。国内
在大规模移动视觉搜索中,视觉描述子的紧凑性是影响检索效率的重要因素。Fisher Vector(FV)描述子是一种区分性非常强的聚合描述子,在视觉搜索应用中检索效果出色。然而对于移动或嵌入式设备有限的计算资源来说,图像全局描述子的紧凑性显得尤为重要,而FV描述子的维度太高,限制了其在移动或嵌入式设备上的应用。哈希是解决图像全局描述子紧凑性描述的有效手段之一,然而哈希在量化到低维度的二值码有较大的精
C–C键的位点和化学选择性裂解/活化以及官能团化一直是最具挑战性的研究方向之一。含过渡金属的中间体的β-C裂解为碳碳键的活化提供了潜在的有效方法。但是,由于反应中存在
随着高分子材料产品在电子、光学和医学等行业的广泛应用与需求。这些产品通常需要精度为微米和亚微米级的高分子零件,如何实现快速、可靠、可复现、高质量的制造是目前实现
为顺应资本市场改革发展的新要求,满足复杂经济背景下日益增加的信息需求,2016年12月财政部印发了新审计报告准则,其中最核心的内容是第1504号审计准则,要求上市公司披露关键审计事项,并采取分步骤实施方案。因此本文基于会计师事务所视角,从不同角度分析关键审计事项的具体经济后果。本文选取2016年——2018年披露关键审计事项的所有A股上市公司数据,通过文本分析法和Python方法得出关键审计事项的
机器人技术,尤其是移动机器人技术,已经开始在工业制造、军事、物流和室内服务领域得到越来越广泛的应用。在移动机器人的关键技术中,即时定位与地图构建SLAM(Simultaneous Localization and Mapping)和多传感器信息的融合至关重要,是移动机器人实现精确自主导航的基础。本文以Turtlebot2移动机器人为平台,配置了里程计和二维激光雷达等感知设备。首先对系统的运动模型和