面向产品评论的问题生成研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:meal09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电商平台的兴起,网络上产生了大量产品相关的评价信息,对市场调研以及潜在客户购买意向决策具有重要意义。面对海量的评价信息,如何快速挖掘产品性能关键评价,从而生成与产品性能息息相关的问答数据具有极大的研究价值。因此,本文针对大量产品评价数据,通过问题生成模型,挖掘用户最关心的产品性能相关问题。传统的问题生成主要针对问答任务相关数据,采用端到端的深度学习架构模型。而基于产品评论的问题生成,不仅需要考虑评论信息中口语化表达,且生成的问题需要精准的围绕产品的类别、属性和性能特点展开,使得之前的问题生成模型在该任务上性能不佳。基于此,本文具体的研究内容包括:(1)基于文本信息的问题生成模型。为了探究如何利用产品相关的评论数据去生成产品相关的问题,本章从产品评价数据文本长度较短,用词较口语化的特点出发,设计相应的算法。首先,针对评论数据文本长度较短的问题,本章提出利用相似评论拼接的方式,丰富文本内容。然后,通过采用指针复制机制,克服评论数据口语化严重和容易产生使用词汇超出词典(out of vocabulary,OOV)限制的问题,这使得模型不仅可以从词典中生成对应的词汇,还可以从原文中抽取问题生成需要的词汇。本文利用京东评论数据进行实验,结果表明,在基于评论等短文本问题生成的任务上,与目前已有的神经网络模型对比,效果有了很大的提升。(2)结合产品属性信息的问题生成模型。采用指针复制机制虽然能避免用词超出词典限制的问题,但如何避免复制机制指向性错误,仍然是巨大的挑战。本章在上一章的基础上,为了增强模型围绕产品生成问题的能力,本章通过数据标注融入了产品的属性信息。这不仅加深了模型对产品相关数据的理解,提升了复制词汇指向性的正确率,也使得模型能够更加关注产品的相关属性信息,明确了实体属性的边界。因此生成的问题能够围绕着产品的相关信息提问,更直观地反映出产品的各个方面。本章在京东数据集上进行实验,结果表明,生成问题的准确性有较大的提升。(3)基于联合学习的产品评论问题生成模型。结合产品的属性信息虽然可以提升问题的准确性,但是仍然存在生成的问题较为简单,内容比较直白,提问的方式比较单一,以及模型无法理解产品相关的敏感方面的信息等问题。因此,本章在上一章的基础上,提出基于联合学习的问题生成模型,结合产品属性和观点信息抽取,使得生成的问题不仅围绕产品类别名称,同时考虑到产品特性。此外,模型还融合了属性信息关系抽取,挖掘观点信息与属性之间的关系,加深了模型对产品数据的理解,从而进一步提升了问题的质量。在中文京东英文亚马逊的双语料的测试下,结果表明,生成的问题在质量上有了显著的提升。
其他文献
目的:金黄色葡萄球菌是导致人类多种感染的临床常见病原菌,长期以来被认为是胞外病原菌,但越来越多的研究证实其可以在多种细胞内生存,是典型的兼性胞内寄生菌,但金黄色葡萄球菌的相关胞内生存机制尚不清楚。环状RNA(circRNA)是近年来新发现的一种具有调节功能的RNA,其参与了多种生物学功能,但其在金黄色葡萄球菌致病过程中的作用机制鲜有报道。与此同时,临床上作为诊断金标准的传统病原菌培养鉴定技术,由于
学位
肿瘤相关巨噬细胞(tumor associated macrophages,TAMs)是脑胶质瘤中最常见的间质细胞,且与胶质瘤干细胞所重构的高度抑制性免疫微环境紧密相关,并具有促进肿瘤进展的恶性生物学效应。胶质瘤干细胞能重塑TAMs的代谢表型,并参与调控TAMs的极化以及向利瘤表型转化。阐明TAMs的脂代谢重塑特征、机制及对胶质瘤进展的影响,将有助于精准靶向干预其畸变的脂代谢,以逆转TAMs的利瘤
学位
研究背景:下肢深静脉血栓形成(DVT)是多种原因导致的下肢深静脉血管内血液异常凝结,会阻塞相应血管,导致静脉回流受阻。如治疗不及时,会继发严重的下肢静脉疾病,如下肢静脉曲张、色素沉着、慢性经久不愈的溃疡等。髂静脉狭窄(IVCS)被认为是DVT最常见的继发性危险因素、也是其发生的解剖学基础和血栓复发的重要因素。目前国内外关注的重点包括以下两个方面:第一,就何种程度的狭窄需要进行临床干预业界存在较大的
学位
研究目的:肿瘤传统治疗方法(如手术治疗、放射治疗以及化学药物治疗等)存在术后复发以及术后患者生活质量下降的风险,且磁共振成像因其对比剂在体内循环时间短难以实现对机体的长期监测。因此,研发一种安全、有效的肿瘤诊疗制剂对提高肿瘤治疗效果和长期监测肿瘤发展具有重要意义。近些年研究发现极小尺寸的氧化铁纳米粒具备成为磁共振成像T1对比剂的能力,同时这一类含铁复合材料与临床常用磁共振成像对比剂马根维显(Gd-
学位
<正> 1925年生于河北省宁河县,1950年拜师学习中医,1955年取得中医针灸医师合格证书,1963年毕业于哈尔滨医科大学。现任哈尔滨医科大学附属第一医院针灸科主任、主任医师,黑龙江省针灸学会常务理事兼秘书长,中国康复学会黑龙江分会理事,哈尔滨市针灸研究所研究员,蒙罗维亚中国成龙中医针灸主任(利比里亚)。早年拜师于姬天枢、与士今门下。曾进修于中国中医研究院受教于董德懋、赵尔康、李志明。他善于中
期刊
随着移动互联网的飞速发展,我们已经步入了信息爆炸的时代,平台通过互联网提供种类丰富的服务(如购物、视频、新闻等),而多样的服务也带来了“数据过载”的问题。如何从海量的数据中挖掘有效的数据亟待解决,推荐系统应运而生。推荐系统的主要目标是根据用户与物品的交互信息学习用户的兴趣偏好,根据用户的兴趣个性化推荐物品。但推荐系统始终面临着数据稀疏和冷启动问题,通过引入用户和物品的特征能在一定程度上缓解上述问题
学位
光固化快速成型是将紫外光照射到光敏树脂表面,使其连续固化并逐层叠加成实体零件。本文采用8.9寸的2K液晶显示屏(LCD)作为选择性透光设备,可用于小批量制造工业装配件、医疗牙具和动漫手办等。该成型方式的效率与质量难以协调是制约其发展的主要因素,本文通过解构其成型流程,在各环节提出二者的调和策略。主要研究内容如下:(1)使用了大尺寸LCD作为选择性透光设备并将紫外光功率增加到120W。在机械关键部件
学位
目的:探讨日间高碳酸血症对阻塞性睡眠呼吸暂停低通气综合征(OSAHS)患者记忆力和执行功能的影响。方法:前瞻性收集2019年8月至2020年11月因打鼾于苏州大学附属第二医院睡眠中心就诊的患者,纳入符合入排标准的OSAHS患者123例,详细收集所有患者的基本信息、一般临床资料,检测日间清醒状态下经皮二氧化碳分压(PtcCO2),并行记忆力和执行功能评分,以及整夜多导睡眠监测(PSG)。记忆力和执行
学位
车联网中的车辆通过广播基本安全消息(Basic Safety Message,简称BSM)来共享车辆及交通相关信息,从而提高交通效率和安全性。专用短程通信(Dedicated Short Range Communication,简称DSRC)协议限制了BSM只能在控制信道(Control Channel,简称CCH)上传输,进而导致了BSM的传输效率较低,影响交通效率及道路安全性。随着车流密度的不
学位
群智感知具有时空覆盖广、成本低、应用场景普适等突出优势,可以高效地实现众多极具吸引力的新型感知应用。然而,这些通过利用群体智慧来解决复杂问题的群智感知应用受到参与用户的异质性、随机性等因素的影响,导致群智感知系统收集的感知数据质量难以保证。因此,如何选择合适的用户完成感知任务以保证任务的感知质量是群智感知应用中亟待解决的重要问题,通过设计合理的激励机制鼓励更多潜在用户参与群智感知任务被认为是保证平
学位