基于文本摘要技术的评论总结生成研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:ty20011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多消费者会参考以前消费者所写的评论来作相应的决策,但是消费者的时间有限,能够阅读的评论数量也有限。因此,一种包含评论集中重要信息的评论总结生成方法是值得研究的。本文主要研究如何从大量的用户评论中生成一个全面的评论总结。评论总结生成可以通过文本摘要的方式来实现,文本摘要技术主要包括两种类型的方法:抽取式文本摘要方法和生成式文本摘要方法。抽取式文本摘要方法可以处理有监督和无监督的场景,但是可能产生冗余和不连贯的摘要结果;生成式文本摘要方法可以避免冗余,但是只能处理有监督的场景和短序列文本,并且相应的技术还不是很成熟。此外,这两种文本摘要方法都忽略了文本中的情感信息。针对以上问题,本文提出了一种新的评论总结生成框架,综合了抽取式和生成式文本摘要方法的优点,并且集成了有监督和无监督的评论总结生成方法。本文主要的研究内容、贡献和创新点如下:1)本文提出了两种全面的预处理策略来识别重要的句子或评论:句子的重新排序模型和评论子集的选择模型。重排序模型是根据评论句子的语义相似性和用户的情感对评论句子进行重新排序,并将其作为生成模型的输入。子集选择模型用于选择涵盖尽可能多方面的评论子集,这些评论子集可以直接生成评论总结也可以用于输入。2)本文将Encoder-Decoder模型应用到有监督场景下的评论总结生成。使得完整的模型具有抽取式和生成式文本摘要两者的优势。3)本文提出一种无监督的方法来处理没有人为书写摘要作为标准参考的无监督场景。它能够识别每个产品的各个方面,然后用尽可能少的句子生成涵盖尽可能多方面的评论总结。4)本文在三个真实的数据集(Idebate,Rotten Tomatoes和JDPhone Review)上进行实验。实验结果表明,本文提出的框架在评论总结任务上表现优秀。
其他文献
Ti Al合金因其密度低、高比刚度、高比强度、抗蠕变性好等诸多优异性能成为应用价值极高的新型轻质高温结构材料,在航空航天器发动机叶片等热端部件轻量化选材方面具有广阔的
致密油藏是我国石油未来发展的重点领域,通常采用体积压裂的方法开采。但是受到认识不足或压裂工艺缺陷,存在部分压裂失效井;对于部分见效井,随着生产的进行,部分初压裂缝闭
糖尿病已经成为威胁全球人类健康的一大难题。目前,糖尿病治疗最有效的途径是补充外源性胰岛素,但仍然面临许多困难。因此迫切需要开发出葡萄糖响应性胰岛素递释系统,主要分
长久以来,生猪养殖的废水处理一直面临着处理成本高,出水质量差,废水处理难度大等问题。由于猪场废水碳氮比低(C/TN低,氨氮高),所以猪场废水生化降解性能差,种种增加了猪场废水
锂空气电池作为一种新型电池体系,由于其超高的理论能量密度(3600 Wh kg-1)受到人们广泛关注。然而当前锂空气电池的发展正处于基础研究阶段,一些关键的科学和技术问题尚未解决。这些问题包括由反应动力学缓慢导致的能量转换效率较低;由正极传质缓慢带来的倍率性能较差;由电化学稳定性能较差导致的循环寿命短;由负极枝晶、粉化、腐蚀等带来的安全性能差,限制了锂空气电池的进一步发展。针对上述问题,我们在开发
广泛存在于自然水体和工业废水中的铬和砷具有致癌性、剧毒性以及强迁移性,因此二者被列为优先控制污染物。尽管一些传统和新型技术可用于含Cr(Ⅵ)/p-ASA水体的处理,但是这些
文房,是中华文化传承与发展的重要物质载体,因为其本身所含有的人文精神、艺术价值、收藏价值等因素,一直以来深受人们的喜爱。陶瓷文房以其价格、制作成型等方面的优势,从古
葡萄糖作为一种储量大、获取途径多样的生物质资源,对其进行转化利用一直受到人们的关注。葡萄糖转化路径多样,研究较多的方式包括葡萄糖异构化为果糖、葡萄糖转变为5-羟甲基
随着我国经济的不断增长,能源消耗、环境污染等问题也日趋严重,如何在经济增长过程中实现与生态环境的协调统一,已成为我国急需解决的问题。我国经济增长关键在于全要素生产率的增长,而考虑能源消耗与污染排放等环境因素的绿色全要素生产率的提高则是推动可持续发展的重要动力。绿色全要素生产率增长的核心是绿色技术创新,但绿色技术的研发具有高风险,回报周期长的特点,这就需要金融体系发挥其资本支持和分散风险等作用。目前
山地果园喷雾作业中,采用管道喷雾可大大提高喷雾效率,但管道喷雾作业结束后在管道内仍会残留药液,目前处理剩余药液的一般方法是用清水冲洗管道,这种方法既容易造成农药浪费