基于深度学习的情感分类和联合实体关系抽取实证研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:huanying19870604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“互联网+旅游”的快速发展,我国在线预订酒店规模迅速扩大。消费者能够在酒店预订平台上发表自己的体验和评价,成为用户做出预订决策和酒店管理人员做出管理决策、评估自身服务质量以及挖掘消费者需求的重要途径。在酒店评论中,包含消费者对酒店服务质量评价的情感倾向,以及对具体评价对象的一个评价。对这些文本进行分析、处理、归纳和总结,对用户分析、市场调查以及探索影响酒店服务质量影响因素有重要参考意义。本文对从携程上收集的88家酒店,共104740条评论,进行情感分类和实体关系抽取,对文本进行情感分类,并抽取其中的评价对象和评价词及其对应关系。对情感分类模型的构建,本文通过人工对评论进行情感标注,分为正面情感和负面情感,其中正负样本比例为9:1,利用Focal Loss代替交叉熵作为情感分类模型的损失函数,该损失函数能够降低简单样本的权重,关注困难样本的训练。本文构建了三个不同网络结构的模型,Text_CNN扩展模型、混合神经网络模型以及FastText模型进行集成学习,在单个模型中FastText模型表现最好,F值为0.8587,通过集成学习能够将F值提高至0.9003,AUC值达到0.9295,较单一模型分类效果有一定程度上的提升。本文提出“EA+BIOES”标注策略对评论文本中的评价对象和评价词进行标注,输入到Bi-LSTM+CRF模型对其训练。利用标注策略将抽取任务转换为序列标注任务,消除传统先进行实体识别再进行关系抽取的累计误差,实现联合实体关系抽取。其中句子中出现的第一个评价对象的F值能够达到0.8387,总体实体的F值为0.7258。本文提出了一种能够大规模从酒店评论中提取消费者观点倾向及实体情感知识的有效方法,为进一步构建酒店评价信息知识谱图提供思路。
其他文献
1954年冬天的一个晚上,周恩来听说北京市交通拥挤,就亲自乘坐公共汽车,来了解交通情况。这天晚上,总理坐完了公共汽车,又改乘电车,在北京市绕了半个圈。在北京图书馆站,有一位乘客认
以航天器空间交会对接为背景,探讨了其网络环境下的鲁棒H?滤波问题。基于传统的C-W方程,重新构建网络环境下航天器交会对接系统的数学模型。选取时滞相关Lyapunov函数并结合自
[摘 要]科创板试点注册制是我国证券市场改革的重要举措,为探究科创板的设立对A股市场的影响,文章选取上證指数、科创组合单位净值、成交量及流通市值加权市场日换手率四个变量指标,通过建立误差修正模型,对A股市场和科创板块进行关联性分析,研究其背后的作用机制,进而提出如何完善证券市场制度、加强市场化改革的若干建议,实现“资本+”的最优配置,提高我国证券市场的包容性及韧性,推动经济长期健康发展。  [关键
合参数的一元一次不等式在初中阶段甚至高中都是疑难问题,找到一种能解决的方法,并把它上升为思想方法,这样同类问题就能迎刃而解了.比如巧用转化思想,把含参数的方程(组)转化成不等
讨论一个一维的反向热传导问题.对于这个不适定问题,采用一种Fourier正则化方法以恢复问题解的稳定性.误差分析表明该正则化方法是有效的,尤其是给出了初始时刻的稳定性.
目的观察改良式负压引流技术应用于骶尾部Ⅳ期压疮伴全身感染效果分析。方法将我院(2016年06月至2019年07月)70例骶尾部Ⅳ期压疮伴全身感染者,随机数字法分成对照组(35例)与
6月11日,中国共产党内蒙古自治区代表会议选举产生出席党的十八大代表40名。代表名单如下(按汉字姓名笔画为序):
由于多媒体同时使用行为的出现以及新的广告形式不断涌现,整合营销传播受到了广泛地关注。广告协同效应是整合营销传播的基本理念。目前有关广告协同效应的研究更多的集中在
党的十八大报告提出,“健康是促进人的全面发展的必然要求。要坚持为人民健康服务的方向,坚持预防为主、以农村为重点、中西医并重,按照保基本、强基层、建机制要求,重点推进医疗
问:“计量”定义为“将数字用于加、减、乘、除运算”正确吗?答:GB/T15835-2011《出版物上数字用法》3.1节中确实将术语“计量”定义为“将数字用于加、减、乘、除运算”。这里混