【摘 要】
:
近年来,随着电子商务的发展,广大网络用户已经从过去单纯的信息接收者变成评论的主要发布者,因此生成了大量关于网络商品评论的数据。充分挖掘和利用这些信息显得格外重要。消费者在网购评论信息中包含了对所购商品的情感倾向,不仅可以帮助新的消费者购买最符合要求的商品,同时可以让商家综合广大消费者的评论来改进商品,进而提升用户满意度,促进购买量。利用现有的自然语言处理技术来分析这些评论文本的情感倾向,成为很多研
论文部分内容阅读
近年来,随着电子商务的发展,广大网络用户已经从过去单纯的信息接收者变成评论的主要发布者,因此生成了大量关于网络商品评论的数据。充分挖掘和利用这些信息显得格外重要。消费者在网购评论信息中包含了对所购商品的情感倾向,不仅可以帮助新的消费者购买最符合要求的商品,同时可以让商家综合广大消费者的评论来改进商品,进而提升用户满意度,促进购买量。利用现有的自然语言处理技术来分析这些评论文本的情感倾向,成为很多研究人员关注的热点研究领域之一。基于上述背景,本文开展了对网络商品评论信息的情感分析研究,主要研究的工作内容主要包含以下两个方面:1.采用BERT语境化词向量代替传统的词嵌入向量。传统的词嵌入向量是静态词向量,无法解决“一词多义”的问题,为此引用BERT模型获取到具有上下文信息的动态词向量。实验结果表明基于BERT模型得到的动态词向量相较于静态词向量能够更准确的实现文本情感分类。2.本文搭建一个基于注意力机制的网络结构,用于学习目标与上下文本之间的关系。模型通过注意编码层获得有效的上下文表示,利用目标特定注意层获得针对特定目标的文本表示向量,之后通过输出层预测出情感极性。本文通过多组实验,确定了网络结构中重要参数的最优值,并通过与多种模型进行对比实验,验证了该模型的有效性。实验表明该模型与现有的基准模型相比较情感分类准确率更高。此外,为了解决标签为中性的训练样本是不可靠的问题,本文在模型的损失函数中添加了标签平滑正则项。实验结果表明添加标签平滑正则项后,在三个公共数据集上平均准确率提升了 1.08%。同时,基于上述模型实现一个商品评论的情感分析测试服务。本文使用Django框架搭建Web系统,整合模型,实现该服务的可视化展示。本文将BERT预训练模型得到的动态词向量应用到情感分析任务中,同时构建了一个基于注意力机制的网络模型,实验结果显示预训练的词向量和该模型在情感分析任务上取得不错的效果。
其他文献
阅读是学习英语,提高英语能力的一个有效途径,学生能够通过阅读快速的获得信息,同时也能提高自己词汇量的积累.农村小学处在一个相对不利的地理位置,有关部门对此的图书投入
随着癌症患者生存期的延长,恶性肿瘤骨转移在临床上日益多见,发病率较高,易导致进行性骨痛、活动能力受限或病理性骨折,影响病人的生存质量。我科自1997年5月~1998年4月对28例恶性肿瘤骨转移所
根据水泥性能试验的特点确定预测效果的计算方法,将灰色系统理论应用于水泥性能试验的评价和优化,其结果能为决策提供多方面的信息。文中给出了评价和优化和优化水泥性能的应用
近年来,我国引进或引进技术生产的德国洪堡辊压机,是水泥厂的关键机械设备。洪堡公司要求,每月对辊面磨损情况进行一次检查,当累计磨损值为7mm时,需要重新补焊,补焊质量直接关系到辊压
1 调整配料方案逐步向“二高”、“一中”过渡实施ISO后我国水泥标号与国际相比有所降低,就矿物组成而言,主要是硅酸盐矿物偏低、熔剂矿物偏高,因此提高硅酸盐矿物总和尤其是C3S
本文在原Handle系统的基础上,对其源代码和协议进行扩展,设计并实现了支持单记录访问的控制的扩展Handle系统RACEH(Record-Level Access Control Extended Handle System),通
目的 确定测定人血清中镍钴含量方法的可靠性,测量肺癌病人血清镍、钴的含量。方法 用电化学的2.5次微分阴极溶出伏安法,以JM-01悬汞电极为工作电极,在弱碱性介质中测定血清镍和钴。
本文述叙了天津水泥厂采用低碱原料配料,并辅之以必要的工艺条件和检测手段,生产出低碱水泥的全过程。
将国际上现行估算可能最大降水(PMP)的途径概括为水文气象途径和统计概化途径。水文气象途径估算PMP的方法,又概括为间接型和直接型两类方法;对统计概化途径,介绍了赫希费尔德(Hers
目的探讨人性化护理在产后护理工作中的应用效果。方法选取我院2013年10月—2014年10月收治的产妇72例,依照随机方式对其进行分组,即常规组与研究组,每组36例。对常规组产妇