【摘 要】
:
随着网上购物规模的不断扩大,对商品评论信息进行情感分析不仅可以指导消费者做出更好的购买决策,还能帮助商家了解商品的优劣势,从而调整店铺的营销策略,对买卖双方都具有重
论文部分内容阅读
随着网上购物规模的不断扩大,对商品评论信息进行情感分析不仅可以指导消费者做出更好的购买决策,还能帮助商家了解商品的优劣势,从而调整店铺的营销策略,对买卖双方都具有重要的现实意义。本文主要从三个方面对商品评论文本进行研究,方面提取(Aspect extraction)研究、中文词向量模型研究和方面情感分类(Aspect sentiment classification)研究,主要创新成果如下:(1)提出两种特征选择方法和基于层次关系的复杂方面短语提取算法。为了解决中文商品评论缺少合适的领域词典,而且存在多个词语组成的复杂方面短语等问题,本文首先使用HowNet词典,通过计算方面语义相似度和相关度作为方面提取的语义特征。然后为不同种类的商品构建具有层次关系的特征本体和特征情感词集,结合句法依存关系作为句法依存特征,用于方面提取。另外,通过收集和整理商品评论信息,补充实验数据,用于复杂方面短语提取。在方面提取实验中,四种商品评论的平均准确率、召回率和F值分别提高3%、3.7%和3.5%。在复杂方面短语提取的实验中,精确评价和覆盖评价准确率也取得较好表现。(2)提出结合注意机制改进的 RECWE(Radical Enhanced Chinese Word Embedding)模型。为了解决RECWE模型没有利用上下文词语贡献度不同、各词语中汉字及其偏旁部首和组件的贡献度不同的问题,将模型的两个预测模型引入不同类型的注意力机制。实验结果表明,改进的RECWE模型与原模型相比,在相似度任务上,两份评测文件的成绩分别提高2.89%和1.04%;在类比任务上,三个主题的平均成绩提高2.07%。(3)提出改进的 ASGCN(Aspect-specific Graph Convolutional Network)模型。商品评论文本存在语句长短不一的情况,利用双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)对长度较长的语句进行学习会丢弃与方面(Aspect)相关的语义信息,而且不同种类的商品评论具有不同的领域特性。为此,提出改进的ASGCN模型。利用基于主题分布DI LDA模型进行文本分析,得到不同领域下的词语分布,补充词向量的语义信息。再利用上下文向量,结合注意力机制对方面词语进行权重划分。实验结果表明,与基准模型相比,情感分类的准确率在四种商品数据集上均有提高。
其他文献
数据爆发式增长为存储行业带来了机遇与挑战,如何保证存储系统中数据的可靠性成为亟待解决的问题。基于纠删码的编码技术在保证存储系统数据可靠性的同时,因能有效地减少存储系统的存储开销而广泛地应用在存储系统中。基于纠删码的编码技术主要研究方向有:提高编解码效率,降低存储开销以及减少解码所需数据量。论文以提高编解码效率,降低存储开销,减少解码所需数据量为主要目标,从使用移位和异或操作进行编码且使用Zigza
LDPC(Low-density Parity-Check)码的编译码复杂度较低,目前正广泛的应用于当前的通信系统中,如第四代(4G)通信系统、光纤通信系统等。Polar码是可以证实达到香农极限的编码方案,
随着人工智能和物联网技术的迅速发展,人体活动识别成为了人机交互领域的重要研究方向。其中,基于商用Wi-Fi的人体活动识别技术部署代价低且不需要人体携带设备,因此具有广泛
清末诗坛涌现了许多优秀诗人,欧阳述就是其中一位。欧阳述身处封建乱世,其曲折的人生经历、广泛的诗友交游以及渊博的学识,使得他的诗歌创作达到了很高的艺术成就。他论诗不囿门户,不偏一代,不主一家,主张转益多师。本文重点以《浩山诗集》中所收录的九百余首诗歌为研究对象,从欧阳述的生平经历与诗歌创作入手,将其诗歌进行整理分类,探究其诗学渊源与诗歌艺术特色,从而客观评价欧阳述诗歌在江西诗坛乃至近代诗坛的地位与意
近年来,卷积神经网络的快速发展使得较传统算法有更高的精确度,因此也被广泛应用于多个领域。然而在不断追求更好的精度表现过程中,算法的复杂性与算法模型大小也不断增加,算
近年来,在线数据量呈指数级增长,这些数据的主要部分与基于互联网的电子商务平台和社交平台有关。对于个人或组织来说,想要从巨量的数据中及时提取想要的信息是十分困难的。
随着我们国家经济的不断发展,社会竞争日趋激烈,并驱争先,劳动力的供给跟不上社会的需求,社会需要大量人才的填充,而当这些人才在用人单位创造利益的时候,也面临着一些看不见的潜在的危险,比如工作环境的恶化、繁重的工作任务、巨大的工作压力等等,这些潜在的危险最直观的表现就是反映在劳动者的身体上,可能会带来众多的身体疾病,比如工作中可能会接触有毒有害物质而引起的疾病、因过度劳累所导致的高血压、心肌梗塞等疾病
无线传感器网络(Wireless Sensor Network,WSN)是近二十多年来研究最为热门的技术之一。其自身优势的特点是,与其他技术相比,无线传感器网络可以长时间自主地执行监控任务,且
目标跟踪技术作为计算机视觉领域的研究热点之一,在视频监控,智能驾驶以及人机交互等领域有着广泛的应用。尽管国内外专家学者提出了各种各样的算法,但由于目标跟踪技术应用
随着科学技术的不断发展,现实生活中会有大量的数据产生和积累,这也促使人们不断去挖掘数据背后的信息和价值。聚类分析的结果能了解到数据本身的分布信息和对应的结构,从而