【摘 要】
:
短文本情感倾向性研究是指对某一个短文本中蕴含的情感极性做出不同极性标准的判别分类。本文在研究短文本情感倾向性任务的时候,首先使用词袋模型对短文本进行向量化建模,然
论文部分内容阅读
短文本情感倾向性研究是指对某一个短文本中蕴含的情感极性做出不同极性标准的判别分类。本文在研究短文本情感倾向性任务的时候,首先使用词袋模型对短文本进行向量化建模,然后采用SoftMax回归对情感倾向性的多个类别做情感极性的判定。同时,本文将深度学习引入到情感倾向性判断中,通过深度神经网络模型对短文本向量做深度的自适应学习,旨在挖掘出短文本向量更深层的隐含特征,取得更好的分类效果。另外,本文对短文本的特征建模进行了改进,分别提出了基于主题模型和基于神经网络语言模型的短文本特征向量建模算法。通过神经网络语言模型对短文本进行无监督深度学习之后,能将文档中词语的信息进行更好的挖掘利用,进而配合后续的聚类算法更好的建模短文本。主题模型可以挖掘出短文本的浅层语义信息,并根据主题信息更好的对短文本进行量化建模,之后本文对建模好的短文本特征向量配合SoftMax回归进行训练与测试。为验证提出算法的有效性,本文基于大规模的商品评论对上述的算法进行实验。由于开放的中文短文本情感语料数量整体较少,不能进行大规模无监督的深度学习实验。本文首先设计爬虫抓取了某知名电子商务网站的商品评论信息以及打分信息,进而对上述的四个算法进行了对比实验。实验结果表明,深度神经网络模型可以更好的学习短文本特征。神经网络语言模型的短文本建模方法比词袋模型的建模方法能更好的挖掘出短文本的语义信息并提升短文本情感分类的准确性。
其他文献
老人作为重要的家庭成员,其身心的健康状况时刻受到我们的关注,随着生理机能的日益衰老,老龄人的自理能力下降和被病痛困扰是不可避免的,多数老人患有老龄疾病,部分老人的生
对沙棘制油进行了论述 ,提出用 4号溶剂浸出沙棘的新工艺 ,介绍了该工艺的先进性及发展前景
<正>数值仿真技术的口益成熟,有限元建模已经成为口腔生物力学研究中的重要技术手段之一。如何与临床实践有机结合来有效解决临床问题,并提高口腔临床技术水平,逐渐成为口腔
基层是路面结构主要承重层,基层质量的好坏对路面的使用寿命有重要影响。在我国,半刚性基层是最广泛应用的基层形式,但是半刚性基层的裂缝等问题制约了其发展,经过近年的试验
水利工程施工安全管理是一项独立的管理学科,也是一项复杂的系统工程。其主要的特点表现为过程的系统性、实施的整体性、工程技术的复杂性、广泛的社会性和工程的不确定性。
关于《美国》的评论很少,但在卡夫卡的作品中,《美国》自有其不可替代的重要性。《美国》的主题、形象等将反复出现在卡夫卡之后的重要小说中,并一以贯之地形成了自己独特艺
十九世纪六十年代,随着资本主义工业革命如火如荼的发展,各方新兴势力风起云涌,印象派绘画也随之应运而生,诞生在经济迅猛发展、瞬息万变的资本主义社会中,因此注定了其与资本主义
由爵床科植物五指山兰(Peristophe lanceolia Nees)的嫩枝和叶提制而得的一种食用天然色素,被命名为山兰红色素。该色素属水溶性,提取得率为4~8%,pH6.8~8时最大吸收峰波长为580nm,
商业银行等信贷金融机构当前面临的主要风险中,信用风险是其不得不面临的风险之一。本世纪初,美国发生次贷危机的根本原因就是信用风险,同时由于世界各国间金融、经济等方面
为更好地应对当前和未来面临的挑战,美国情报界创建了情报百科。该系统从创建的那一天起,就充满了争议,其作用也不断受到质疑。着重介绍了该系统的起源、发展状况、核心理念