【摘 要】
:
随着互联网的迅速发展,网络中产生了大量数据信息,其中很大一部分信息蕴含着人们的主观观点和意见,网络信息有效利用的问题日益突出,因为这些信息具有难以估量的价值,所以自
论文部分内容阅读
随着互联网的迅速发展,网络中产生了大量数据信息,其中很大一部分信息蕴含着人们的主观观点和意见,网络信息有效利用的问题日益突出,因为这些信息具有难以估量的价值,所以自然语言处理成为当前非常热门的领域。评论文本的情感倾向性分析是该领域相关研究的主要内容之一。本文以文本语义情感分析为主要研究对象,对文本分析的基本概念和相关理论进行研究和分析,具体研究内容如下:(1)研究了不同停用词表的使用对文本情感倾向性分类的影响。本文首先在传统停用词表的基础上构建了情感分析专用的停用词表,使用不同的停用词表处理后,利用TF-IDF训练词频权重作文本特征,并通过SVM分类器分别做了针对特征选择和文本倾向分类实验。实验表明使用情感停用词表处理后的特征候选集包含了更多的情感信息,并且正向性文本分类的最高准确率可达81.94%。(2)分析时间长短对评论投票机制的影响,并提出了相应的投票标准。针对网络购物平台中八个不同类别的产品评论进行数据处理,合并基于词典方法提取的特征和文本的统计特征项作为分类依据,最后使用线性回归模型对文本评论有无用进行了预测,不同的产品类别取得的结果也不相同,针对积累时间越久远的评论预测的结果会更好,所以加入时间特征的评论投票标准可以使语义情感分析中使用的“答案”更加准确合理。(3)研究深度学习特征提取方法。通过计算词语之间的相似度,获得包含着深层语义信息的低维词向量。以Word2vec训练词向量平均值作为特征,并融合基于统计方法、情感词典方法得到的特征做分类器的输入,采用SVM多分器对评论文本进行了四分类。实验结果表明,该方法解决了传统特征集无法深入反映文本语义的问题,提高了 SVM分类器的分类精度。(4)为进一步提高分界面附近样本的分类精度,提出了改进的SVM多分类算法。以分类器的支持向量为标准,对于识别为某类的样本,根据设定的阈值判断其位置是否在分界面附近,若该样本可能是误判样本,利用KNN算法二次分类判断出该样本类别。实验表明,在四分类实验中,分类准确率最高可以达到85%,F值也比普通SVM多分类的结果高约4个百分点,因而,结合KNN算法的SVM多分类器算法能有效地提高分类精度。
其他文献
计算机自适应测验(CAT)是新型的测验方式,然而在以往的研究中,发现了CAT在测验开始阶段连续答对或答错对被试能力估计会产生较大的影响,本文从能力估计方法的角度来分析。(1)
一、引言浮空器是轻于空气的航空器,主要靠空气浮力产生的静升力克服自身重量升空。总体上,浮空器分为气球和飞艇两类。气球是指没有动力装置的浮空器,而飞艇是自带动力装置
刘安世,(1048-1125),字器之,北宋河北大名府人。元祐初年,宋哲宗年幼,高太后垂帘听政。刘安世被执政的司马光举荐为秘书省正字。后又被吕公著举为右正言,曾出任左谏议大夫一职。作为一个谏官,刘安世尽到了“谏”的责任,不畏强权弹劾官员的不法行为。刘安世是北宋著名的台谏官,在他担任谏官期间因为敢于直谏而被人称为“殿上虎”。他对于国家政事极为关注,他始终以维护“祖宗之法”和“元祐国是”作为评判国家政
论述Samejima等级反应模型存在的不足,该模型用多个难度来描述教育考试中的多级记分试题,通过难度的递增来反映知识重点与能力考查的重要性,没有有效体现多级记分试题的加权
从人类出现以来,最优化的解决问题一直是人们在生产生活中所追求的目标。在探索解决问题方法的长期的道路上,人类不断地优化着自己的逻辑方法的同时,也在生存的自然空间,学习
随着移动智能终端设备的快速发展,越来越多的空间众包任务平台开始出现,比如滴滴打车、美团外卖等等,空间众包已经开始慢慢融入到热门的日常生活中,并与人们的生活息息相关。
随着计算机与互联网技术的迅速发展与崛起,计算机动画在现实生活中的应用面正在迅速扩大,近两年VR与AR等新兴理念的提出与应用更是使得计算机动画大放异彩。作为计算机动画的
目的:通过观察可调节支具在肘关节恐怖三联征术后早期康复中的治疗效果,探讨该方案对改善肘关节恐怖三联征术后患肢活动功能的临床价值。方法:选择2018年01月至2019年10月在泉州市正骨医院骨伤科住院行肘关节恐怖三联征手术的患者40例,根据患者的入院日期,按照随机数表法将治疗病例分为两组,试验组20例,对照组20例。对照组采用恐怖三联征术后中药桃红四物汤+石膏外固定3周+拆除石膏后行患肢功能锻炼方案
在当今信息时代,依托于互联网的迅猛发展以及Web数据量爆炸式的增长,通过分析数据能够获得更多有价值的信息,进行Web数据分析之前的一个主要任务就是将不同来源的Web数据进行
随着人们对大型重要基础设施安全性、耐久性与正常使用功能的日渐关注,针对基础设施安全监测的研究与监测系统的开发应运而生。与传统人工检查方法不同,安全监测可以实时监控结构的运营状态,是相对动态的。智能感知是隧道智能化施工的核心要素之一,而智能感知的关键技术是监测技术。隧道工程环境具有复杂性、隐蔽性和突发性等特点,目前广泛运用于隧道领域的智能感知传感器种类少、监测参量单一,难以很好的满足复杂施工现场监测