基于机器学习的中文微博情感分类实证研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wintertear0704
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用三种机器学习算法、三种特征选取算法以及三种特征项权重计算方法对微博进行了情感分类的实证研究.实验结果表明,针对不同的特征权重计算方法,支持向量机(SVM)和贝叶斯分类算法(Na(i)ve Bayes)各有优势,信息增益(IG)特征选取方法相比于其他的方法效果明显要好.综合考虑三种因素,采用SVM和IG,以及TF-IDF(Term Frequency-Inverse DocumentFrequency)作为特征项权重,三者结合对微博的情感分类效果最好.针对电影领域,比较了微博评论和普通评论之间分类模型的通用性,实验结果表明情感分类性能依赖于评论的风格.
其他文献
目的 比较肾上腺素与沙丁胺醇雾化吸入治疗婴儿毛细支气管炎的疗效与安全性.方法 选择本院年龄小于6个月的毛细支气管炎住院患儿86例,随机分为肾上腺素组和沙丁胺醇组,每组43
目的 探寻成人先天性冠状动脉瘘彩色多普勒超声心动图(CDE)特征及规律性.方法 应用CDE检查31例成人先天性冠状动脉瘘,寻找CDE特征及规律性,26例经心血管造影对照,7例行介入治
在山东省地方病研究所的帮助下,山东省邹城市疾病预防控制中心在2000 - 2010年在山东省邹城市建立了克山病病情监测点,按照克山病监测标准要求,对监测点居民进行病情监测,现
提供一种浇包孕育用的可调下料口孕育装置,其不仅可在熔炉出铁时将孕育剂均匀分散地撒入出铁槽的铁液流中,而且孕育剂加入的时间长短可依据孕育工艺的要求随需调整,从而达到
采用计算流体力学软件FLUENT建立了基于有限体积法的二维塑性材料流动模型,对2024铝合金搅拌摩擦焊接过程中材料的塑性流动进行数值模拟,研究了焊接参数影响焊缝区域在沿垂直
采用交、直流交替氧化的方法,改变3005铝合金在硫酸介质中阳极氧化膜的结构与组成,探讨其对膜层电解着色性能的影响。结果表明,交、直流氧化的顺序及相关电解着色参数对电解
根据成温邛高速公路和成绵高速公路的交通量、车型及车速等监测数据,应用美国联邦公路管理局(FHWA)噪声预测模式、JTG B03-2006推荐噪声预测模式和HJ 2.4-2009推荐噪声预测模
提出一种基于张量代数的核主成分分析方法来进行特征提取。该方法可以有效避免维数过高导致计算消耗过大,并合理利用已知训练样本的类别信息。算法先对每一类目标使用核主成分分析手段以形成其各自的特征空间;再通过张量积将所有的特征映射到一高维线性空间;随后直接在此空间上进行线性的主成分分析,即可构造出了适宜的特征空间。其既能有效反映各类样本特征,又能比直接使用核主成分的方法极大降低计算所需的消耗。目标识别实验
对八个设计的型钢混凝土T形柱试件进行静力单调抗剪加载试验,得到了剪切开裂荷载试验值。分析了剪跨比、轴压比、配箍率等参数对剪切开裂荷载的影响,引入了型钢、翼缘对剪切
针对一类散焦模糊置换图像,提出一种基于参数估计的单通道盲分离新方法。该方法基于散焦模糊置换图像的频域特性估计出散焦模糊半径,采用Lucy-Richardson(L-R)算法对置换图像进行盲复原,并通过定义像素梯度绝对值和来对复原产生的振铃效应进行评价,根据评价结果进行分类估计出置换混合矩阵,从而完成置换源图像子块的分离。实验结果表明,针对经历不同置换操作的散焦模糊置换图像,该方法均能获得较好的分离