基于三元词组模式的微博情感分类方法

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:liyan76669956
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博的倾向性分析问题,提出了一种基于三元词组模式的情感分类方法。该方法通过构造情感词典及微博的三元词组模式,对未标注语料自动进行情感评分并标注情感极性,然后使用自动标注的语料训练得到情感分类器。在测试集上的实验结果表明,使用无人工参与标注的训练语料达到了79.26%的测试正确率。 According to the tendency analysis of Weibo, this paper proposes a sentiment classification method based on the three-phrase model. The method constructs the sentiment dictionary and microblogging ternary phrase mode, automatically sentiment scores and annotation emotional polarity on the unlabeled corpus, and then uses the automatic annotation corpus training to get the emotion classifier. The experimental results on the test set show that the training corpus with no human participation marks achieves 79.26% of the test accuracy.
其他文献
本文介绍采用改良的Harrison分离骨髓造血细胞方法,用40%和70%不连续Percoll介质梯度,从15天Wistar鼠胚肝中分离中幼、晚幼有核红细胞。从70%Percoll梯度界面(比重1.095 g/ml)可
大量的热通过冷藏库的四壁、顶部和底部而渗入冷间內部,抵销这种热所需要的耗冷量,依冷藏库的种类而不同。如生产性冷藏库,相当于制冷设备全部能力的10—15%;分配性冷藏库为6
在过去几年中,空调节能技术已有很大发展。空调应用技术发展水平已经延伸至各个领域中,从而改善了各种系统的性能。但是,这些尝试往往被限制在传统的空调概念的框框中,即蒸
论市场经济下期刊组稿工作性质的转变■王力■朱晓军随着社会主义市场经济的发展,期刊作为一种特殊商品进入市场已是一种不可逆转的必然趋势。期刊进入市场后,经济活动必然要从
一、概况塔里木河(以下简称塔河)是我国最长的内陆河.从阿克苏河、叶尔羌河、和田河交汇处至台特马湖,全长1224公里。塔河流域冲积平原广阔,西起阿拉尔,东亚台特马湖,北以天
自然杀伤细胞(NK)监视肿瘤发生、防御病毒感染,是与机体自然抵抗力密切相关的细胞。1970年仙道氏、Herberman和Kiessling等已发现,淋巴细胞系统的某种细胞,不需要抗原致敏,
小鼠脾细胞经两次贴壁除去巨噬细胞,再经两次尼龙毛柱纯化T细胞,尼龙毛粘附的B细胞用抗θ血清加补体去除残余的T细胞后,得到高度纯化的B细胞,在体外用细胞重组实验方法观察B
热水型无泵溴化锂吸收式制冷机勿须耗用电能,利用工矿企业大量排放的废热水(温度为90℃左右)作驱动力、制取冷量、供企业工艺用冷或空调用冷,从而大幅度节约能源。本文介绍了
一、节流过程用损的计算。节流过程是组成蒸汽压缩式制冷循环的重要热力过程之一。在制冷过程中,通常用阀门、孔板作为节流装置,进行节流。其过程可归类为绝热流动,如图1所
针对不完全不确定序数信息下的双边匹配问题,提出了一种新方法。首先,描述了不完全不确定序数信息下的双边匹配问题;接着,将不完全不确定序数矩阵转化为不完全满意度矩阵;其