使用机器学习方法进行新闻的情感自动分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:caiql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究机器学习方法在新闻文本的情感分类中的应用,判断其是正面还是负面。我们利用朴素贝叶斯和最大熵方法进行新闻及评论语料的情感分类研究。实验表明,机器学习方法在基于情感的文本分类中也能取得不错的分类性能,最高准确率能达到90%。同时我们也发现,对于基于情感的文本分类,选择具有语义倾向的词汇作为特征项、对否定词正确处理和采用二值作为特征项权重能提高分类的准确率。总之,基于情感的文本分类是一个更具挑战性的工作。
其他文献
目的:探讨多层螺旋CT血管造影对胰腺癌侵犯胰周血管的判断及其意义。方法:使用Toshiba Aquilion 16层螺旋CT对胰腺癌患者扫描后,进行动脉期和门脉期胰周主要血管CTA三维成像。
环境艺术设计与建筑生活空间之间存在不可分割的密切联系,建筑以及组织结构会受到多种客观因素的直接影响,其中就包括环境艺术设计,最终对人们的生产生活造成不同程度的影响
我国钛铁矿资源总量庞大,随着钛铁矿矿石性质的变化,钛铁矿矿石选矿难度增加,传统的浮选药剂已不能满足生产要求。近些年来的研究大多致力于传统药剂的组合和浮选新药剂的研
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
<红楼梦>是中国文学史上"史诗"性的文学巨作.<红楼梦>之梦境的意蕴体现在"幻中求真"之境与"镜花水月"之境.其梦境的内涵体现出作者创作的象征意蕴.
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
介绍了一种可对大尺寸工件进行无导轨精密测量的系统。以有高稳定性和强抗干扰能力(室外可达10-7 的双纵模热稳频He Ne激光器为光源,其拍频约为790MHz,拍频波长约376μm;以
2015年2月,大连市住房公积金管理中心(以下简称“大连中心”)通过中央精神文明建设指导委员会复查,继续保留“全国文明单位”称号。  多年来,大连中心以便民惠民为宗旨,以改革创新为动力,加强业务建设,切实保障和改善住房民生,推动了各项工作科学、协调、健康发展,取得了突出成绩。  ——加强资金归集运用,实现良性循环。狠抓归集拓面,努力推动住房公积金“应建尽建、应缴尽缴”。大力发展个人住房公积金贷款业
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技