情感分类特征选择方法研究

被引量 : 0次 | 上传用户:asdfghjkg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,为了处理网络中大量带情感的文本信息,情感分析技术受到了广大研究者的广泛关注。情感分析技术旨在利用自然语言处理技术从文本中挖掘有关情感的重要信息。然而,情感分析和其他文本分类一样面临着高维度特征空间问题,该问题在造成特征冗余的同时也使得一些有效的学习算法难以施展。因此,情感分类中的特征选择方法研究具有重要的理论研究意义和实用价值。本文主要针对情感分类中的特征选择方法开展了以下几方面的研究工作:首先,本文针对情感分类中数据不平衡分布问题,提出了三种不同的基于欠采样方法的特征选择模式,并比较了四种经典的特征选择方法在这些模式中的分类性能。实验结果表明,特征选择方法可有效解决不平衡数据情感分类任务中的高维度特征空间问题。其次,本文提出了基于二部图的半监督情感分类特征选择方法。借助二部图模型和标签传播算法来计算每个特征的情感概率,通过对特征的情感概率进行排序实现特征选择。多个领域的实验结果表明,基于二部图的特征选择方法明显优于随机特征选择,在半监督情感分类任务中能够有效降低特征空间维度。最后,本文提出了一种面向跨语言情感分类的特征选择方法,用于解决双语情感分类任务中因特征扩展而导致的高维度特征空间问题。其核心思想是利用信息增益(IG)方法挑选出标注样本与未标注样本中的区分度较高的共有特征,接着借助选择出的种子特征,利用点互信息(PMI)获取未标注样本中的其他独有特征。实验结果表明,本文方法有效解决了双语半监督情感分类任务中特征空间较高的问题。
其他文献
存货是企业的重要资源,存货管理水平的高低是对一个企业内部控制效果的评价标尺。它是满足企业生产经营需要的重要财产物资,它能够为企业带来经济效益。因此,加强对存货的管
目的:评价氨磷汀(amifostine)对不同化疗药物抗宫颈癌HeLa细胞的影响。方法:用MTT法分别测定顺铂、长春新碱、依托泊甙和丝裂霉素对体外培养的HeLa肿瘤细胞系的抑制作用,实验组加
蛋白激酶又称蛋白质磷酸化酶,是一类能使蛋白质磷酸化的酶。它在细胞信号转导通路中具有重要的作用,参与调控细胞增殖、生长。促分裂素原活化蛋白激酶(MAPK)信号转导通路是细胞内
写作过程模式主要分为阶段模式、认知过程模式、社会互动模式和社会认知模式,这4种模式分属不同时期,有不同的理论支撑,对“意义”的形成有不同的假定,对写作者、读者与文稿
<正> 早在1921年,满铁试图利用会社组织入植日本农业移民,遂在奉天以资本金1千万元成立东亚劝业株式会社,而后该会社在通辽不择手段地购买土地,进行农业侵略,但不断遭到东北
流域大规模水电站群联合发电优化调度具有时间和空间的多维性、库群入流复杂性、服务和调度主体非单一性等特点,受水文气象、运行控制、用水需求、电网负荷等因素制约,水力、
<正> 宋庆龄是活跃于中国政治舞台上的著名历史人物,她参与了两次国共合作,尤其是在第二次国共合作中对中华民族的独立和解放事业作出了杰出的贡献。本文通过对宋庆龄在第二
会议
目的:探讨相关炎症指标与氧化应激指标在大鼠早期动脉粥样硬化中的表达及应用瑞舒伐他汀(Rosuvastatin)、普罗布考(Probucol)干预后对各项指标的影响,并对两药作用进行比较。
近年来,黑磷引起了人们的广泛关注。研究表明,黑磷具有蜂窝状的褶皱片层结构,其热力学稳定,在光电子、催化、储能、生物医药等领域都展现出潜在的应用前景。作为一种新型的二
中国传统医学(中医)已用于临床实践了几千年。在中医治疗体系中,中药对疾病的预防和治疗起着不可或缺的作用,尤其是复杂和慢性病的治疗。Swertia pseudochinensis(在中国称为当药),