基于语义理解和机器学习的混合的中文文本情感分类算法框架

来源 :计算机科学 | 被引量 : 0次 | 上传用户:rr_uu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速、准确和全面地从大量互联网文本信息中定位情感倾向是当前大数据技术领域面临的一大挑战。文本情感分类方法大致分为基于语义理解和基于有监督的机器学习两类。语义理解处理情感分类的优势在于其对不同领域的文本都可以进行情感分类,但容易受到中文存在的不同句式及搭配的影响,分类精度不高。有监督的机器学习虽然能够达到比较高的情感分类精度,但在一个领域方面得到较高分类能力的分类器不适应新领域的情感分类。在使用信息增益对高维文本做特征降维的基础上,将优化的语义理解和机器学习相结合,设计了一种新的混合语义理解的机器学习中文情感分类算法框架。基于该框架的多组对比实验验证了文本信息在不同领域中高且稳定的分类精度。
其他文献
2011年7月至2013年3月对金沙江下游支流大汶溪进行了6次鱼类资源调查,共设3个采样点,每次调查时间为10~15 d。结果表明,大汶溪共采集到鱼类3目、8科、28属、41种,其中长江上游特有
针对传统高斯滤波算法在滤除噪声的同时会丢失图像部分细节信息的弊端,提出了一种基于不规则区域的高斯滤波算法。在高斯滤波的基础上,通过分析纹理自相关特性,自适应构造局
中国——东盟自由贸易区的建立对区内及各成员国吸引FDI将产生重要的影响,本文首先对中国和东盟各国利用FDI的概况进行了分析,然后着重从静态和动态不同的角度出发,分析了建
提出了利用亚音速高温燃气流进行近空间高超飞行器热环境地面模拟的试验方案,在试验装置试验段,通过高温高速的燃气流引射低速的冷气流,达到仅使飞行器头锥驻点附近区域产生
进行储层特征研究对于油气藏的合理开发和产能建设具有重要意义。环江油田为中生界多油层叠合区,纵向上合油层系多,是典型的岩性圈闭油藏,具有岩性控制成藏的特点。针对该地区的
职场排斥和工作倦怠等职场负向行为普遍存在于组织中。文章选取容易出现工作倦怠感的中小企业管理人员作为研究对象,采用问卷调查的方法,分析了职场排斥对情绪衰竭、玩世不恭
<正> 世间任何事物,都是在一定社会条件下才产生和形成的。在诸多社会条件中,有的起直接作用,有的起间接作用,有的较简捷明了,有的则错综复杂。如果探究清理出来,必将有助于
针对我国目前花生联合收获中摘果效率低、破损率高及易堵塞的主要问题,结合现有的几种摘果方式,研制出一种钉齿式纵轴流花生摘果装置。钉齿式纵轴流花生摘果装置主要包括凹板
随着经济技术的不断发展,我国的城市化建设的进程越来越快,而这也离不开地形测绘工作的开展,但是无论是什么工作都离不开监督管理,尤其是关乎到人们的日常生活的工作,所以本
目的降低口腔科住院患者外出不归率。方法回顾性分析2017年3月~2017年9月在我院口腔科住院治疗的患者共260人,开展品管圈对口腔科进行管理,主题为“降低口腔科住院患者外出不