基于机器学习的中文评论倾向性分类实证研究

来源 :信息网络安全 | 被引量 : 2次 | 上传用户:qzawxsecd829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章对长度短、变形词多的中文评论的倾向性分类问题做了深入研究,分析了目前比较流行的几种算法,其中特征选取方法选取了卡方统计量(CHI)、信息增益(IG)、互信息(MI);分类算法选取了K最邻近节点(KNN)方法、支持向量机(SVM)方法、朴素贝叶斯(Naive Bayes)方法。通过两两组合进行实验,最终的实验结果表明,特征选取方法采用IG,分类算法采用Nave Bayes效果较为理想。
其他文献
当下的互联网世界,“人肉搜索”正成为一大热门术语。人肉搜索现象目前正成为社会各界关注的焦点。对于人肉搜索所产生的法律问题,人们却众说纷纭,莫衷一是。
加强和改进企业的党建工作,要从加强党组织政治核心地位出发,提高认识,摆正位置,在考虑企业改制的同时一并酝酿、筹划党建工作,力求企业改制与企业党建做到三个同步。 第一
在全面分析国内外有关气候变化著述的基础上,本文指出,就气候变化的自然因子而论,未来气温有可能下降。从人为因子而言,温度有可能上升。当升温肘,北美及地中海西北部等地可能趋于干旱,而欧亚、南美及澳大利亚等地不可能出现干旱。但升温引起的海面上升是全球性的,对我国沿海地区将产生巨大影响。
来自苏州草鞋山遗址年代学,生物地层学和沉积学的分析结果表明,本区新石器文化演进与全新世气候突变的事件有关。高分辨率,连续的孢粉,粒度和磁化率记录证实,崧泽文化是在暖湿气候
互联网时代的到来,已将人们真正带入到一个数字化生存的全息社会,由现代信息和通讯技术引发的这场新产业革命,正在衍化为一场全球性的社会变革。包括各个国家和地区的现有生产与生活方式、经济基础与上层建筑、价值观念、文化传统与社会主导意识形态在内的所有一切,都将在这一场世纪性变革中接受新的挑战与考验。对于维系传统社会固有秩序的磐石力量的国家权力与法律制度来说,如何规整社会生活的新秩序,重树法律制度的新权威,
在野外采样、室内分析和前人研究资料的基础上,对我国不同地带沙地盐分状况及其分异规律、盐分含量与气象要素的关系、沙地植被对土壤盐分淋溶的影响等方面进行了探讨.
国务院国资委日前在京召开中央企业负责人会议,国资委主任、党委书记李荣融强调,下半年中央企业工作要从着力资源整合、提高运行质量人手,切实采取扎实有效的措施,转变发展方式,提
随着计算机技术的发展,传统PCBIOS已逐渐成为了现代计算机发展的瓶颈。为了解决BIOS的局限性和相关的问题。Intel公司提出了可扩展固件接口(EFI)的规范标准。作为下一代BIOS,EFI为启动操作系统前的程序提供了一个标准环境。EFI规范具有良好的可扩展性,模块化设计和较低的入门门槛等优势,它大大方便了整个硬件工业的创新和发展。文中详细介绍了EFI,指出EFI存在的一些安全问题,指出了实现E
近4个月来,丰田公司接连爆出油门踏板、驾驶座脚垫、刹车等部件缺陷,先后宣布在全球范围内召回多款车辆合计850万辆,这比丰田去年一年在全球售出的车辆还要多。
在2008北京奥运会知识产权保护中,版权保护具有重要地位和作用,互联网成为此次奥运电视转播的主要途径之一,抓好网上奥运赛事报道的版权保护工作意义重大。本文记录了去年以来国家和业界在保护网络版权方面所做的各项工作,并结合我国现行的网络版权保护法律进行了分析。