基于支持向量机的中文极短文本分类模型

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:b110701007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端设备的不断普及,微信、网络即时新闻、电商客户产品评论等富含极短文本数据的信息呈爆发式增长。为了有效提取极短文本中的关键特征信息,提出了一种基于支持向量机的极短文本分类模型。首先对原数据进行数据清洗并利用Jieba分词将清洗过的数据进行处理;再将处理后的数据存入数据库,通过TF-IDF进行文本特征的提取;同时,利用支持向量机对极短文本进行分类。经过(1-0)检验,验证了模型的有效性。实验以芜湖市社管平台中的9906条极短文本数据作为样本进行算法检验与分析。结果表明在分类准确率方面,该方法相比于朴素贝叶斯、逻辑回归、决策树等传统方法得到有效提高;在误分度与精确度指标上匹配结果更加均衡。
其他文献
<正>作为连接品牌与粉丝的工具,四季沐歌联手微博让红包飞,在线下海量触达的基础上,通过微博扫码的方式,通过其构筑O2O营销闭环轻松拉近品牌与消费者的距离,并有望全面拉动其
目的:观察泽泻丹明饮治疗冠心病合并餐后2h血糖异常疗效。方法:将81例冠心病合并餐后2h血糖异常患者随机分为2组,对照组用西医基础治疗,包括常规扩冠、调脂、降压等治疗,但未
目的:探讨头孢地尼对郑州市分离的致病菌感染小鼠的体内抗菌作用。方法:以最小致死量(MLD)0.5 ml腹腔注射金黄色葡萄球菌、肺炎链球菌、肺炎克雷伯菌和大肠埃希菌感染小鼠,建
目的:探讨胃食管反流病(GERD)各中医证型的反流类型特点。方法:对140例胃食管反流病患者进行中医辨证分型,行胃镜检查、24h食道内pH和胆红素联合监测,分析胃食管反流病各中医
<正>6月15日,李克强总理考察工信部,专门来到重大技术装备处,听取推进中国制造2025和相关情况。李克强说,重大技术装备责任重大,你们要抓紧推动相关标准的制定和清理,抓住智
目的:了解我院Ⅰ类切口手术围术期预防性应用抗菌药物情况,为加强抗菌药物临床使用管理工作提供参考。方法:采用回顾性调查方法,对2013年7—9月我院665例Ⅰ类切口手术出院患
<正>同志们:我省市、县(市、区)和乡镇人大同步换届选举工作,按照全国人大和省委的统一部署,从2006年7月开始到2007年2月为止,历时半年多,在全省22个市、县(市、区)和202个乡
目的探究腹腔镜直肠癌根治术中应用舒适护理效果。方法将2017年1月~2019年2月我院开展腹腔镜直肠癌根治术患者63例随机分为两组,对照组31例开展常规护理,观察组32例在常规护
本文从单相接地故障时产生的零序电流入手,从理论出发结合温州电网的实际情况逐步推进,实现基于零序电流法的小电流接地选线的方法。结果表明该方法有效可行,切实减少电网负
目的研究肥胖与非肥胖、高血压与非高血压人群膳食结构的特点。方法利用“中国健康与营养调查”研究项目中山东省的相关资料,选取2000年调查中18~65岁成人作为研究对象。用主