基于信息增益的中文网页SVM分类研究

来源 :上海师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:busyouweb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文网页文本分类中特征降维方法和传统信息增益方法的缺陷和不足做出优化改进,旨在有效提高文本分类效率和精度.首先,采取词性过滤和同义词归并处理对特征项进行初次特征降维,然后提出改进的信息增益方法对特征项进行特征加权运算,最后采用支持向量机(SVM)分类算法对中文网页进行文本分类.理论分析和实验结果都表明本方法比传统方法具有更好的性能和分类效果.
其他文献
钠离子依赖的中性氨基酸转运蛋白2(SNAT2)属于SLC38家族,参与小的中性氨基酸跨膜转运,在哺乳动物组织中广泛表达.SNAT2的功能紊乱可以导致许多神经性疾病,如阿尔茨海默症、帕金森症
连续配筋水泥混凝土路面是一种新型水泥混凝土路面技术.它具有承受重载交通和耐久性方面的优势.结合张石高速石家庄段路面二标的28cm连续配筋水泥混凝士施工,对连续配筋水泥
一、概述 随着人们环保意识的加强,鸟类的繁衍数量逐渐增多,给输电线路造成了很大危害。根据近几年来的统计,每年均有十几次拆除鸟巢工作,2001年还有一次导致110kV从兔线发生故障
数字电路设计中值滤波器时,面积和速度上的考虑非常重要.面积上要求使用的逻辑资源尽可能少;速度上则要求系统能在较高时钟频率上工作,并用尽可能少的时钟周期完成1帧滤波或进行实时滤波.设计的新型中值滤波器的硬件结构为带2个Buffer的3窗结构,并用奇偶排序网络作为滤波器功能逻辑模块的理论依据,在FPGA平台上进行结构设计,使用ModelSim仿真验证了结果,最后实现了视频图像滤波.实验分析表明,设计的
以水热法成功制备了(110)面暴露的高活性多孔单晶CeO2空壳球催化剂样品,研究了其形成过程并提出了相应的形成机理.通过X射线衍射、透射电镜及低温氮气吸附/脱附等温线对催化剂结构
教师是院校改革发展和提高培养人才质量的主力军,是决定教学和科研水平的关键因素.在新的世纪,要充分发挥院校培养人才的主渠道作用,大力培养新型高级技术人才,必须要加强教
现今,房价问题成为我国民众关注的焦点问题。与世界其他国家相比,我国的住宅价格与居民收入的比例大大高于欧美国家,不符合国际合理的住宅价格与收入比例。本文从我国房价现状出
道德素质是大学生适应社会的基本要求.当代大学生正面临着一个前所未有的变革时代,社会主义现代化建设实践对未来人才素质提出了很高的要求,其中自然包括道德素质.
本文简要分析了目前计算机应用技术专业建设存在的主要问题,提出了建设计算机应用技术专业的思路,针对计算机应用和信息管理复合培养模式进行了分析,阐述了该方向的培养目标
【正】近年来,金融系统发案多,而农村信用社尤其多,这是什么原因呢?对此笔者对山西省长治市农村信用社1985年以来发生的55起案件进行了调查.调查结果如下: