一种基于预分类的高效SVM中文网页分类器

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhangsswei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等。提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现。实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高。
其他文献
重金属对水体的污染已经成为危害最大的污染之一.综述了水体重金属污染的处理方法,主要有化学法、物理化学法和生物法,并对水体重金属污染处理技术的发展方向进行了展望.
(郑州大学 材料科学与工程学院,河南 郑州 450000)  摘要:在现代科研和实践中,电子显微技术,包括电子显微镜和激光共聚焦显微镜及其相关领域的技术,在材料分析工作中得到越来越多的应用。《电子显微新技术》以其独特的优势尤其在材料、机械、电子、化工等学科中得到了广泛的推广与应用。我们针对该课程在授课过程中的情况,从教学内容以和教学方法及手段方面做了总结,并提出了心得体会。  关键词:电子显微;新
如何通过更少的资源,生产出更多、更优质的食物,是未来农业发展的主要方向。
seminor教学法对学生实践和科学能力的提高有着积极的作用。文章对seminor教学法进行基本介绍,并在此基础上结合国际商务专业硕士的培养特点,具体分析了seminar教学法在国际
提出一种在双目视觉中利用随机三角形纹理进行动态变形表面四维测量的方法。生成随机的三角形纹理,将纹理转印到纸、布等需要进行测量的对象表面上;用标定的两个同步相机拍摄表面的动态变形过程,获得两个同步的图像序列。使用提出的方法,检测每个图像上的三角形;使用提出的三角形描述符和三角形极线约束方法,匹配第一帧图像上的三角形,并根据匹配的结果,测量物体表面在第一帧中的三维信息;根据所测的信息生成每个三角形的局
我是一个藏族,却在美丽的西子湖畔生活了20多年了,这里的人们对我很好,还给了我很高的荣誉。十多年前被推举为杭州市的政协委员。说来也巧,我们家祖孙三代都是政协委员。
今年2月,从加拿大回国的画家王荣松万万没料到,这次回拉萨省亲的过程中会遇上几位20年前的老同学,几位仅结缘三个月而感情甚笃的拉萨首届业余美术培训班的老朋友。
如何提高学生在地质填图实习中的积极性,是当前地质类院校亟待解决的难题。本文结合野外地质教学实践认为,教师应该加强教师的知识储备,选择合理的授课方法,建立和谐的师生关系,制定有效的考核方式。
目的探讨低频电刺激(LFS)对脑梗死大鼠神经功能和梗死侧脑组织神经干细胞(NSC)增殖、血管再生的影响。方法制作大鼠永久性大脑中动脉梗死模型(MCAO),随机分为假手术组、对照组和实验
提出一种新的英文文本检索算法,该算法将英文文本映射为26阶频率矩阵,然后通过奇异值分解,对文本表示空间进行降维处理,并融合第一奇异值分量和第二奇异值分量的特征,得到既