一种新的中文文本分类算法——One Class SVM-KNN算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:ly303237971
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文文本分类在数据库及搜索引擎中得到广泛的应用,K-近邻(KNN)算法是常用于中文文本分类中的分类方法,但K-近邻在分类过程中需要存储所有的训练样本,并且直到待测样本需要分类时才建立分类,而且还存在类倾斜现象以及存储和计算的开销大等缺陷。单类SVM对只有一类的分类问题具有很好的效果,但不适用于多类分类问题,因此针对KNN存在的缺陷及单类SVM的特点提出One Class SVM-KNN算法,并给出了算法的定义及详细分析。通过实验证明此方法很好地克服了KNN算法的缺陷,并且查全率、查准率明显优于K-近邻算法。
其他文献
为了将二维定位算法AOA和TDOA拓展成三维定位算法,文中提出了一种基于AOA/TDOA和UWB传输技术的WSN节点三维定位算法。该算法采用二维的AOA测角算法测量未知节点与信标节点之
一年级小学生的主要任务就是识字,且语文新课程标准也明确提出低年级识字任务:喜欢学习汉字,有主动识字的愿望;会认1600个左右的常用汉字,并会写其中的800个左右。这对于低年
资本市场监管制度的变迁主要包括机构重置和法规变革两个方面,本文基于不同时期发布实施的重大监管政策,将资本市场审计监管制度加以梳理。
计算机录入编辑盲文是信息处理的特殊应用领域,是特殊教育中的重要研究课题。文中将盲文制作为特殊符号,通过制作字库,编写个性化码表,然后嵌入到主流输入法,从而实现盲文与
云计算环境更加复杂,对计算机网络安全有了更高要求。为更好地推进云技术的发展及应用,构建安全的计算机网络环境尤为重要。本文分析了云计算环境中计算机网络安全的重要性,
在英语教学中,学生预习工作的有效性很大程度上取决于预习导学环节的设计是否合理,因此,如何更科学地设计预习导学环节成了教师必须研究的一个重要课题。因此,要应用"导学案"
通过微晶纤维素的氰乙基化试验,研究了反应温度和反应时间对氰乙基化产物取代度(DS)的影响,表明在50℃以下,微晶纤维素的氰乙基化取代度随反应温度的升高和反应时间的延长而增
禁忌是世界各民族之间普遍存在的一种文化现象,它制约着人们的言语行为与社会交际。中西文化的巨大差异直接导致了汉英禁忌语的迥异。这种差异表现在宗教信仰、姓名称呼、老
结合仁爱版初中英语教材,探究如何培养初中生的阅读能力。提出在初中英语阅读教学中,教师可以通过利用课本教学,激发阅读兴趣;结合阅读题型,培养阅读技巧;精选课外材料,扩大
高职院校校本专业评价是对学校整体专业建设情况的一个诊断与分析,评价目的、评价主体、评价标准、评价方式、评价制度是影响高职院校校本专业评价有效性的重要因素。高职院