EM_kNN算法在文本分类中的应用

来源 :福建电脑 | 被引量 : 0次 | 上传用户:suibianyidianyaoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
kNN算法是一种重要的文本分类算法,但其存在没有局外监测,类的某些相关信息无法利用的缺点,而且在许多文本分类中获得已标志的训练集相当昂贵,所以本文提出一种新的EM_kNN文本分类算法,此算法基于EM算法的思想,根据kNN文本分类模型,对文本进行分类,将已标志文档和未标志文档相结合对kNN文本分类算法进行发展.
其他文献
幂问题是初中数学的一个难点,也是一个重点,要正确地解答它们,除了灵活利用幂的运算性质外,有时还要注意如下三种变形:
分析WAP1.2与2.0安全协议的差异,指出了WAP2.0中的SSL/TLS协议具备的极大优势.在此基础上结合当前移动终端的特点,给出了一个完整的SSL/TLS客户端协议分析实现方案.
摘要:自我国改革开放以来,交通及服务行业获得了空前的发展,传统的营业税也浮现了重复征收的问题,为了改善此种状况,我国自2012年开始实行营改增的税收政策,并首先将上海作为试点单位,而后在全国范围内逐渐展开。作为税制改革的重大举措,营改增的积极成效已经在企业中初见端倪,大大减轻了国内企业的税收负担。但营改增无疑也会给企业带来一定的影响与挑战,只有深入地了解分析了营改增税收政策的内容及意义,才可以更好
摘要:“营改增”后施工企业财税工作发生了一些变化,新的工作形式中也出现了一些问题。本文首先分析了“营改增”后施工企业财税工作开展的主要问题,然后细致讨论了“营改增”后财税工作的开展策略。旨在为施工企业的财税工作者提供参考。  关键词:营改增;施工企业;财税工作  一、“营改增”后施工企业财税工作潜在的问题  2015年后施工企业要全面实行“营改增”,这种变化会影响企业的财税工作,具体的影响主要是以
局城网的使用非常广泛,网外用户不能访问局城网内的全部资源,给用户带来了不便。为此,研究局城网的网外访问,就是一个具有实际意义的问题。本文介绍了Hnux平台下的Squid代理服务
三角函数的最值是对三角函数的概念,图象和性质以及对诱导公式,同角间基本关系式,两角和、差三角函数公式的综合考查,也是函数思想的具体体现,在高考中占有重要地位,也是高考考查的
复数的加减法运算包括两个方面:复数的代数加减法运算与复数加减法的几何意义.这两个方面都需要掌握,但是,相对来说复数的代数加减法运算应当重点掌握,因为高考考查复数部分的重点