利用质心向量构建增量式分类器

来源 :第三届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:liu_shuangde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文给出三种启发式规则用于获取根集文档的质心向量。通过使用给定的正例文档,本文首先构建一个与其对应的质心向量,然后利用它提取未标识数据集中的可靠正反样例。文本分类器使用这个逐步扩展的训练集进行增量训练。在Reuters-21578数据集上的实验结果表明,Sum质心向量可以协助分类器提高其分类精度。最后,本文通过实验验证了论文中提出的方法比PEBL算法更高效。
其他文献
文章提出重复频率三角矩阵来自动确定文本各自然段之间的意义联系,从而自动划分文章的意义段。实验表明了该方法较好地反映了文章的客观结构,同时也为自然语言领域提供了一些有
目的 建立HPLC法测定活血化瘀丸中绿原酸的含量方法并对其进行验证.方法 采用反相高效液相色谱法,以Symmetry-C18(4.6mm*250mm,5μm)为色谱柱,乙腈-无水乙醇-3%磷酸(10:90)为
化学消毒剂种类较多,理想的消毒剂应同时具备高效广谱、作用快速、安全无毒、贮运方便、廉价易得等条件。在实际应用中,完全具备理想条件的消毒剂是难以找寻的,使用者应根据消毒
目的 观察中西医结合治疗慢性心力衰竭的疗效.方法 将60例慢性心力衰竭患者分为治疗及对照两组各30例,对照组应用常规西医治疗,治疗组除常规西医治疗外,同时配合中药参芪益心
美《华盛顿邮报》1981年6月12日报道:从眼外科的历史来看,手术治疗近视眼是最大胆的一种疗法。改变眼的形状,眼科医生要围绕着角膜至少须作8次深部的切入手术。4,000名近视
增量学习算法被广泛用于解决面向大规模数据集的机器学习问题。针对文本分类问题,该文提出了增量学习算法的一般性问题。基于拉推策略的基本思想,该文提出了文本分类的增量学习
渐进直推支持向量机(PTSVM)扩展了直推支持向量机(TSVM),有效地解决了不同样本分布需要人工指定工作集正负样本比例问题。但是,把二分类扩展到多分类并非易事。本文提出了一种
会议
目前,果树生产中喷洒农药是防治害虫的主要手段,然而果园中发生的害虫和广泛存在的害虫天敌,在长期的进化过程中,逐步形成了相互依存、相互制约的生态平衡关系。在农药防治害
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分类器的分类效果受到影响。本文提出了一种根
目的 分析社区家庭健康教育护理责任制应用于糖尿病患者的临床效果.方法 收集我院2012年2月-2013年2月期间诊治的糖尿病患者80例作为研究对象,采用随机分组的方式将患者分为