基于蚁群聚集信息素的半监督文本分类算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：xy479977530

【摘要】

：

半监督文本分类中已标记数据与未标记数据分布不一致，可能导致分类器性能较低。为此，提出一种利用蚁群聚集信息素浓度的半监督文本分类算法。将聚集信息素与传统的文本相似度计

【作者】

：

杜芳华冀俊忠吴晨生吴金源

【机构】

：

北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室,北京市科学技术情报研究所

【出处】

：

计算机工程

【发表日期】

：

2014年11期

【关键词】

：

文本分类半监督学习聚集信息素自训练 Top-k策略随机选择策略 text classificationsemi-supervised learninga

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

半监督文本分类中已标记数据与未标记数据分布不一致，可能导致分类器性能较低。为此，提出一种利用蚁群聚集信息素浓度的半监督文本分类算法。将聚集信息素与传统的文本相似度计算相融合，利用Top-k策略选取出未标记蚂蚁可能归属的种群，依据判断规则判定未标记蚂蚁的置信度，采用随机选择策略，把置信度高的未标记蚂蚁加入到对其最有吸引力的训练种群中。在标准数据集上与朴素贝叶斯算法和EM算法进行对比实验，结果表明，该算法在精确率、召回率以及F1度量方面都取得了更好的效果。

其他文献

农业技术引进在农业技术进步中的作用

期刊

农业技术进步栽培技术技术引进农业科技工作农业科技发展农业和农村经济农业科学技术

创新实验教学，激发学习兴趣

化学是一门以实验为基础的科学，加强演示实验和学生实验，充分发挥实验在化学教学中的重要作用，是激发学生学习兴趣的关键，是使他们积极主动获取知识、培养他们的创造性实践能力的

期刊

创新实验教学激发学习兴趣学生实验演示实验化学教学创新设计获取知识积极主动

半参数模型的若干问题探讨

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

半参数模型正规矩阵平滑因子岭估计补偿最小二乘估计稳健估计

聚乙烯的动态流变行为分析

采用动态流变测试研究了角频率、黏度、储能模量、损耗模量、损耗因子等的变化规律,并讨论了它们与聚乙烯分子结构的关系。结果表明:交点模量(Gx)对应的频率越低,聚乙烯的重

期刊

聚乙烯动态流变相对分子质量相对分子质量分布长支链polyethylenedynamic rheologyrelative molecular mass

单平面转子动平衡实验理论研究

期刊

旋转机械动平衡测相平衡法

基于分位数分解的城乡收入差距研究

文章基于中国家庭金融调查（XHFS）的调查数据，分别利用分位数回归和分布函数分解的方法，检验了城乡居民收入水平的主要影响因素，分解比较城乡收入差距中城乡居民禀赋特征构成差异和

期刊

城乡收入差距分位数回归反事实模拟分位数分解

对一道江苏省中考试题答案的思考

江苏省2009年中考物理试卷第12题试题如下：如图1所示，小刚将盛满水的圆柱形透明玻璃杯贴近书本，透过玻璃杯观看书上的鹦鹉图片（圆圈中的鹦鹉图与书本中的鹦鹉图实际大小相等），他所

期刊

试题答案江苏省中考2009年物理试卷玻璃杯圆柱形鹦鹉

超声磨削表面残余应力工艺实验与回归分析

为了探索超声磨削的工艺特性,研制了轴向超声磨削加工实验装置,对45钢进行实验研究,采用i XRD便携式高速残余应力分析仪测量磨削表面残余应力,从实验角度分析磨削工艺参数对

期刊

残余应力超声振动磨削回归分析预测模型

进出口机电产品现场检测关键要素的监控

现场检测是指在货物存放地直接开展的一种质量检测活动，常用于进出口机电产品的检验监管工作中。文章对进出口机电产品现场检测的必要性及其工作质量关键要素进行分析，提出了现

期刊

进出口机电产品检测监控

校长负责制背景下的教师自由

在校长负责制背景下,学校管理实践中经常出现侵犯教师合法权益、剥夺教师自由的权力异化现象。只有教师具有免于外界强制的自由和自主做出选择的自由,才有可能保障学生的教育

期刊

校长负责制自由教师自由

基于蚁群聚集信息素的半监督文本分类算法

与本文相关的学术论文