结合旋转森林和Ada Boost分类器的多标签文本分类方法

来源 :计算机应用研究 | 被引量 : 14次 | 上传用户:mengfengye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对一些多标签文本分类算法没有考虑文本—术语相关性和准确率不高的问题,提出一种结合旋转森林和Ada Boost分类器的集成多标签文本分类方法。首先,通过旋转森林算法对样本集进行分割,通过特征变换将各样本子集映射到新的特征空间,形成多个具有较大差异性的新样本子集。然后,基于Ada Boost算法,在样本子集中通过多次迭代构建多个Ada Boost基分类器。最后,通过概率平均法融合多个基分类器的决策结果,以此作出最终标签预测。在四个基准数据集上的实验结果表明,该方法在平均精确度、覆盖率、排名损失、汉明损
其他文献
目前,我国畜牧兽医行业对于健康传播的引进与应用能力还较低,以健康传播为指导在开展畜牧兽医工作的过程中,往往会有许多问题产生,影响着畜牧兽医行业的健康发展.下面,本文将
深静脉置管术是心脏和重危病人中应用较多的一种侵入性操作,可能发生的并发症有气胸、出血、血肿、感染、空气栓塞等,而置管术过程中呼吸心跳骤停者甚为罕见.现将作者工作中
巴氏杆菌病是家兔生产中的一种常见病和多发病。是由多杀性巴氏杆菌引起的急性、热性、败血症传染病。此病又称兔出血性败血症、传染性鼻炎、免清水症。多杀性巴氏杆菌为革兰
头颅外伤引起颞骨骨折不少见,但外伤导致外耳道狭窄或闭锁并继发胆脂瘤则很少见报导。我科自1995年1月至2000年1月共收治12例12耳这类病人。通过去除外耳道瘢痕,肉芽,胆脂瘤,坏死
决策粗糙集理论是经典粗糙集理论结合贝叶斯理论拓展而来。为在不完备区间值信息系统下研究决策粗糙集理论,首先提出属性相似度的概念,并基于属性相似度定义了双精度容差关系。然后,基于双精度容差关系,结合贝叶斯最小风险决策原则建立不完备区间值信息系统下决策粗糙集模型。针对该模型,对不确定性度量进行修正并基于修正的不确定性度量对该模型的属性约简进行研究。最后提出属性约简算法并应用于目标识别实例。
为解决CFSFDP聚类算法由于无法自动选择簇中心点而难以应用于重要地点识别的问题,引入一种簇中心点自动选择策略对算法进行改进。该策略将簇中心点权值的变化趋势作为自动划分簇中心的依据,有效避免了通过决策图判决簇中心点的方法所带来的误差。将CFSFDP改进算法与数据预处理及逆向地理编码等技术结合起来,能够以较高的精度实现重要地点识别。实验以Foursquare数据为例,结果表明CFSFDP改进算法比D
为了在遇到不利工作环境之前,提前采取措施控制元件故障发生,提出基于ANN求导的元件故障概率变化趋势的确定方法。该方法可在不了解系统或元件构成和性质的情况下,仅利用实际故障监测数据分析不同工作环境下元件故障概率变化的趋势和程度;同时该方法也充实了空间故障树(SFT)下的离散型空间故障树(DSFT)理论。给出了ANN求导法处理问题的理论基础和公式推导,结合了一个元件进行该方法的应用,最终得到了该元件的
为进一步提高数据测试算法性能,提出一种基于控制流图支配树的测试数据灰度编码进化生成算法。利用三角分类程序示例构建数据测试的数据流控制流图,并利用其支配树关系构建测试数据的数据流分析,建立程序变量间的支配关系集。结合遗传算法并利用支配关系及分支距离构建测试数据生成的适应值函数,同时在应用遗传算法时,采用灰度编码方式取代二进制编码,简化编码更新过程。通过在测试程序样例中的实验对比显示,所提方法在平均数
(一)发病情况曲麻莱县约改镇长江村位于曲麻莱县东北部,2012年9月16日,疫控中心接到该村一家的疫情报告,说自家放牧的牦牛有86头,有22头发病,已死亡8头。接到疫情后,县动物防疫部门立