基于可变贝叶斯风险的层次多标签分类算法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:fuyaomama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类方法被广泛应用于各个领域,如文本情感分类、图像标注、个性化推荐、生物学分类等。层次多标签分类方法是依据标签间的相关性将标签进行层次化组织,并将这种层次结构作为一种监督信息用于学习过程,从而更好地解决多标签分类问题。现有的层次多标签分类方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法。HMC-loss常作为损失敏感方法的损失函数,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数当中。在使用基于HMC-loss损失的HIROM算法进行预测时,会产生预测标签数却远多于真实标签数的情况。此外,层次信息的引入会对标签结点的决策顺序产生不利影响,并且HIROM算法中利用的CSSA算法合并结点的过程是部分失效的。针对上述问题,本文首先提出了一种改进的损失函数IMH-loss;然后,基于最小风险贝叶斯决策理论,提出了一种改进HIROM的层次多标签分类方法HIROM-T,该算法在改变标签结点决策的顺序的同时,舍弃CSSA算法合并结点过程,降低了算法的复杂度。针对HIROM算法预测正类标签数远多于真实标签数的问题,本文提出了一种风险随决策进行而可变的层次多标签分类算法HIRVM。实验表明,该算法可大大减少了预测正类标签个数,提高分类精度。
其他文献
目前,在大香格里拉葡萄酒产区名头最响的酒庄,非酩悦轩尼诗香格里拉(德钦)酒业有限公司酒庄莫属。这家酒庄位于德钦阿东村,注册资本达到人民币1.18亿元,旨在打造一流的国际酒
期刊
随着电子技术的发,无绳电话的电路设计已由分立的单一功能的集成电路走向单片综合功能的集成电路,这是提高无绳电话产品质量和可靠性的必由之路。本文着重介绍单片无绳电话IC的基
团队中的每个成员都有自己不同的能力和作用,排球这项运动也不例外,她们都在团队中扮演着不同的角色,发挥着各自的作用。因此,许多学者对团队角色进行了大量研究,其中运用最
在高等职业教育日益趋向精细化的背景下,针对以往高职院校重技艺、轻人文素质教育的粗放状态,有必要结合当前新时代职业教育发展趋势,对高职院校的专业技能教学与人文素质教
目的:探讨《傅青主女科》中方剂的用药规律。方法:收集《傅青主女科》全书方剂,通过中医传承辅助平台V2.5建立数据库,采用关联规则apriori算法、改进的互信息法、复杂系统熵
日前有报道称,台积电(TSMC)、力晶半导体(PSC)和世界先进积体电路(VIS)三家公司,将在台湾新竹科学园区的30公顷地块上投入3000亿新台币(97亿美元)建造四个晶园新厂和一个研发中