基于粒计算的K近邻多标签学习算法

被引量 : 5次 | 上传用户:lanyinghit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今社会以及信息技术的快速发展,多标签分类学习问题成为现实社会中的一类重要的分类问题,其在实际中有着十分广泛的应用,比如文本分类、图片场景分类、生物基因功能分类等方面。多标签分类学习问题已经成为机器学习领域的一个研究热点,学者先后提出了许多种多标签学习算法来解决多标签分类问题,总的来看这些算法可以分为两类:问题转化法和算法改进法,问题转化法是将一个多标签分类问题转化为若干个单标签分类问题,算法改进法是改进原有的单标签分类算法使它可以用来处理多标签分类问题。本文介绍了多标签分类学习,然后重点讨论了一些重要的多标签分类算法:基于集成学习的多标签分类算法,基于支持向量机的多标签分类算法,基于神经网络的多标签分类算法,基于覆盖算法的多标签分类算法和k近邻多标签算法;分析了这些算法的优点与不足,针对k近邻多标签算法的某些不足进行改进,从而提出一种新的多标签分类算法。主要完成一下内容:1、对多标签学习以及一些重要的多标签分类算法进行综述,阐述这些多标签分类算法的具体过程,指出它们在实际应用中的成功之处与不足,对某些算法今后的改进工作做了初步探讨。2、针对k近邻多标签分类学习算法(ML-kNN)中的在每次学习的过程中都预先指定样本的样本近邻点个数而不考虑样本近邻点的具体的分布情况,对其中的不足进行了分析,提出改进型算法。3、将粒计算的思想引入到k近邻多标签算法的样本近邻点集的选取过程中,提出基于粒计算的K近邻多标签学习算法(ML-GkNN),通过对粒度粗细的调控来选择样本的近邻点集,使得领域内的样本点之间具有高相似,并且只有与中心样本点具有高相似性的样本点才能进入此中心样本点近邻点集,近邻点集中样本点的个数不是固定的,它是由粒度的粗细和近邻样本点的分布来决定的,实验结果表明该算法的大多数的评价指标优于现有的多标签学习算法。
其他文献
灸法作为一种治疗方法已被很多的医家所推崇,但是对于热证可灸仍存在争议,实际上自古以来就有热证可灸的依据,现代的实验室研究和临床观察为热证可灸也提供了大量的依据,灸法
恋爱婚姻是人一生中的重要内容,它不仅表现为一个人对幸福生活的追求和家庭责任的担当,更涉及到社会的和谐和稳定。但是随着时代的变迁,现在越来越多的女孩子嫁不出去,或者不
<正>液晶显示器的背光灯(CCFL)需很高的交流电压才能够点亮。但是电源电路或外置电源适配器提供的电压一般在12~24 V,因此需要一个电压变换电路来把电源直流电压转换成适合背
激活农村消费市场,建设社会主义新农村已经成为了政府工作的共识,一些企业也将目光投向了市场广大的农村。因此选择一种合适的广告媒介,就成为了摆在企业面前的现实问题。墙
猴头菇多糖(Hericium erinaceus polysaccharide, HEP)是猴头菇中最主要活性物质之一,大量的医学和药理学研究表明,猴头菇多糖具有提高免疫力、抗肿瘤、抗衰老、降血脂等生理
当代工笔人物画创作的画家们在中西方文化的交融碰撞下,努力探寻自己的艺术样式和风格语言,希翼能找到既有中国传统文化传承而又能被世界认知的艺术语言。诚然,在西方绘画艺
新旧诗如何接轨,创造一种既不有悖传统诗歌又能体现时代特色的当代诗歌呢?文章分析了中国传统诗歌及五 四以来的新诗,只有形成共识,才能创立具有民族风格又具有时代特色的当
非物质文化遗产宾阳炮龙节以"东方狂欢节"的美称享誉海内外,成为宾阳县的文化旅游名片,有力推动了宾阳县的经济发展。但其在发展过程中仍存在着文化价值挖掘不够、节庆产品缺
目的:观察小儿推拿对哮喘患儿体质类型的干预变化,为小儿哮喘的中医防治提供依据。方法:对4个地域320例哮喘患儿分别采用中医体质问卷进行中医体质调查,以进行哮喘患儿体质类
在当前激烈的媒介竞争环境下,我国各大卫视积极走品牌化之路,在观众中树立自己的符号标签。各卫视从综艺栏目、选秀栏目、故事栏目到竞技栏目等,新节目层出不穷,比拼不断,你