多标签分类算法研究及其应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:ZXYCHENLI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我们进入了数据爆炸时代,随着数据的增长以及数据存储能力的增强,使得我们可以获得形式各异的数据源并将其存储于信息库中。通过对信息库中存储的数据进行分析挖掘,可以有效地抽取出富含价值的信息,有助于商业、科研等活动的决策。而分类技术作为其中一种数据分析挖掘的形式,它可以抽取能够描述重要数据集合的模型,用于预测数据对象的离散类别。而根据分类预测后的样本类别标签个数不同,分类问题又可分为单标签分类和多标签分类。在传统的监督学习任务中我们所面临的问题大部分是单标签分类问题,然而,在很多分类任务中每个样本需要与多个类别标签相关联,如在文本分类中(与多种类型相关联的书)和医学诊断中(例如,多发病人的疾病诊断)等。而这些问题是单标签分类技术无法解决的,因此,近些年来,多标签分类的研究得到了国内外学者的广泛关注。目前解决多标签分类问题的算法并没有达到令人满意的效果,研究者们也试图通过考虑标签相关性以及通过分类器集成等方法来提高分类性能。通过对现有的多标签分类算法的研究分析,其中,RAkEL多标签分类算法是一种使用分类器集成技术的较为有效的多标签分类算法,然而由于该算法在子分类器构造过程中标签组合具有随机性以及没有充分利用标签的相关性信息等因素,其分类效果仍有提升的空间。本文通过将标签相关性与分类器集成技术应用于统一的框架,提出了一种改进自RAkEL算法的新的多标签分类算法。本文提出的方法在实验中与RAkEL多标签分类算法相比较在多个评测指标上得到性能提升,与其他多标签分类算法相比也具有竞争性的优势。另外,本文也探索了多标签分类算法在推荐系统领域的应用。在推荐系统领域,上下文感知推荐系统利用上下文情境信息进一步提高了推荐的精确度和用户满意度,但上下文感知推荐系统研究的问题仍然是如何将项目集合推荐给目标用户。在本文中,我们将研究现实生活中另外一种推荐场景:当用户选定某个项目时,我们为其推荐最合适的应用情境,即上下文,例如,某用户已经决定去看某部电影,这时他需要的建议是在哪里(家里还是剧院)、和谁(家人还是朋友)一起观看会获得更好的观影体验。情境推荐不仅可以为用户消费某个项目推荐最合适的情境以提高消费体验,也可以协助用户做项目选择决策。我们将此类推荐问题转化为多标签分类问题进行求解,首先我们验证了转化为多标签分类问题进行求解的有效性,然后通过改进多标签分类算法,得到适用于情境推荐问题的方法,并在两个领域的数据集上进行了实验。实验结果表明,本文算法可以给出个性化建议,并在多个指标上好于原算法。
其他文献
当今在存储系统中,主流的存储器仍然是传统的磁盘和近几年广泛使用的基于FLASH的固态硬盘,磁盘因受限于内部的机械结构,读写性能较差,而固态硬盘虽然在性能上有了很大的改善,但写
属性基加密是近几年来密码学研究的热点问题之一,它是在模糊身份基加密的基础上发展起来的一种公钥加密机制,能够同时实现信息的私密性和访问控制的灵活性,它最大的优点是:特
随着国家对大力发展职业教育政策的出台,我国的职业教育蓬勃发展,中等职业教育也形成了良好的发展势头,学校规模不断扩大,学生人数逐渐增多,这给学校的教务管理工作带来了新
当前各个领域的多媒体和CG技术的快速发展,图像的渲染被广泛应用在电影里的动画设计制作、游戏画面静态及动态的特效上,而且随着越来越多有关图像形成方面的技术需求也越来越
并行磁共振成像(parallel magnetic resonance imaging,pMRI)技术是近十几年来MRI领域的一次革命,该技术利用放置在被检体周围的多个接收线圈来同步探测磁共振信号,并通过减少梯
目前国内外城市的公共交通均以地面交通为主,随着经济的快速发展,交通拥堵现象和日益增长的交通事故引起了国内外社会的广泛关注,为此越来越多的学者开始研究智能交通。智能交通
本文是以全国计算机信息高新技术考试(OSTA)为背景,开发相应的在线考试系统项目,结合办公自动化应用技能水平测试需要,利用教学单位现有教学资源,使用计算机技术和网络自主设
Web2.0的兴起吸引了越来越多的因特网用户,电子商务和论坛在这一平台上得到了长足的发展。在线购物网站和产品论坛中积累起海量的产品评论。产品的潜在用户希望从中获取有价
集合选择是分布式信息检索过程中的重要一环,其在尽量不影响检索效果的情况下,选择和查询相关度高的部分集合进行检索。目前大多数集合选择算法根据主要通过集合的静态统计信息
最近几年,我们可以看到,社区问答系统中的用户数量正呈现出高速增长的态势。社区问答系统给用户提供了一个发布问题以及寻找答案的平台,而这个广大的平台中所包含的海量的问