多模态数据分类的模糊粗糙方法研究

来源 :天津大学 | 被引量 : 1次 | 上传用户:yhl0921
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据的典型特性是非结构化或半结构化数据占主体地位,多种不同模态的信息混合在一起,具有属性类型多样、信息结构复杂、数据大量冗余等特点。多模态数据含有丰富的语义信息,一个样本可能包含了多个语义标签。挖掘多模态数据中的有价值信息并构建分类模型对传统的建模方法带来了挑战。多模态学习方法往往忽略数据的不确定性问题,而模糊粗糙集理论是处理数据不确定性的有效工具。因此,本文重点研究多模态数据分类的模糊粗糙方法,主要内容包括以下三个方面:1)多模态属性约简的多核模糊粗粗糙方法针对多模态数据含有大量冗余属性问题,提出多模态属性约简的多核模糊粗糙方法。结合多核学习处理多模态数据的优势,提出基于模糊算子的属性融合方法,构建多核模糊粗糙集模型。基于所提模型构造并行的属性依赖度计算方法,实现大规模数据模糊分类中的多模态属性约简。2)多标记属性约简的模糊糊粗糙方法针对多标记分类中属性的评价和选择问题,研究多标记分类属性约简的模糊粗糙方法。结合多标记学习的两种策略,提出两种扩展模糊粗糙集模型,并构造相应的多标记属性约简算法。3)多模态属性模糊多标记分类方法针对多模态属性模糊多标记分类问题,构建模糊多标记学习框架。分析模糊多标记学习的特点,提出模糊多标记学习的模糊粗糙集模型,利用模糊上、下近似计算样本的标记,进而构造多模态属性模糊多标记分类方法,并定义模糊多标记学习特有的评价标准。本文提出的模型和方法不仅扩展了经典模糊粗糙理论的应用范围,也为大数据环境下的多模态数据分类提出了新的解决思路。
其他文献
在互联网时代背景下,以微博为代表的社交媒体平台正快速崛起发展,成为国内舆论场的首要阵地,在这个阵地中每个人都有了自由发表意见观点的机会和权力。目前,在社交媒体上网民之间的传播不仅仅满足于信息交流的传递,更转向情绪的渲染与情感的表达。而把现实中个人情绪带入到网络中将演变为群体的网络情绪。在近年来的舆情事件中,网民情绪化的表达已经成为影响事件发展的重要因素。在近几年的网络舆论环境中,网民表现出更多的是
元素化学计量学指从化学计量学的角度出发,通过分析比较生命物质不同结构层次(分子、细胞、器官、机体、种群、群落等)或生态系统中元素的相对比值,来研究各层次相互之间以及生
随着信息技术的不断发展,日益增长的数据存储对硬盘提出了更高的容量要求。为了满足这一需求,磁盘盘片需要更高的存储密度。目前为止单碟容量达到2TB的超大容量硬盘已经出现
2000年后,重新出现在文坛上的先锋文学的代表性人物格非,不论是文学作品还是理论著作都出现了一种向传统文学致敬或者说向传统文化复归的倾向。本论文以格非的文学理论与小说
相比于一般性区域合作,"一带一路"倡议具有软约束和低标准的特征。在这种多元开放的合作框架下,推动沿线各国走向深度互通互联,将面临诸多经济风险,其中以财税风险、金融风险
<正> 在普通烙铁头上加装一个部件,便可制成一种新型的烙铁头。在用普通烙铁头焊接印制电路板上的的小圆焊点时,或很难焊上,或造成虚焊。下面介绍的新型烙铁头可以克服这一缺
介绍护理六级电子病历中智能输血"闭环"管理的临床应用,将输血的操作规程进行流程再造,环节包括采样登记、血袋接收、输血确认、输血执行、输血过程巡视、输血结束,完成一个
目的:本实验以大鼠H4-ⅡE细胞作为研究对象,观察乙醇干预后细胞中NAD+含量、NADH含量、NAD+/NADH及细胞生成一氧化氮含量的变化,进一步明确乙醇引发肝细胞损伤的分子机制。方
"里院建筑"作为青岛独有的"中西合璧"的建筑形式,随着时代的发展,新城区与新建筑的兴起和人们生活的空间需求的扩张,"里院建筑"越来越不适应时代的发展要求。它的生存空间正
<正>现代战争是信息化条件下的高技术战争,要求运筹于帷幄之中,决胜于千里之外!作为边防某团的首要信息保障部门指挥自动化站,黄志强带领着他的尖兵们出色地完成了各类信息保