嵌入式多模态特征选择算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zero_alan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据收集和数据存储技术的发展,多模态数据广泛存于各种应用场景当中,如何对这些数据进行高效的分析是机器学习研究领域的热点问题之一。在处理多模态数据时通常会遇到维数灾难问题,传统的特征选择算法只能处理单模态数据,而无法有效的处理多模态数据,本文的研究目标为多模态数据的特征选择算法。在实际应用中,由于数据的标记信息很难获取,因此需要在无监督情形下进行特征选择任务,本文提出基于聚类结构保持的无监督多模态特征选择算法,该算法提出在特征选择的过程中利用线性判别分析保持原始数据的聚类结构,同时充分利用多模态数据之间的相关性和互补性,最后通过结构化的稀疏正则模型来选择权重较大的特征,并提出了新的迭代优化算法求解优化目标。我们在五个公共数据集上进行实验验证,并与其他无监督特征选择算法对比,实验结果说明了该算法的有效性和优越性。在实际情况中,虽然很难获得全部数据的标记信息,但是通常可以获得一部分数据的标记信息,半监督学习算法同时利用已标记样本和未标记样本进行学习,无标记数据的加入可以提高学习算法的性能,在此基础上,本文提出基于结构化稀疏的半监督多模态特征选择算法,该算法利用流形正则的方法,同时考虑多模态数据的相关性和互补性,在每个模态上保持数据的流形结构。在模型中引入两个结构化稀疏正则项,分别刻画不同模态间的特征和同一模态内的特征在不同分类任务下的判别性,将这一思想加入半监督的多模态特征选择算法中,建立模型并提出迭代优化算法求解优化目标,我们在五个数据集上进行实验验证,并与其他有监督和半监督特征选择算法对比,实验结果展示了算法的有效性。本文研究多模态数据的特征选择算法,充分考虑多模态数据的特点,提出了无监督和半监督两种多模态特征选择算法,并取得了良好的效果。
其他文献
从上世纪90年代开始,本体被引入信息科学领域,在近年来,本体论正逐渐成为知识工程、人工智能和语义网络等研究领域共同关注的核心问题。在以数字化信息为资源、互联网交互为
随着实时系统应用的不断扩大,对实时系统的研究越来越受到关注。实时任务调度是实时系统最核心、关键的问题之一,对它的研究也显得越来越重要。本文从目前实时系统任务调度的
无线传感器网络(WSN)是目前国际上研究的热点,它融合了计算、通信和传感器这三项技术的交叉应用,具有十分广阔的应用前景。在网络中,数据的传输就是靠路由协议来控制管理。因此
MPEG-2视频编码标准的广泛应用积累了丰富的资源,而采用H.264编码的视频只用一半的码率就可以取得和MPEG-2相同的视频质量。为方便存储和传输,把MPEG-2格式的视频转换为H.264
敦煌是现存最大的佛教圣地,由于人类活动、环境变化、自然灾害等因素,敦煌文化遗产保护工作正面临十分严峻的挑战。近年来,随着敦煌莫高窟壁画数字化技术的迅猛发展,如何有效运用
学位
高性能CPU 是国家技术实力的象征,拥有自主知识产权的CPU 对国家的经济、军事及安全具有重要意义。正是基于这个原因,本人在深入了解CPU的工作原理和设计方法的基础上,确定了具
信息技术的迅速发展和应用的日益广泛,使计算机软件的重要性与日俱增。同时,随着软件规模的日益庞大,软件需求越来越复杂。因此,在软件开发过程中,需求变更成为必然。目前,软
学位
语义Web服务是基于本体的新一代Web Service技术,开放式的服务结构则是电信网络提供服务能力一种新方式。结合语义Web服务与电信开放服务框架,为电信领域构建一个以用户为中