基于类属特征和依赖标记的多标记分类算法研究

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:wmwanll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前互联网中存在着大量包含多种语义信息的对象,传统的的单标记学习框架已经难以有效的去处理这些多义性对象,多标记学习框架则可以很好的处理这些多义性对象因而吸引了诸多研究者的关注,在多标记学习中,分类问题是当前研究者探讨的热点话题。不同于单标记分类,多标记分类问题的输出空间对应的是多个标记,同时标记之间可能也存在一些隐含的相关关系,如果能充分利用好标记之间的相关性,对于提升算法的分类性能将会有很大帮助,例如一些多标记分类方法通过构造链式分类器或堆叠式分类器以利用标记之间的高阶相关性,但这些方法在测试阶段可能会存在标记预测误差传播的问题。另外在多标记分类任务中,特征是描述数据集中不同数据对象的重要参考,然而冗余或不相关的特征不仅会增加运算成本,还会影响算法的分类性能。本文围绕多标记分类中待解决的问题,所做的主要研究工作如下:提出了一种基于类属特征和依赖标记的多标记分类算法,该算法通过7)1稀疏正则项构造稀疏的类属特征系数矩阵和依赖标记系数矩阵,类属特征的构造可选择出每个类别标记最具判别性的特征子集,依赖标记则可以反映标记之间的全局相关性,同时结合标记局部相关性概念,通过流形正则项约束模型的系数矩阵以限制标记输出,算法采用加速梯度下降法来求解目标函数。在测试阶段预测标记可根据求解得到的类属特征系数矩阵和依赖标记系数矩阵获得,而无需使用额外分类器,从而降低因使用外部分类器导致的误差传播问题对算法分类性能的影响。在实验阶段,使用不同规模的数据集对比所提算法与其它多标记分类算法的分类性能,根据在不同评价指标上的评估结果和后续的算法性能检验结果来验证所提算法分类性能的优越性。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
随着云计算和人工智能技术的不断发展,数据中心网络发挥越来越重要的作用,为各种类型应用提供服务与支撑。对比广域网,数据中心网络对不同应用流的要求更高,如以网页搜索服务为代表的流,大部分是延迟敏感的小流,以数据复制为代表的流,大部分是面向吞吐量的大流。当前,在流的信息先验不可知情况下,如何实现低延迟、高带宽、流突发容忍的网络性能是数据中心网络的研究难点之一。现有国内外主要技术是利用多级反馈队列来模拟短