基于张量理论的单分类模型及算法研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:zhanghao2018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在错误诊断、人脸识别、入侵检测、文本分类等领域,我们经常会遇到单分类问题.以单分类支持向量机为代表的传统单分类算法使用向量作为输入数据,当输入数据为张量时有一定的局限性.近年来,直接使用张量作为输入数据的机器学习算法得到了研究者的广泛关注,并取得了一定的成果.直接使用张量作为输入数据,能够有效的保持数据的结构信息,从而能够充分利用数据所蕴含的信息以提高识别效果;同时,以张量为输入数据的相关模型和算法,可以有效的降低优化问题中待求解的决策变量个数,从而可以避免传统的向量模型在学习过程中容易出现的过拟合等问题,这使得张量算法尤其适合高维小样本问题.因此,本文主要研究基于张量理论的单分类模型和算法,研究工作包括以下几部分内容:1.基于超平面的非线性单分类支持张量机模型.该模型以2阶张量作为输入数据,以最大间隔准则将尽可能多的目标类样本点与原点分开,从而实现对目标类的识别.由于该模型是非凸的,造成求解上的困难,因此我们引入交替投影算法进行模型的求解,并给出了相应的求解算法,分析了算法的计算复杂度.为了验证张量算法的优势,我们将所提算法在向量数据和张量数据上分别进行实验.在向量数据集的实验中,我们主要关注张量模型在高维小样本问题的分类性能,同时讨论张量算法和向量算法在过拟合问题的表现,并给出将向量数据转化为张量数据的基本原则.在张量数据集的实验中,多个数据集数值实验验证了所提模型的有效性.2.基于数据描述的非线性单分类支持张量机.该模型将2阶张量作为输入数据,使用核方法在特征空间中寻找一个最小超球来包含尽可能多的目标类样本点,从而实现对目标类的识别.我们使用交替投影算法求解该优化问题,并给出了算法的计算复杂度分析和收敛性证明.该算法在向量数据集和张量数据集上的实验结果均验证了所提模型的有效性.另外,我们还分析了两种单分类张量算法的等价条件,实验结果也验证了在高斯核矩阵下,两种算法的分类结果是一样的.3.基于超平面的线性单分类支持张量机模型.首先我们从2阶张量入手,给出基于2阶张量的线性单分类支持张量机模型和算法,并在公开的向量数据集上进行了实验.实验的结果说明了所提算法能够有效的提高对目标类的识别,并讨论了参数v在张量分类器的作用.接着我们将2阶张量模型推广至高阶张量模型和算法,并讨论了算法的计算复杂度.在向量数据集和张量数据集的实验中,所提算法在保证分类器性能的情况下,均能大幅提高分类器对目标类的识别.4.基于数据描述的线性单分类支持张量机模型.首先,从2阶张量的线性数据描述入手,将支持向量数据描述模型推广至张量空间,并最终推广至高阶张量模型.模型的求解依然基于交替投影思想,并给出了计算复杂度分析和收敛性证明.数据实验采取高维小样本的向量数据集,来展示张量算法对于高维小样本数据的分类性能以及参数分析;并以人脸数据集和步态数据集来验证所提算法在张量数据集的分类性能.
其他文献
随着人类文明程度的不断提高和市场经济的日趋成熟,诚信愈来愈受到世人的重视。所谓诚信就是诚实守信,即诚实无妄,恪守信用,诚善于心,言行一致。诚信是一个涉及道德、制度、经济等
病历是重要的医疗文件,病历书写是医学生必须掌握的基本功,问诊可为病历书写提供第一手资料,因此,是《诊断学》教学的重点。对高职社区医疗专业学生在《诊断学》问诊的理论教学后
目的了解重庆市高校教工的健康状况,更好地指导其防治疾病,促进健康。方法将收集的重庆市高校教工3 669人健康体检资料进行回顾性分析,重点讨论体检中发现的异常情况,对其常
本文针对中国经济系统及其子系统中国烟草行业的结构特征,依据经济学原理,推导出一个中国烟草行业年产量演化模型,据此演化模型,预测了2008年~2030年中国烟草行业年产量演化路
伴随大农业发展政策及互联网发展的快车后,我国果蔬等农产品迎来了新一波的发展高峰,水果的包装也不仅仅局限在了简单的保护作用上,还兼具了其它更多的功能。在水果运输包装
作为当今不对称催化科研前沿的"三驾马车"之一,酶催化除了具有高度选择性高、反应条件温和和没有重金属污染的优点,是公认的绿色催化技术,在手性药物的合成中具有广阔的市场
会议
目的探讨器械缝合在肺切除术心包内血管处理中的临床应用。方法1998~2003年共对32例中晚期肺癌患者,采用经心包内血管处理技术(肺血管均采用肺血管缝合器。部分病例加结扎处理),实
目的探讨烟碱对β-淀粉样蛋白(Aβ)所致小胶质细胞活性的影响。方法通过Aβ25-35注射大鼠海马区建立阿尔茨海默病(Alzheimer’s disease,AD)大鼠模型,用免疫组化、ELISA方法观察
在CPI不断上扬的形势下,通贷膨胀已成为当前中国最热门的话题。通货嘭胀的成因不同。需要采取的政策措施也会千差万别。要消除此次通贷膨胀,我们必须首先找出其成因。
兴趣是学习成功的秘诀,是获得知识的开端,是求知欲望的基础。兴趣是学生认识事物和关心事物的主要动力。学生的学习兴趣对学习效果的好坏有着直接的影响,学生对所学的知识有无兴