基于主曲线的无监督排序学习及其在综合评价中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:Ares_Stray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
综合评价问题是全社会高度关注和普遍重视的一个重要课题,也是最有争议的一个课题。从机器学习的角度而言,综合评价问题是一类无监督排序问题,因为排序对象的真实排序很难获得。而无监督排序学习模型面临两个主要挑战:(1)在没有真实排序结果的情况下,如何保证排序模型的合理性?(2)如何选择排序模型的非线性复杂度?  在“数据”与“知识”共同驱动模型的框架下,本文从排序对象在多个评价指标上的观测数据出发,结合排序问题的先验知识,系统讨论了无监督排序学习的评价问题,以及领域知识在排序模型中的嵌入问题。论文的主要贡献总结如下:  1.本文首先明确了在排序问题中关于排序规则的五条重要元准则:尺度不变性和平移不变性,严格单调性,线性和非线性的包容性,光滑性,参数规模的明确性。这五条重要的元准则的出发点是使排序规则尽可能地保持多指标数据空间中的观测数据的潜在的真实排序,保证排序结果的合理性。五条元准则也可以作为排序模型的一个高层次的评价准则,用来评价比较不同排序模型的排序结果,为无监督排序学习的评价开辟了一个新思路。  2.本文提出了一类可以满足所有五条元准则的排序模型—排序主曲线。排序主曲线以严格单调的空间曲线拟合排序对象观测数据的骨架结构作为“排序轴”,是第一主成分分析在原数据空间的非线性推广。排序主曲线模型把非线性领域知识,结构性嵌入排序模型中,对模型参数增加约束使其满足排序的五条元准则,并根据模型参数的规模来选择排序模型的非线性复杂度。本文还提出了一种以三次Bézier曲线参数化的排序主曲线模型。对三次Bézier曲线的控制点进行约束,就可以使其满足严格单调性元准则,而三次Bézier曲线自动满足其它四条排序元准则,且控制点的个数是对曲线的非线性复杂度的约束。该排序主曲线模型在理论上可以证明其存在性,模型的学习算法收敛性也得到了理论上的证明。本文提出的排序模型对排序对象的评价分值是个连续量的输出结果,比直接输出排序结果能包含更多的排序分布信息,而且模型的几何意义明确,可以同时包容线性与非线性关系,复杂度由曲线的控制点确定,自然跨越了模型规模的选择问题。  3.对于评价指标的重要性排序,本文借助评价指标与排序分值之间的严格单调关系,提出了两阶段的评价指标重要性排序。阶段Ⅰ采用评价指标间的斯皮尔曼等级相关系数(SRCC)从观测属性中选取与评价相关的评价指标,并在选取的评价指标的观测数据上学习一个排序模型,阶段Ⅱ采用扩展傅里叶振幅敏感性分析(EFAST)计算每个评价指标对排序模型的主效应,来衡量评价指标对排序的重要程度。  本文把主要的研究成果应用在实际问题中对国家、学术期刊、大学的综合评价上,可以得到与用户认知比较一致的研究对象排序结果和评价指标排序结果,说明了本文提出的排序框架具有一定的实际应用价值。
其他文献
学位
学位
学位
学位
现代功能磁共振成像技术的产生为探索和揭示大脑的认知功能提供了新的途径。其中,静息态功能磁共振成像技术不需要研究者设计实验任务,而被广泛应用到神经科学的研究中。经过十
学位
学位
学位
学位