多标签分类数据中的变量间交互作用算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:fw1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签数据是一种特殊的分类数据,在很多领域中普遍存在,它的每个样本可能对应多个分类标签,因此需要发展特别的分类方法进行处理。本文关注多标签数据中的变量间交互作用问题。基于前人在单标签数据的高阶交互作用中的一些经典算法(如随机交叉树、子集搜索算法、Bowsaw等),本文提出两种面向多标签数据的高阶交互作用搜索算法:BROW和GAIT。运用模拟实验数据和真实数据,我们验证了算法的有效性。
其他文献
我国的改革开放至如今已有四十余年,而基础建设不足一直是我国经济发展的一大制约因素。传统而言,政府一般具有两种主要方式动员社会力量并为公众提供公共服务,分别为政府购买模式和政府与社会资本合作模式。其中,政府和社会资本合作模式也可称之为PPP模式,其优点如打破了政府强主导性、激发市场积极性、缓解地方财政压力等等显而易见。但是直到今日,如何让PPP模式的项目成功落地依然是个亟需解决的问题,财政部前不久公
学位
近年来,国际宏观经济形势严峻,美国、欧盟、日本等发达国家与中国等发展中国家经济都面临增速下滑的风险,另外国际贸易保护主义抬头,黄金、白银等具有避险保值功能的贵金属受到广大投资者的追捧。然而,我国贵金属市场相比欧美等发达国家起步较晚,且市场主流风险管理模型VaR、CVaR依旧存在一定的问题,因此本文试图引入SRM模型来解决当前VaR、CVaR模型所存在的问题。本文梳理贵金属的影响因素、贵金属价格波动
学位
设k是代数闭域,给定一个Artin k-代数A,子模范畴S(A)中的Auslander-Reiten变换的逆可通过A-mod中Auslander-Reiten变换的逆τA-1来计算,即τS-1=KerMepiτA-1.当A的模范畴存在预投射分支时,我们用例子阐述了S(A)的预投射分支的计算方法与步骤,其中的关键是确定S(A)的Auslander-Reiten序列的中间项.任给一个有限无圈箭图Q,类
学位
在过去的几十年中,时间分数阶扩散方程广泛应用于工程、物理、生物等多个领域。本文在总结近年来时间分数阶扩散方程数值解法的基础上,构造了一种求解时间分数阶扩散方程的数值格式。新的算法的主要思想分为两步,第一步是先对二维空间区域利用谱方法进行离散,得到分数阶常微分方程的线性系统;第二步针对常微分方程的线性系统,可以直接得到解析解,根据右端项的不同,对解析解中的积分形式进行时间方向的离散。求解线性系统的关
学位
因子分析模型是多元统计分析中最常用的对协方差阵进行降维的技术.现存的分析方法主要是在正态假定下进行的.当观测数据具有重尾或存在异常值时,正态性假定将会使参数的估计失去稳健性.代替多元正态分布,本文采用自由度未知的多元T分布,并利用完全的Bayes方法来分析因子分析模型.由于自由度的全条件后验分布密度中含有无解析表达式的项,采用传统的M-H算法抽样时需要首先利用数值方法近似计算出该项的值,导致所得到
学位
本文主要研究美式看跌期权的有效数值方法。首先从美式期权定价最简单的结构化方法入手,接着探讨基于Black-Scholes方程的期权定价方法,并揭示不同方法之间的联系。然后在比较已有研究方法的基础上,提出了一个带随机波动率的最小二乘蒙特卡洛方法。该方法的基本思想是利用分数阶几何布朗运动来模拟随机波动率的样本路径,再通过与最小二乘方法相结合来计算美式看跌期权的价格。其中我们借助一组基函数使用回归估计来
学位
聚类是一种常见的无监督学习技术,用于发现一组数据中的类别结构。尽管有许多用于聚类的算法,但是很少涉及特征选择的问题,即聚类算法应该使用数据的哪些特征。与监督学习技术不同,聚类的特征选择比较困难,它没有数据的类别标签,也没有明显的准则来指导搜索,同时还需要确定聚类的类别数量,这些也会对特征选择问题造成影响。在本文中,我们使用含无关特征的多元混合厄朗模型进行特征选择,先用CMM算法选取具有较高质量的初
学位
随着时间的推移,我国信贷资产证券化的试点规模在不断扩大,执行信贷资产证券化的商业银行在不断增长。虽然我国商业银行信贷资产证券化在不断成熟,但是依然存在许多需要进一步探究的地方。现有研究文献针对信贷资产证券化与银行绩效关系的分析结论依然存在分歧。分歧原因与选取的研究对象、样本时间、采用的分析模型等因素存在必然联系。信贷资产证券化与银行绩效关系作为一个重要研究点,对其进行深入解析可以有助于我国信贷资产
学位
随着人民生活水平的提高,关注保险的人越来越多,保险公司也越开越多,而如何控制保险盈余过程,使得保险公司的破产概率最小,投资者的收益最大受到学者们广泛的关注,若只考虑分红,必会导致保险公司的破产;若只考虑注资,也会牺牲投资者的利益。同时考虑分红和注资,可以保证其盈余过程非负,从而确保了保险公司的良性运营。本文在经典风险模型中引入分红和资本注入,分红从保险盈余中支付,并假设分红方式为棘轮分红,即股息率
学位
图像缩放在不同分辨率显示屏之间的转换以及不同软件的图像显示中有广泛应用。目前,大多数方法通过显著值检测或与用户交互的方式,确定图像中的重要及次要区域,使用特定的缩放方法,在满足目标长宽比的同时,避免重要区域发生畸变。本文的方法是基于网格的图像形变算法,现有的形变法只能在拓扑单一的三角形或四边形网格上采用低次多项式,虽然计算快,但由于自适应能力较弱,逼近阶数低,因此常常会导致结果不满意。本文提出了一
学位