面向不同数据环境的无/有监督建模方法研究

来源 :江南大学 | 被引量 : 2次 | 上传用户:yaya1717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年,机器学习方法随着人工智能的火热得到了迅猛发展,在医疗、交通、金融等领域得到了广泛的应用。但是,随着应用场景的不断扩大,数据的规模和形式也变得复杂,多样化的数据场景,例如大模糊数据场景和多视角数据场景等给传统的机器学习方法带来了巨大的挑战。在无监督学习和有监督学习中,传统的聚类分析和TSK模糊系统在面对这些复杂的数据场景时,所遇到的挑战包括以下几个方面:1)在大规模数据场景下,基于代表点的聚类方法和TSK模糊系统在可容忍的时间内无法获取有效的模式识别信息;2)面对维数较高的数据时,TSK模糊系统会出现“规则爆炸”问题,同时模糊系统的可解释性显著降低;3)面对多视角数据时,虽然通过传统的聚类方法可以获取各个视角的模式识别信息并通过集成机制可以获得全局结果,但是,单独在每个视角进行聚类,忽略了视角之间可能存在的关系,使得最终获取的模式识别信息无法达到应用需求。针对上述问题,本论文将从无监督学习和有监督学习2个方面,探讨他们在不同数据场景下的建模问题,主要研究成果如下:(1)提出了一种基于代表点评分策略的快速自适应聚类算法ESFSAC。该算法利用FRSDE将原始数据集进行压缩,获得能够反映原始数据集结构的压缩集。在压缩集的基础上,使用评分策略来评估每个样本成为代表点的可能性并形成代表点候选集。然后从代表点候选集中逐个选择代表点,利用其邻域不断传递标签至整个压缩集;最后采用同样的方法将压缩集中样本的标签扩散至整个数据集,在此过程中,引入抽样,提高标签传播速度;(2)提出一种基于“引力聚集效应”的代表点自适应聚类算法ETLMC。该算法用“代表点量”来反映样本成为代表点的可能性。为了实现样本之间“代表点量”的传播,在贝叶斯框架下,提出了传播学习及其实现方式传播学习机。样本之间“代表点量”的传播过程,可以看成是“代表点量”聚集的一个过程,这个过程的形式化表达和经典物理学中的牛顿引力定理存在类似的地方。因此,在牛顿引力定律的基础上,提出了“引力聚集效应”,用来监管样本之间“代表点量”的传播。为了使ETLMC算法能够适应大规模数据环境,在求解其全局解析解时,通过近似计算的方式,避免矩阵求逆运算,提高效率;(3)提出了一种多视角协同学习机制并设计了多视角多代表点模糊聚类算法MFCMddI。在视角内,采用多代表点表示策略来获取更丰富的簇结构信息;在视角间,为了实现协同学习,认为簇中代表点在不同视角下,其代表性保持,并通过最大化两两相邻视角下代表点权重系数的乘积之和来保证代表点一致性;(4)提出了一种有共性知识和特有知识共同驱动的TSK模糊系统CSK-TSK-FS。在CSK-TSK-FS中,每条模糊规则后件与特征对应的系数保持不变,谓之共性知识。通过理论推导表明,CSK-TSK-FS等价于一个特殊的GMM和高斯型FLNN,这进一步拓宽了CSK-TSK-FS的训练方法。CSK-TSK-FS具有3个非常重要的特征:1)基于中心去模糊规则,共性知识可以从规则中分离出来,从而提高了模糊系统的可解释性;2)CSK-TSK-FS可被基于LLM的快速算法训练,故适用于大规模数据集;3)CSK-TSK-FS与GMM以及FLNN之间的关系,使得它们可以共享训练方法,所设计的基于LLM的快速训练方法亦可用于GMM和FLNN。(5)提出了一种栈式结构的深度TSK模糊系统HID-TSK-FC。HID-TSK-FC具有2个非常重要的特征:1)栈式结构为其提供了高逼近性能;2)使用特征随机选择技术,选择HID-TSK-FC模糊规则前件中所包含的特征,降低规则复杂度。同时,等间隔产生模糊集中心,并赋予了明确的语义,使得特征映射的含义更加明确;HID-TSK-FC通过适当的数学变换,可以等价于另外一个具备共享语义模糊规则的TSK模糊分类器,从而使得HID-TSK-FC的可解释性更强。
其他文献
<正>一直坚信:旅行,并不是为了验证各种攻略里的一景一物,而是热爱自己现有生活的人体会在路上的乐趣。毫无疑问,文化历史底蕴深厚、文物古迹众多、自然资源丰富的晋中市就是
期刊
<正>"基础不牢,地动山摇".如果学生不能在初中物理这个物理教学"入门阶段"打下坚实的基础,将对后续物理教学的其他内容造成更大的理解障碍.压强是教科版教材八年级第九章的内
<正> 党的十一届三中全会以来,在对国民经济实行调整的过程中,各条战线都进行了一些改革,取得了显著成效,特别是农村经济体制改革取得了伟大胜利。现在,改革的春风已吹遍祖国
<正>2015年9月22日,中国最大的葡萄酒企业张裕公司在西班牙马德里举行发布会,宣布完成收购西班牙里奥哈产区最具影响力之一的葡萄酒公司——爱欧公爵(Marques del Atrio)。发
<正>从事合成生物学业务的领导者Intrexon公司于2016年3月30日宣布,其专有的天然气制油(GTL)生物转化平台中型装置已投入操作。该装置位于旧金山南部,致力于生产完全替代型燃
以胡适的白话文理论为个案来考察现代白话文理论与实践之间互补相生的关系。尽管胡适的语言观徘徊于语言工具论与现代语言论之间,其白话文理论水准并未达到现代语言论的高度,
报道了一种新型MFT(Multi-Fluoride-Telluride)玻璃材料(组份为50TeO2-19.7PbF2-10AIF3-10BaF2-10NaF-0.3Tm2O3)的制备方法,测量了650mm激发下Tm3+离子掺杂在MFT玻璃材料中源于1D2→3H4(453nm)和G4→3H6(476nm)跃迁的两组蓝色上转换发光研究了上转换发光强度随激发功率的变化关系,并且首次应用ASE(AmplifiedSponta-neousEmission)技术
<正>近日,首届腾讯"互联网+警务"峰会在苏州工业园区会议中心召开。会上,腾讯公司展示了由腾讯优图团队研发的先进人工智能技术,以及多个使用该技术的"互联网+警务"场景,人工
采用化学法对不同香型(清、浓)酒尾进行了处理实验。经处理后的酒尾,无酸、涩、臭等异杂味;酯香增加、醛量降低均明显。该法简便易行,可提高酒尾利用率,并改善酒质。(车干)