【摘 要】
:
IB(Information Bottleneck)方法起源于率失真理论,是一种有效解决复杂优化问题中数据压缩和信息保存的方法学。在机器学习领域中,IB方法多用于模式提取,并形成了多个版本的I
论文部分内容阅读
IB(Information Bottleneck)方法起源于率失真理论,是一种有效解决复杂优化问题中数据压缩和信息保存的方法学。在机器学习领域中,IB方法多用于模式提取,并形成了多个版本的IB算法。在模式提取时,IB方法会对所有数据对象进行分析,然而在实际应用中,数据对象中蕴含模式信息的明确度均有不同,弱相关或无关数据的分析不利于模式提取,从而导致IB方法挖掘到的数据模式精度低,或挖掘不到隐藏数据模式。本文针对IB方法中存在的上述问题,提出一种选择性模型SLIB模型及其对应的目标函数和优化算法。数据集往往存在一些模式结构不明确的数据对象,IB对其分析时不仅信息损失较大,且易使数据模式偏离数据固有结构。因此,SLIB模型仅分析信息损失小且具有较强模式结构特征的数据对象,而过滤掉模式结构不明确的数据对象。与以往IB目标函数不同,SLIB模型的目标函数不但可实现对数据的选择性分析,而且适用于共现数据和欧氏空间数据。通过使用一种顺序的“抽取一合并”方法优化该目标函数,SLIB算法的“边学习,边选择”迭代过程可快速收敛到一个局部优化解。在二维人工数据集、欧氏空间数据集和共现数据集上的实验结果表明:SLIB算法可发现线性及非线性划分,且在确保高召回率的同时,所挖掘的数据模式精度更高,并能挖掘到原IB算法所不能挖掘到的数据模式。IB方法在诸多领域都得以成功的应用,而本文提出的SLIB算法更可应用于信息检索,且实验表明其能更有效地搜索高精度结果。此外,本文提出的SLIB算法较原IB算法能用于更多种类的数据集,也为以后IB方法提供了一个新的研究思路。
其他文献
变压器是电力工业中十分重要的关键设备,它的可靠运行关系到电力供应的安全性,对国民经济发展和人们日常生活有着重大影响。针对变压器运行状态监测工作,对保证变压器的安全、可靠、高效运行,具有重要的理论和现实意义。本文结合变压器运行特点以及项目要求,设计并实现了变压器谱图分析可视化组件。此组件以变压器运行状态监测为背景,旨在提高对变压器局部放电的实时监测能力,为故障预警提供依据。在变压器谱图分析可视化组件
作为目前IT领域研究热点之一的无线传感器网络,涉及到传感器技术、网络和无线通信等众多技术,在军事国防、环境监测、智能家居、防洪救灾等军用和民用领域,有着非常广阔的应
无线传感器网络(WirelessSensorNetwork,WSN)是一种全新的信息获取和处理技术,广泛应用于军事、生态环境监测、交通管理、医疗健康监测、空间探测等领域,对人类的生活方式产
MQX是一款主要面向工业控制、汽车电子及消费电子等领域实时多任务应用的嵌入式实时操作系统。2009年,飞思卡尔公司半导体公司开始免费开放MQX3.0.1版源代码,同年,苏州大学飞思
人群动画合成研究始于上世纪80年代初,至今已取得了较大的发展,并在影视制作、视频游戏、军事仿真、公共安全等诸多领域得到了成功应用。随着以GPU为代表的计算机硬件性能的快
随着科技的不断发展和进步,计算机网络也逐渐成为了人们生活中不可缺少的部分。然而计算机网络却是危机四伏的,每天都有成千上万次的网络攻击事件发生,同时新的攻击手法也是
随着计算机网络以及流媒体技术的迅猛发展,视频压缩技术也跟着受到与日俱增的重视,各种视频标准成为了当今的研究热点。H.264视频编码标准是当今最流行的国际标准,在原有的H
传统的流媒体架构在可扩展性、成本控制、部署难易程度等方面存在诸多问题,限制了大规模流媒体应用的部署。对等网络(Peer-to-Peer, P2P)与流媒体技术相结合,产生了P2P流媒体
如今这个技术时代每分每秒都在产生大量数据,对PB、EB甚至ZB的存储需求并不难见,数据的量级也在不断突破我们的想象。个人或企业搭建属于自己的私有云存储服务需要巨大的前期投入以及后期维护成本,而公有云存储服务更加符合目前大部分个人和中小型企业的需求。公有云存储服务的使用者只需要向服务提供商支付少量费用即可获得高度可靠性、鲁棒性和扩展性的云存储服务。目前,许多公司提供的云存储服务需要用户提前支付费用以
教育观念的提升,学习方法的多样化,使社会对教学模式的需求大大提高。而计算机网络发展迅猛,即时通讯技术日新月异,又为多媒体远程教育系统奠定了技术和理论基础。网络白板,