复杂假设场景下的机器学习研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:ConchConch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从计算机技术得到长足发展,人类获取和存储信息的能力快速增强。这些信息来源复杂,且常常包含着噪声信息和大量冗余信息,利用这些复杂的信息建立可靠的模型一直是机器学习的热点。针对标签噪声问题,rNDA算法将翻转概率引入普通判别分析中,得到能够处理标签噪声的鲁棒判别分析算法。对信息来源复杂,即输入特征不能用单一分布来描述的问题,考虑把高斯有限混合模型引入rNDA算法,提出一种针对标签噪声的基于高斯有限混合模型的鲁棒判别分析算法。最后实验表明提出的基于高斯有限混合模型的鲁棒判别分析算法有较好的分类性能,性能与原始的NDA算法和rNDA算法相比有提高。高斯有限混合模型需要提前指定混合组分个数,若指定的混合组分个数不适当会影响混合模型的分类性能。针对该问题,引入狄利克雷过程,在对组分进行抽样时,自适应地解决混合组分个数确定问题。针对输入特征的噪声信息和冗余信息,将深度学习中的Dropout方法应用到LDA算法中,利用Dropout方法选择特征子集这一特点,提出一种基于Dropout特征选择的LDA集成分类算法。实验证明,这种基于Dropout的算法对分类性能有显著提升,且在含标签噪声的数据集上也有很突出的表现。
其他文献
Takagi-Sugeno(T-S)模糊模型是指采用局部线性化方法,基于模糊隶属度函数将各个线性子模型光滑连接起来的一个全局模型,它能够以任意精度逼近非线性系统,因而受到了广泛关注
近年来,随着我国经济迅猛发展,交通业越来越发达,不断增加的汽车保有量为人们的通行提供了诸多便利。根据国家统计局公布的信息显示,截至2019年6月,全国汽车保有量达2.5亿辆,
伴随着工业生产、科学领域及各行各业向智能化、数字化的发展,控制系统的受控对象越来越复杂,不仅包含了连续的、确定的动态过程,还包含大量的离散变量和随机因素。这就使得
案件指纹是揭露犯罪和认定犯罪的重要物证。加强案件指纹信息的管理和使用,对于提高刑事案件破案率具有重要作用。案件指纹主要分散于各地公安机关的刑侦部门,指纹查询比对工
近年来,如何从理论上分析算法的泛化性能是机器学习主要研究问题。在机器学习中,泛化误差用来衡量一个学习机应用到未知数据的学习能力。我们希望找到一个泛化误差的上界,利
无线通信中需要根据信道质量调整传输速率,在保证误码性能条件下以尽可能高的速率进行传输。传统的发端速率自适应技术需要信道反馈来确定信道质量,反馈开销较大,反馈控制复
由于互联网中路由和交换设备的封闭特性,使得网络创新的步伐十分缓慢。SDN(Software Defined Network,软件定义网络)通过解耦网络的控制和转发,采用基于流表的交换机和集中式
在下一代移动通信网络的关键技术研究中,密集组网是公认的提升网络容量的有效手段之一。基站的密集部署会直接造成系统能耗的快速增长,考虑到网络运营的开销,通信网络的能耗
在工业自动化飞速发展的当代,各种控制方法层出不穷,但在实际工业现场中,常规PID控制仍然占据主导地位。其控制品质对被控对象的变化不太敏感,非常适用于工业生产现场。但是,
随着医疗信息化的不断普及,医疗数据的规模也在不停增长。人们经过对医疗数据的剖析和研究,了解了医疗数据之间的内在联系,从而为提升医疗服务的质量提供数据支持。但医疗数据中含有很多的隐私信息,如何保护隐私信息成为限制医疗数据分析的重要问题。本文首先提出了一种基于同态加密的医疗数据隐私保护方案,由信息采集端、边缘服务器、云计算服务器和用户端组成。在该方案中,信息采集端对医疗数据进行采集,并利用公钥加密方案