一种新的双重融合的半监督特征选择算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:xiuxiumumu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对特征选择算法的鲁棒性和稳定性问题以及现实应用领域中大量的廉价未标签数据的利用问题,提出一种基于双重融合策略的半监督特征选择算法.该方法综合利用弱分类器融合技术和未标签数据包含的数据集的簇的结构信息来扩充标签数据集,然后在得到的标签数据集上采用不同的特征选择算法,对不同的特征结果进行简单的融合操作,得到最终的特征子集.在一些公共数据集和有毒性预测数据集上的实验结果表明该方法在改善学习精度上有很好的应用前景. Aiming at the problem of robustness and stability of feature selection algorithm and the utilization of a large amount of cheap and unlabeled data in the field of practical application, a semi-supervised feature selection algorithm based on double fusion strategy is proposed. This method combines weak classifier fusion And unlabeled data contained in the cluster data structure to expand the tag data set, and then the tag data set obtained using different feature selection algorithm, the different features of the results of a simple fusion operation to get the final feature The experimental results on some public datasets and toxic prediction datasets show that this method has a good application prospect in improving the learning accuracy.
其他文献
针对传统自适应集成极限学习机预测算法中集成权值更新不充分,受人为因素影响较大所导致的集成模型预测精度较低的问题,提出一种基于方差自适应集成极限学习机(Variance Adap
某会展中心采用蒸发制冷空调系统,在满足室内热湿负荷的情况下,空调系统节能健康环保初投资低。空调系统采用蒸发制冷全新风系统,人均新风量大,会展期间室内人员热舒性高。
本文针对当前校园管理机构的划分,设计了一个基于名称地址目录的PKI系统,该系统的信任模型采用的是Up-Cross-Down模型,在这种模型里构建一个名称地址目录,以此来实现PKI系统用户之间的交叉认证。
目的分析2010-2014年合肥市麻疹流行病学特征,为消除和控制麻疹提供科学依据。方法采用描述性流行病学研究的方法,对2010-2014年合肥市麻疹病例的流行学特征进行描述和分析。
目的:识别生活垃圾焚烧发电项目产生的主要职业病危害凶素及应设置的职业病危害防护措施.方法:通过生活垃圾焚烧发电项目预评价及控制效果评价项目,依据职业病危害因素检测结果进行职业病危害程度分析,分析职业病危害防护设施的可行性及有效性.结果:在正常生产情况下,职业病防护措施正常运转情况下,灰渣处理系统产生的粉尘8小时时间加权浓度为1.7~1.4mg/m3,硫化氢最高浓度为3.6mg/m3口,工作场所中职
针对四旋翼无人机欠驱动、强耦合的非线性动力学特性,文中研究设计了基于自抗扰控制技术的闭环飞行控制系统.自抗扰控制技术中,扩张观测器与基于误差的非线性反馈控制是其重
为减少建筑工程中楼板裂缝的困扰,结合某建筑项目的楼板工程的裂缝问题,分析了其出现的可能原因,并提出了具体的修补处理方法,执行严格的整改措施。实践证明,该项目未产生大面积裂
近年来,随着我国公路建设的不断发展,公路的养护里程逐年增加,机械化养护施工的重要性日渐凸显,对公路养护技术、质量和效率也提出更高的要求.公路的养护工作是保证公路系统
就氮肥不同用量对P88S/0293产量与抗性的影响进行了试验。结果表明,在每公顷施猪粪7 5t、菜枯375kg的条件下,以每公顷施纯氮165kg的产量和抗性表现最好。 The effect of nit
针对移动传感器网络中节点移动及能量有限问题,提出基于TDMA和事件触发的能量有效分簇算法。该算法以移动网络为应用背景,结合时分复用,通过分析簇头节点剩余能量及簇头节点