基于信息熵的半监督特征选择算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：anywho

【摘要】

：

诸多实际应用中,由于确定数据集的类信息通常比较“昂贵”,因此研究者只能为其中很少量的数据标记类信息。针对上述“少量标记数据问题”,文中基于粗糙集理论和信息熵的概念,

【作者】

：

王锋刘吉超魏巍

【机构】

：

山西大学计算机与信息技术学院

【出处】

：

计算机科学

【发表日期】

：

2018年B11期

【关键词】

：

少量标记数据信息熵半监督特征选择

【基金项目】

：

国家自然科学基金项目(61402272,61772323,61603230);山西省教育厅高效科技创新项目(2016111)资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

诸多实际应用中,由于确定数据集的类信息通常比较“昂贵”,因此研究者只能为其中很少量的数据标记类信息。针对上述“少量标记数据问题”,文中基于粗糙集理论和信息熵的概念,提出了一种基于信息熵的粗糙特征选择算法。通过分析给定数据集上有标记数据集和无标记数据的信息熵,重新定义了整个数据集上的信息熵。在此基础上定义了半监督意义下基于信息熵的特征重要度,设计了一种基于信息熵的可有效处理含有少量标记数据的半监督粗糙特征选择算法。实验结果进一步验证了所提算法的可行性和高效性。

其他文献

磨细增钙液态渣作为活性掺合料研究

针对高性能泵送混凝土的技术特点与性能要求，研究了不同比表面积的磨细增钙液态渣粉等量取代水泥50％时的胶砂强度，及其不同取代量对泵送混凝土工作性和抗压强度的影响。结果表明

期刊

高性能混凝土活性矿物掺合料复合增效液态矿渣

主井煤流系统各转载点自动喷雾系统的设计与应用

本系统通过采用西门子PLC和变频控制技术,充分发挥提升机数字化控制技术的优势,在主煤流系统各转载点设计和应用了一套自动化喷雾系统,以达到降低现场粉尘浓度,改善现场环境

期刊

主煤流系统PLC与变频技术喷雾降尘

民办高职院校电子商务专业课堂教学与实践探讨

深入理解“课程意识”和“教学意识”相互作用是可以促进提高民办高职院校电子商务课堂的教学质量。民办高职院校电子商务专业课程的教学需要基于民办高职学生的“学情条件”

期刊

电子商务课堂教学“1+3+3”教学模式

两种铝合金的点焊组织模拟与试验分析

AA5754和AA6082是两种具有不同强化机制的铝合金材料,在电阻点焊加热过程中,两种铝合金材料的组织会发生不同类型的转变.通过采用不同的计算模型,使用有限元软件对两种铝合金

期刊

铝合金电阻点焊数值模拟点焊组织

两级交错单相VSR的均流控制

供配电网和大功率逆变焊机等应用场合要求电力电子变压器（PET）具有较高的功率等级。电力电子变压器低压端采用多级交错单相电压源整流器不仅可以克服传统单级VSR在功率电感、功

期刊

功率因数校正两级交错直接并联交错并联电流均衡参数不一致

PAM对坡地降雨径流入渗和水力侵蚀的影响研究

通过野外沙壤土坡地人工降雨产流试验，研究了地表施用高分子聚合物PAM（Polyacrylamide）对降雨径流量、径流含沙量、一次降雨土壤侵蚀总量等的影响。通过对试验结果的分析，建立了

期刊

聚丙烯酰胺(PAM)坡地径流水力侵蚀影响研究

我国带压开采研究现状及其展望

总结了20世纪60年代以来,我国承压水上采煤的研究成果,存在的问题及其今后的发展.为带压开采的深入研究提供详细的参考,为我国煤矿安全生产的研究提供一些可行的理论、技术与

期刊

带压开采突水监测预报

温度和模拟渗滤液作用下黏土的渗透性能研究

采用改造的GDS全自动环境岩土渗透仪,分别以自来水和模拟渗滤液为试验用水,开展不同温度和围压下黏土渗透性能试验。研究表明,当温度从20℃升高至50℃时,渗透系数增大,最大增

期刊

温度效应模拟渗滤液渗透系数固有渗透率

指夹式排种器振动模拟与试验分析

为研究免耕播种机工作过程中产生的随机振动对排种质量的影响,对2BM-2免耕播种机在秸秆覆盖条件下作业时排种器的振动特性进行测试,并对振动信号进行时域和频域分析。结果表

期刊

指夹式排种器免耕播种机振动特性模拟试验播种合格指数

运用HHT边际谱的柴油机故障诊断

提出了一种基于希尔伯特-黄变换（Hilbert-Huang transformation,简称HHT）边际谱的柴油机故障诊断方法。在3110柴油机上进行了气门间隙变化和断油等故障的模拟试验,测取了柴油机

期刊

柴油机故障诊断希尔伯特-黄变换边际谱马氏距离

基于信息熵的半监督特征选择算法

与本文相关的学术论文