【摘 要】
:
特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算
【机 构】
:
中国科学技术大学电子工程与信息科学系,中国科学技术大学计算机科学技术系,安徽中科大讯飞信息科技有限公司
【基金项目】
:
国家高技术研究发展计划(863计划)
论文部分内容阅读
特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算法StaFSOS,并证明了在类别数为2时,SCD测度满足分支界限法的单调性;给出了StaFSOS的一个完备形式--BBStaFS.在12个标准数据集中,StaFSOS算法得出的结果和目标集几乎一致,而StaFSOS的效率高于其它算法;而在另1个中,BBStaFS算法得出了准确结果.在用1000个样本20个特征的真实数据进行的测试中,StaFS
其他文献
【正】1954年,华中第一重镇武汉遭到了"百年一遇"的洪水袭击。也就是在这一年,国家计委批准青山热电厂一期工程建设计划。该工程是"一五"计划时期由国家投资兴建的156项重点
【正】就黄石电网来说,荆州供电公司变压器经济运行的成功经验给我们启发很大。由于两地电网特点不尽相同,我们在此项工作的开展上既有共性也有特性。如荆州供电具有区域大、
通过对扩频码分多址(CDMA)水印模型的编码及检测方法进行理论分析,阐述了信息嵌入量、扩频码长、检测错误率等指标之间存在的制约关系,并使用实验进行比较和验证.在理论分析
【正】档案价值的演变与文件生命周期问题,不仅是档案学基础理论研究中的重要课题,而且是档案实际工作中人们关注的焦点之一。准确把握档案文件的运转阶段及价值演变,真正理
针对数字城市的需求,构造了一个城市空间信息及服务集成框架,实现数据互操作、软件互操作和应用互操作.集成框架分为Web应用、服务集成器、分布的服务和分布的信息4个层次,很好地组织管理并集成了分布在城市不同部门的异构空间信息及空间应用服务和UDDI注册的商业服务.根据该框架,实现了一个基于WebServices、GML和元数据技术的集成系统———π系统,并且搭建了一个空间信息及服务集成的模拟环境,对π
【正】企业往往是在应对挑战中不断发展壮大的。2006年,湖北省电力公司面临的挑战和考验尤其之多。行风评议便是其中之一。去年年初,湖北境内“电、气、油、水”四大服务行业
长期以来 ,波峰宽度的取值问题一直是模式识别领域中势函数法的难题 .该文将模式识别问题与信号分析理论结合起来研究 ,得到了使用双边指数脉冲函数作为插值函数时的波峰宽度的解 ,给出了寻找势函数波峰宽度取值的有效方法 .在基于UCI数据的判决精度实验中 ,该文的工作得到了有效的验证 .
【正】电力企业作为商品的销售者,有义务向广大客户介绍电、宣传电、告知怎样使用电,为电附上"使用说明书"。荆门供电公司建立"红马甲爱心驿站"、培养农村用电明白人的创举得