基于类标号扩展的半监督特征选择算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zhouyu_yy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是数据挖掘、机器学习等领域的重要内容,在缺乏已标记样本的情况下,如何有效选择特征是一个非常值得研究的问题。基于集合间相关度与自相关度的定义,提出了一种新颖的半监督特征选择方法,从原始、少量、且已标记的训练样本出发,通过扩展类标号得到最终的聚类效果,采用复合的评价方法作为衡量特征子集的标准。大量实验结果表明,该算法是有效的。
其他文献
《三只虫草》(原载《人民文学》2015年2期)是擅长篇写作的阿来继《遥远的温泉》发表13年后捧出的一部中篇。十二年前,我读过该作品,少年的“我”对于远方的神往和牧马人贡波斯甲
报纸
提出的改进的极值中值滤波(IEM)算法是在极值中值滤波(EM)算法的基础上做了如下两点改进。首先,采用更合理的检测方法来检测噪声点,减小将信号点误判为噪声点的概率。其次,采
随着社会体制结构与社会文化观念的不断变化,影响中小学生心理健康的因素日益增多,而中小学生的心理问题日趋严重,为此,教育部门应转变教育观念,把心理教育放到学校工作的重
文昌阁巨型黄土-基岩滑坡位于兰州市西固区达家台台缘,自1995年1月滑坡后缘出现拉张变形裂缝后,滑坡体的运移速度不断加大,滑坡险情严峻.根据滑坡变形特征和长期的滑坡动态监
随着软件系统的规模和复杂性日益增长,软件开发已经演变成一项复杂的系统工程。软件工程中的对象、活动和过程更加难以控制和管理,因此该领域原有的经验直觉型的处理模式已经
高血压病是一种难以快速治愈的疾病,因此高血压疾病的出现也会大量消耗社会医疗资源以及加重家庭的负担。在此背景下通过本文的综述研究得出以下结论 :当前对于高血压疾病的
《茶经》·《茶酒论》与法门寺茶道研究梁贵林《茶经》:茶道之元典。山水赋灵气,南方生嘉木。“神农尝百草,日遇七十二毒,得茶而解之。”①先祖炎帝开华夏利用茶叶之先河。经过食
指代消解是自然语言处理领域中要研究的关键问题之一。在自然语言中,为了使语言简明,减少冗余,往往对同一意思的单词、句子或某一事件用不同的单词来代替。相对于人而言,计算
本报今天报道的黄岩区村级组织管理“三化十二制”,早在2005年就获得全省组织工作创新奖,可为什么我们仍以新闻的笔触,深入采写,重磅推介?一是黄岩区组织部门11年坚持不懈,探索实施
报纸