基于类信息的文本聚类中特征选择算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:harite
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类属于无监督的学习方法,由于缺乏类信息还很难直接应用有监督的特征选择方法,因此提出了一种基于类信息的特征选择算法。此算法在密度聚类算法的聚类结果上使用信息增益特征选择法重新选择最有分类能力的特征,实验验证了算法的可行性和有效性。
其他文献
8月18日,中国(牡丹江)-俄罗斯(远东)国际木业合作发展论坛再次吸引了东北亚嚣域合作的目光.来自中俄两国的150余位嘉宾以国际金融危机对中俄木业合作与发展的影响及对策为主题.深入
分别总结了网络物理拓扑发现算法和网络逻辑拓扑发现算法两大类拓扑发现算法的基本思想和设计方法,分析了影响各算法性能的主要因素,并对今后网络拓扑发现算法的设计路线作了展
金水沟特大桥位于陕西省合阳县境内,中心里程K64+162,桥跨设计为(88+5×136+78)m,全长855m,为预应力混凝土刚构连续箱梁桥。桥墩采用矩形薄壁空心墩,4#墩最高98m,桩基为Ф1.7m钻孔灌
广州新客站是亚洲最大的现代化铁路客运枢纽,土建工程造价约60亿元,共有15座站台,28条到发线,站房总建筑面积61.34万时。车站设计采用高架候车与地面站厅相结合的布局,
节省能耗和延长网络寿命是无线传感器网络研究的核心课题之一,国内外在节点放置、路由策略方面有大量研究,通过密度控制、分级簇等路由算法减少数据冗余。通过信息融合算法减少有效数据传输量是延长网络节点寿命的有效途径,并就此进行具体研究,提出了三种典型的分布式信息融合算法,即系数加权融合、无反馈的Kalman融合滤波及有反馈的Kalman融合滤波,并对其在805.12.4/ZigBee温度测量网络应用层协议
提出了一种重叠细胞图像自动分离的新算法。根据重叠细胞的凹凸性,从细胞重叠区域的凹区域中寻找到凹点,根据凹点数与细胞个数的关系,判断是细胞串联还是细胞并联:如果是串联的情况,则直接将成对的凹点连成直线分离重叠区域;如果是并联的情况,则将凹点与重叠区域的中心连接成直线分离重叠区域。该算法在Matlab环境下对重叠细胞图像进行了自动分离,实验结果表明该算法实现简单,效果理想,且能基本保持原细胞的大小和形
在隧道支护结构中采用湿喷工艺喷射聚丙烯纤维混凝土技术可以提高隧道围岩的稳定性,符合混凝土向高性能、绿色化、施工注重环境保护的发展趋势。在宝鸡-兰州复线东巨寺沟铁路
根据河南县气象局气象防灾减灾体系建设的现状以及农牧民对气象防灾减灾信息的需求,围绕农牧区气象防灾减灾体系建设的重点以及防御组织体系建立、气象灾害观测站网建立、提
结合丹界高速公路丹江特大桥工程实例,根据冬季施工相关规定和特点,对箱梁冬季混凝土施工进行热工计算,重点阐述了后张法预应力混凝土箱梁冬季施工的技术方案和工艺要求,并提出了