结合类内集中度和最小集合覆盖的特征选择

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:kxf2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是文本分类中的核心研究课题之一。简单分析了词频和文档频,在此基础上提出了类内集中度,把集合覆盖的思想引入粗糙集并提出了一个基于最小集合覆盖的属性约简算法,把该属性约简算法同类内集中度结合起来,提出了一个新的特征选择方法。该方法利用类内集中度进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,利用所提约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
其他文献
自然循环锅炉是一个多变量、非线性的复杂系统,其控制系统工程设计仍然存在着系统设计与工程应用相脱节的问题。具体分析了自然循环锅炉的控制需求,设计了基于西门子故障安全
所有边缘活动轮廓模型都依赖边缘停止函数,该函数通常是高斯平滑图像的梯度模的单减函数。梯度能够刻画图像的局部边缘特征,但忽略了边缘的"分叉点"、"角点"等重要信息,这导致了边缘定位不准甚至产生错误的分割。基于图像结构张量的一个局部相干性度量,提出一个新边缘停止函数。实验结果表明,基于这个边缘停止函数,活动轮廓模型能够精确定位目标边缘,同时大大减少了迭代次数并具有较强抗噪性。