新的CDF文本分类特征提取方法

来源 :计算机应用 | 被引量 : 9次 | 上传用户:gg5921
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对高维的特征集进行降维是文本分类过程中的一个重要环节。在研究了现有的特征降维技术的基础上,对部分常用的特征提取方法做了简要的分析,之后结合类间集中度、类内分散度和类内平均频度,提出了一个新的特征提取方法,即CDF方法。实验采用K-最近邻分类算法(KNN)来考查CDF方法的有效性。结果表明该方法简单有效,能够取得比传统特征提取方法更优的降维效果。
其他文献
探讨利用免疫学教学的各个环节,如理论教学、实验教学与社会实践活动等来激发医学本科学创新思维、培养医学生的创新能力,为我国培养出更适应21世纪生命科学发展需要的开拓型医
文章首先介绍了当前最热门的计算机技术之一——云计算技术,然后分析了将云计算应用于电信数据分析领域的可能,对Hadoop云计算平台作了描述,阐述了基于Hadoop的电信业务数据
随着移动通信技术的迅猛发展,高等学校通信工程专业的移动通信课程急需改革。文章研究了面向第三代移动通信系统的实训项目体系设计。基于学院现有的软件和硬件资源,所设计的
为解决局域网中的服务器与客户机与标准时间保持时间同步的现实问题,阐述了时间同步的工作原理,介绍了网络时间协议(NTP),并提出了网络中各机器同步的解决方案以及程序实现,时间精度可根据需要进行设置。该方法应用于集约化水产控制系统和超市监控系统中,实验证明是一种可行的解决方法。
文章介绍了中国电信校园CDMA网络的用户业务模型,分析了其对网络资源占用的影响,并在此基础上提出了校园区域扩容规划和优化的方法建议。
目的 探讨EGF与胰岛素和高渗糖结合来修复三级和四级褥疮的机制为褥疮的治疗提供了依据.方法 200例褥疮患者随机分为4组:50例一组,观察组:常规的方法治疗,实验组1:常规的方法
患者男,51岁,因“左侧腰痛1个月”于2008年1月21日入院。患者于1月前无明显诱因出现左侧腰部疼痛,呈阵发性,改变体位无缓解,无放射痛。疼痛发作不伴有发热、恶心、呕吐、返酸、嗳
国际电信联盟日前表示,在日本发生里氏9.0级特大地震后,已经向遭受海啸严重破坏的日本沿海地区运送应急通信设备。
提出了一种新的动态分配带宽的多速率组播拥塞控制策略(DAMCC)。针对当前使用的多速率组播拥塞控制策略RLC调整速率粒度粗糙、接收端带宽的利用不充分的问题,DAMCC设计了动态分段计算增强层的速率算法。执行DAMCC的接收端,根据反馈的响应信息计算网络往返延迟(RTT),进而计算自身的TCP友好速率,以相应的速率接收组播数据,达到与TCP流公平竞争网络资源的目的。仿真实验表明,该拥塞控制策略比分层
近日,中国联通在全国56个城市正式开通HSPA+商用服务,并同步推出“沃3G21M无线上网卡”,该上网卡的下行速率可达21.6 Mbps。有网友实测发现,联通此次推出的21M上网卡,其下载速率超过