基于优化的文档频和Beam搜索的特征选择方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:lhnyzz520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类中,特征空间的维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,必须使用特征选择算法。首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个基于Beam搜索的属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择算法。该算法首先利用基于最小词频的文档频方法进行特征选择,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结
其他文献
利用智能温湿度传感器、8位单片机、键盘数字显示模块控制器构成一种高集成温湿度测量系统,该测量系统具有传感器非线性补偿、温度补偿、自校准以及断电保护现场置入等功能,可用于温度、湿度和露点的精确测量。
采用GB13021《聚乙烯管材和管体炭黑含量测定(热失重法)》和热重分析仪法两种方法测定了聚乙烯中炭黑含量。对两种方法的测定结果进行了比较,结果表明,两种方法均有良好的重复性
采用双层安全炉熔炼镁合金和环壁式除渣法清除结晶器中的氧化皮和夹渣等技术,研制了新型镁合金Mg-Al-Zn-Y光谱标准样品。考察了标准样品的均匀性和稳定性,该标准样品有效期为5
目的:优选心脑通泰胶囊剂提取的最佳工艺。方法:采用正交设计方法考察醇提条件,以干膏量和天麻素含量为指标。结果:筛选出乙醇的用量为药材的10倍、提取次数为3次、提取时间为2
不久前,落户城阳区的国际食品药品检测机构青岛海润农大检测有限公司开始对设备进行模拟运行。有需求的食品加工企业,现在就可以取样送检,该项目的设立既填补了我国在国际食品药
有效和可靠的无线传感器网络重编程技术是解决大规模传感器网络难于管理和维护的重要途径。介绍了无线传感器网络重编程的概念和基本组件,提出了无线传感器网络重编程技术面临
加强学风建设是学校治学精神、治学态度和治学原则的综合体现,是形成良好学风、校风的基础和前提。笔者在广西中医药大学学生中进行了学风状况专项调查,从教、学、管等3个方面
目的:探讨〈10 kg的先天性心脏病患儿术后呼吸管理的方法和经验。方法:收集2004年2月至2012年8月收治的106例体重〈10 kg的先心病患儿在全麻低温体外循环下行畸形矫正术的临床
在中国的教育体制下,高等医学院校临床医学专业研究生导师大多是在科学教育与人文教育分离的模式下培养起来的,使文化素养缺失。通过严格导师遴选、加强岗位培训、倡导博览群书
针对非平稳的数字调制信号,构造新的高阶交叉累量特征;利用神经网络的学习机制实现自适应模糊推理调制识别器的非线性动态建模;采取分层决策的级联结构,提高了特征与识别器的契合