基于优化的文档频和Beam搜索的特征选择方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：lhnyzz520

【摘要】

：

在文本分类中，特征空间的维数通常高达几万，甚至远远超出训练样本的个数，这是一种十分普遍现象。为了提高文本挖掘算法的运行速度，降低占用的内存空间，过滤掉不相关或相关程度低的

【作者】

：

朱颢东钟勇

【机构】

：

中国科学院成都计算机应用研究所,中国科学院研究生院

【出处】

：

计算机科学

【发表日期】

：

2009年11期

【关键词】

：

词频文档频粗糙集 Beam搜索属性约简 Word frequency Document frequency Rough set Beam search A

【基金项目】

：

本文受四川省科技计划项目（2008GZ0003）,四川省科技厅科技攻关项目（07GG006-014）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在文本分类中，特征空间的维数通常高达几万，甚至远远超出训练样本的个数，这是一种十分普遍现象。为了提高文本挖掘算法的运行速度，降低占用的内存空间，过滤掉不相关或相关程度低的特征，必须使用特征选择算法。首先给出了一个基于最小词频的文档频方法，然后把粗糙集引入进来并提出了一个基于Beam搜索的属性约简算法，最后把该属性约简算法同基于最小词频的文档频方法结合起来，提出了一个综合的特征选择算法。该算法首先利用基于最小词频的文档频方法进行特征选择，然后利用所提属性约简算法消除冗余，从而获得较具代表性的特征子集。实验结

其他文献

一种高集成温湿度测量系统的研制

利用智能温湿度传感器、8位单片机、键盘数字显示模块控制器构成一种高集成温湿度测量系统,该测量系统具有传感器非线性补偿、温度补偿、自校准以及断电保护现场置入等功能,可用于温度、湿度和露点的精确测量。

期刊

智能温湿度传感器8位单片机温湿度测量系统intelligent temperature and humidity sensor 8 bits singl

聚乙烯中炭黑含量不同测试方法的探讨

采用GB13021《聚乙烯管材和管体炭黑含量测定（热失重法）》和热重分析仪法两种方法测定了聚乙烯中炭黑含量。对两种方法的测定结果进行了比较，结果表明，两种方法均有良好的重复性

期刊

GB13021热重分析仪法炭黑含量重复性一致性GB 13021 thermogravimetry carbon black content r

新型镁合金Mg-Al-Zn-Y光谱标准样品的制备和定值

采用双层安全炉熔炼镁合金和环壁式除渣法清除结晶器中的氧化皮和夹渣等技术，研制了新型镁合金Mg-Al-Zn-Y光谱标准样品。考察了标准样品的均匀性和稳定性，该标准样品有效期为5

期刊

新型镁合金Mg-Al-Zn-Y标准样品制备定值new magnesium alloy Mg-AL-Zn-Y CRM preparation c

心脑通泰胶囊剂提取工艺研究

目的：优选心脑通泰胶囊剂提取的最佳工艺。方法：采用正交设计方法考察醇提条件,以干膏量和天麻素含量为指标。结果：筛选出乙醇的用量为药材的10倍、提取次数为3次、提取时间为2

期刊

提取工艺正交试验天麻素胶囊剂Extractive technology Orthogonal design Gastrodine Capsule

国际食品药品检测中心成立

不久前，落户城阳区的国际食品药品检测机构青岛海润农大检测有限公司开始对设备进行模拟运行。有需求的食品加工企业，现在就可以取样送检，该项目的设立既填补了我国在国际食品药

期刊

食品加工企业检测中心药品国际模拟运行检测机构技术壁垒城阳区

无线传感器网络重编程技术研究

有效和可靠的无线传感器网络重编程技术是解决大规模传感器网络难于管理和维护的重要途径。介绍了无线传感器网络重编程的概念和基本组件，提出了无线传感器网络重编程技术面临

期刊

传感器网络网络重编程代码分发动态重配置Sensor networks Network reprogramming Code disseminatio

广西中医药大学学风状况调查与学风建设机制研究

加强学风建设是学校治学精神、治学态度和治学原则的综合体现，是形成良好学风、校风的基础和前提。笔者在广西中医药大学学生中进行了学风状况专项调查，从教、学、管等3个方面

期刊

学风建设中医药大学状况调查广西高等中医药院校治学精神大学学生大学生

体重〈10kg先天性心脏病患儿术后呼吸道管理

目的：探讨〈10 kg的先天性心脏病患儿术后呼吸管理的方法和经验。方法：收集2004年2月至2012年8月收治的106例体重〈10 kg的先心病患儿在全麻低温体外循环下行畸形矫正术的临床

期刊

低体重儿先天性心脏病呼吸道管理

提高临床医学专业研究生导师文化素养的思考

在中国的教育体制下，高等医学院校临床医学专业研究生导师大多是在科学教育与人文教育分离的模式下培养起来的，使文化素养缺失。通过严格导师遴选、加强岗位培训、倡导博览群书

期刊

临床医学研究生导师文化素养提高方法

基于自适应级联模糊推理的调制识别算法

针对非平稳的数字调制信号，构造新的高阶交叉累量特征；利用神经网络的学习机制实现自适应模糊推理调制识别器的非线性动态建模；采取分层决策的级联结构，提高了特征与识别器的契合

期刊

调制识别级联模糊神经网络高阶交叉累量模糊推理自适应Modulation recognition HFNNS HOCC Fuzzy inferen

基于优化的文档频和Beam搜索的特征选择方法

与本文相关的学术论文