切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于类别区分度的文本特征选择算法研究
基于类别区分度的文本特征选择算法研究
来源 :北京化工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hwcf
【摘 要】
:
针对词频反文档频率(TFIDF)算法的缺陷,引入类别区分度理论改进传统的TFIDF算法.通过比较改进TFIDF算法与其他几种常用特征选择算法的分类效果,证明了改进TFIDF算法用于中文文
【作 者】
:
易军凯
田立康
【机 构】
:
北京化工大学信息科学与技术学院
【出 处】
:
北京化工大学学报:自然科学版
【发表日期】
:
2013年B12期
【关键词】
:
文本分类
特征选择
词频反文档频率算法
类别区分度
text classification
feature selection
term frequency
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对词频反文档频率(TFIDF)算法的缺陷,引入类别区分度理论改进传统的TFIDF算法.通过比较改进TFIDF算法与其他几种常用特征选择算法的分类效果,证明了改进TFIDF算法用于中文文本分类时,准确率和召回率要优于其他算法,改进TFIDF算法具有较好的特征选择效果.
其他文献
类毛线团表面银微球的制备及其表面增强拉曼散射性能研究
以低分子量聚丙烯酰胺(PAM)为模板,通过液相化学还原法首次制备了类毛线团表面银微球,并采用扫描电子显微镜(SEM)、X射线衍射(XRD)及氮气吸附法对银微球形貌及分散性进行表征。结果表
期刊
微米银球
类毛线团表面
表面增强拉曼光谱
罗丹明B
silver microspheres
woolen-ball-like surfaces
surfac
芴酮引发丙烯酸两步接枝LDPE膜表面改性的研究
采用两步接枝方法,研究了芴酮(FL)引发丙烯酸(AA)在低密度聚乙烯(LDPE)膜表面的接枝聚合过程,探讨了单体浓度、聚合温度等因素对表面接枝的影响。结果表明:在单体质量分数为5%~20%,聚合温
期刊
芴酮
低密度聚乙烯
表面光接枝
丙烯酸
fluorenone
low density polyethylene (LDPE)
surface photo
普洱茶渥堆发酵中活性成分测定及其相关性分析
利用高效液相色谱法分别测定表没食子儿茶素没食子酸酯、表儿茶素、茶氨酸、槲皮素、黄嘌呤和次黄嘌呤在普洱茶发酵过程中的含量变化,发现在发酵过程中,表没食子儿茶素没食子酸
期刊
普洱茶
渥堆发酵
高效液相色谱法
相关性分析
Pu' er tea
pile-fermentation
high performance liquid
一类供体-受体双嵌段丙烯酸酯聚合物的合成及性能
利用原子转移自由基聚合(ATRP)法合成了一种新的供体-受体双嵌段聚合物聚对(二苯胺基)苯乙烯-聚(2-(2-蒽醌甲酰氧基)甲基丙烯酸乙酯(P1-b-P2)。供体段是富电子的三苯胺段,受体段是缺电
期刊
供体-受体双嵌段聚合物
太阳能电池
循环伏安
diblock copolymer
solar cell
cyclic voltammetry
吡咯喹啉醌生产菌的发酵条件优化
对一株产吡咯喹啉醌(PQQ)假单胞杆菌Pseudomonas 0813的发酵条件进行了优化,通过单因素试验确定碳源、氮源及无机盐成分,之后用正交试验法优化各成分配比,考察了发酵温度、初始pH
期刊
吡咯喹啉醌
发酵
单因素试验
正交试验
pyrroloquinoline quinone
fermentation
single factor test
Y型微通道内聚乳酸-羟基乙酸共聚物纳米分散体的制备
采用Y型微通道,通过反溶剂沉淀法研究了聚乳酸-羟基乙酸共聚物(PLGA)透明纳米分散体的制备过程。实验考察了在丙酮-水体系条件下,PLGA丙酮溶液浓度、总流量、反溶剂流量、溶剂
期刊
聚乳酸-羟基乙酸共聚物
反溶剂沉淀法
Y型微通道
纳米分散体
poly(lactic-co-glycolic acid)
anti-solvent preci
基于改进Retinex方法的遥感图像云雾去除研究
针对目前遥感图像受云雾覆盖导致利用率较低的问题,通过分析Retinex理论在云雾去除上的不足,提出了一种基于图像云雾区域识别的Retinex云雾去除改进新方法。通过划分出遥感图像的云雾覆盖区域和无云区域,并对不同的区域有针对性地进行处理,达到同时进行图像云雾去除和地面信息增强的效果。对仿真实验结果的分析表明,此种新方法能够在图像云雾去除、色彩恢复及细节增强等方面提供更好的处理效果,大大提高了遥感图
期刊
RETINEX理论
亮度保持因子
云雾去除
区域识别
Retinex theory
brightness maintenance factor
cloud
基于依存文法的垃圾短信自动识别
针对现今垃圾短信泛滥的现状,给出了一种基于依存文法的组合特征选取的中文短信过滤方法.该方法通过对短信进行句法分析,将依存关系较强的词合并处理,组合成更能代表短信内容
期刊
垃圾短信
短信过滤
特征提取
依存语法
支持向量机
spam short message
short message filtering
feature e
响应面法优化龙胆苦苷脂质体的复乳法制备工艺
采用复乳法制备脂质体,使用3因素3水平的Box-Behnken响应面设计,以脂质体的包封率、载药量和综合评价为响应值,考察龙胆苦苷药液质量浓度、第一次乳化超声时间及膜材中磷脂与胆
期刊
响应面法
龙胆苦苷
脂质体
复乳法
处方优化
response surface methodology
gentiopicroside
liposome
基于小波包变换的三维荧光光谱数据压缩方法
基于db小波包变换,采用频率分级阈值方法对三维荧光光谱数据进行了压缩。建立了数据的小波包分解树,根据对数能量熵最小原则确定最优树,通过频率分级阈值方法对最优树中的小波包系数进行压缩,并且用实验获取的数据加以验证。实验结果表明,和小波变换相比小波包变换能够更有效地保留数据的细节信息。通过和其他阈值法比较可知,频率分级阈值法具有更好的压缩率和数据恢复能力,其压缩分数达到90%,恢复分数大于98%,谱线
期刊
数据压缩
三维荧光光谱
小波包变换
平行因子法
compression
fluorescence analysis
wavelet packet
para
与本文相关的学术论文