基于类内词频改进互信息特征选择算法

来源 :2008年中国智能系统工程学术大会 | 被引量 : 0次 | 上传用户:mvcexq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自动文本分类系统中,特征选择是影响文本分类准确率和效率的一个重要方面.本文分析几种常用的特征选择方法,在考虑类内词频及其分布因素基础上,提出一种改进的互信息特征选择方法;通过实验验证了该方法的有效性,并分析算法在基于聚合订阅的IPTV新闻内容检索中的应用模式与前景.
其他文献
目的 了解湖南省国营企业内临时工的职业危害状况 (即职业危害向临时工转移情况 ) ,保护临时工身体健康。方法 按分层抽样法 ,在全省 13个地市、7个系统内抽取 41家国营企
辛巳腊月二十一,时在公元1942年1月。初春之时的泉州,尚有多种鲜花盛开。暂住开元寺的弘一师结束了他此次繁忙的泉州弘法、结缘行程,准备回到石狮檀林村的福林寺过年。上海刘
目前在基于诱发电位(evoked potential,EP)的脑机接口(brain-computer interface,BCI)系统中,最关键的问题是脑电(electroencephalogram,EEG)数据中特定成分的检测与提取.本
本文通过分析PSO算法对求解多变量高精度约束优化问题的不足,提出一种基于PSO算法的CTPSO算法,该算法对处理求解高精度多变量约束优化问题有较好搜索能力;详细介绍了CTPSO算
准确预测油田未来原油产量对油田的开发和生产管理具有重要的指导意义.对于具有非线性、不确定和开放特性的多变量系统进行预测,使用传统的统计学方法或静态模型预测通常不能
会议
本文给出了求解铁路机车调度问题的遗传算法流程;分析了求解调度问题的编码策略、隶属度函数选择:讨论了遗传算法的交叉算子策略、变异算子策略以及算法参数的选择策略等.提出
会议
本文提出了一种新的路径相似度系数计算方法,用于计算用户访问行为的相似度,并在此基础上提出一种改进的传递闭包模糊聚类算法对Web用户行为进行数据挖掘,这种改进的算法较之
Skyline查询是当前数据库研究非常热门的课题。它在多目标决策等领域扮演着重要的角色.Skyline查询的一个重要问题是其输出结果往往非常庞大并且无序.从应用的角度来讲,将查
在机器翻译的研究中,混合式方法是一种好方法。本文的工作有三部分:第一部分讨论完全实例的机器翻译,以及句型转换的机器翻译和近似机器翻译;第二部分讨论近似机器翻译算法;第
在网上有棋迷用流行的“凡客体”这样形容她:“爱下棋,爱刷新各种纪录,不爱打游戏,爱Facebook,也爱魏晨、刘翔,我不是神童,不喜欢被称为天才,我是最年轻棋后侯逸凡。”她9岁