基于改进相对判别准则的文本分类方法

来源 :网络新媒体技术 | 被引量 : 0次 | 上传用户:goodhope9010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类过程中,为了提升特征过滤法的性能,基于相对判别准则(RDC),提出一种采用多变量形式的改进方法。首先,使用RDC度量计算每个特征的相关值;然后,考虑多个特征变量之间的依赖关系,使用Pearson关联以计算特征之间的关联值。同时,利用最小冗余和最大相关的概念,对冗余特征进行约简。最后,选出特征子集,作为后续分类的要素。所提方法在3个数据集上进行实验评价。结果表明,在大部分情况下,所提方法在精度、召回率和F度量方面的分类性能优于其他方法,且复杂度适中。
其他文献
通过调研国内外资料,详细叙述了CDG的特性及应用原理和在国外油田的应用状况,结合在大庆石油进行的CDG评价实验以及大庆油田地质特征和开发现状,对大庆石油田应用CDG技术的可行性进行了初
对塔里枯木要盆地西部巴楚断隆,阿瓦提凹陷古生代产出的牙形刺化石进行了研究。建立了5个牙形刺化石组合带,讨论了其地史分布及其地质时代,牙形刺化石颜色指标研究表明,巴楚断隆区
大庆油田杏二区三元复合驱采出液化学组成分析表明,矿场试验中、后期采出液内含有较高浓度的聚合物和其它一些注入化学成分,这为采出液的利用奠定了物质基础。在人造物理模型上
当四轮独立电驱动车辆单轮进入滑转工况时,车辆出现非期望的横摆扭矩,进入非稳定状况.针对此问题,提出了控制滑转车轮进入最优滑转率、并保证车辆行驶稳定性的驱动防滑控制方法.样
早期复极综合征(ERS)是1936年Shiplay首次提出这一概念,长期以来包括权威的心脏病学专家均认为是一种正常的心电图变异,人群发生率美洲2.2%、亚洲2.6%、非洲9.1%,多她于年轻人及运动员。
混合动力客车通常包含发动机与蓄电池组两种动力源,如何对其输出功率进行分配,使系统总能耗达到最小是控制策略中需要关注的问题.针对客车行驶的特点,结合行驶工况的主客观识别,运
提出一种对声学换能器进行宽带匹配设计的改进实频数据优化算法。该算法避免了繁琐的数学运算,并有效降低了优化过程的非线性度,提高了优化的效率。在对该算法进行理论分析的
应用前反馈混合控制的方式实现了固定系数数字有源降噪耳机系统的设计。前馈控制采用拟合最优维纳滤波器的设计方法,反馈控制采用H2/H∞优化的设计方法,充分考虑了耳机系统的
随着大数据及网络处理技术的日臻完善,云计算已经成为互联网时代软硬件部署的首选架构。同时,针对有低延迟要求的流式数据处理场景以及受限的网络带宽资源现状,边缘计算模型
本文对“V满”存在句的两大特点进行了分析。首先对其宾语为何不能受数量成分修饰给予了新的解释.主要跟句子具有的“夸张”语用色彩有关,并指出了宾语即容物的群体性特征,且其