特征词选择相关论文
随着计算机网络的迅速发展,实现了人们在网络中轻松查找信息的功能。同时,信息资源随着网络的发展也在成倍数的急剧增长。那么,如何在......
随着信息时代的到来和Internet的日益普及,电子文本迅速膨胀,如何在海量的文本中提取潜在的、有价值的知识和模型成为信息处理的一......
未来技术分析在科技规划、科技管理与战略领域发挥了越来越重要的作用,对于情报研究而言,除了在拥有良好基础的动态监测和态势分析的......
目前,文本自动分类系统的研究已进入较成熟的阶段.但是,网络信息自动分类系统的研究才刚刚起步.它可以借助文本自动分类系统的一些......
影响中文文本自动分类的因素较多,算法也较多,每个处理步骤使用的算法之间互相影响,找到合适的算法组合,是提高其性能的一个重要方......
这篇文章研究的是文本分类中的特征词提取部分的算法中的二元正态分离法的改进。文章分析了原有算法未加入词频统计的概念和因此产......
本文将对数似然比测试用于文本分类中的特征词选择。与传统的频度、集中度和分散度等多种统计指标的测试独立进行的方法相比较,这种......
针对微博短文本有效特征较稀疏且难以提取,从而影响微博文本表示、分类与聚类准确性的问题,提出一种基于统计与语义信息相结合的微......
文本分类一直是数据挖掘领域中的研究重点之一,其目的是为了能将大量的并且无类别标注的文档进行类别上的归类。文本分类还是信息......
随着互联网技术的快速发展以及互联网的普及,网络上的信息数据呈指数幂级增长。在这些海量数据中,类似于Web文本结构化或半结构化的......