特征词权重相关论文
互联网技术的进步,新闻媒体开始使用网络技术来提供实时的、丰富的、专业的新闻资讯,网络新闻资讯逐渐成为人们了解社会时事、国际......
学位
从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准......
信息检索的核心工作包括文档的分类和排序等操作,如何对文档中的特征词权重进行有效度量是其中的一项关键技术。利用词的共现等关系......
朴素贝叶斯分类器理论基础好,分类精度高.利用特征词权重函数修改朴素贝叶斯分类器,进而利用它实现专利文本的自动分类,不仅减少了......
朴素贝叶斯(NB)算法应用于文本分类时具有简单性和高效性,但算法中属性独立性与重要性一致的假设,使其在精确度方面存在瓶颈.针对......
针对互联网多媒体视频数量的爆炸式增长导致快速获取视频的内容变得非常困难问题,提出了一种基于多特征的关键词提取算法TFL-WS算......
在自动文本分类中,TF-IDF算法是最为常用的特征权重计算方法。该算法运用广泛,但是存在不足:只考虑了特征词的频率和包含特征词的......
随着互联网的飞速发展,网络媒体已经成为人们获取信息的重要来源,网络舆情信息的导向作用越来越大,同时,网络舆情已经成为社会情报的一......
文本自动分类是在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。向量空间模型(VSM)是进行大规模文本处理的最通......
随着文本数据量变得很大且仍在迅猛增加, 自动文本分类变得越来越重要.为了提高分类准确率, 作为文本特征的词的权重计算方法是文......