网页文本分类相关论文
网页自动文本分类是处理和组织大规模网络文本信息的关键技术,是使信息资源得以合理有效组织的重要方法,同时也是解决主题搜索、个......
传统的文本分类方法大都采用了基于词频的统计方法来表征文本,基于关键词加权重的向量空间模型(Vector Space Model,VSM)对文本进......
随着现代通信技术的高速发展与Internet的普及,万维网成为了目前最巨大、分布最广泛的信息服务中心,自从2001年以来,目前超过30亿......
随着信息技术的不断发展,因特网上的网页数量日益激增,但是Web页面的复杂程度使得人们很难准确而快速地获取自己所需的信息。为了......
随着计算机和因特网的迅速发展,网上信息的类型越来越丰富,可利用的资源也越来越丰富,这已成为数字图书馆的发展动力。同时网络存......
随着计算机技术和通信技术的飞速发展,互联网己成为了人们生活的不可缺少的组成部分。据国际电联统计,截止至2010年12月,全球互联......
传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维......
随着互联网技术的飞速发展,网络上的网页信息成指数级增长。人们希望对网页进行快速分类,从而有效地获取有价值的信息。网页文本分类......
目前大多数搜索引擎仅仅搜索超链接可以搜索到的静态网页,而许多的重要数据存放在web的后台数据库中,它们需要通过表单查询的方式......