文本自动分类相关论文
信访系统是法院收集群众意见、接受人民诉求的重要途径。传统的法院信访工作多由人工进行,其步骤繁琐导致工作效率极低,以至于大部......
该文就文本自动聚类技术的发展及现状进行了系统的回顾,然后,针对社科领域的文本聚类进行了较为深入的探讨与研究,实现了两个实验......
随着计算机技术的快速发展和Internet的普及与应用,互联网上的电子文档信息急剧增加。面对如此海量的信息,人们迫切需要寻找一条能够......
我们生活在信息爆炸的时代。从海量信息中迅速查找资源需要对信息进行分类,因此文本分类技术应运而生。文本自动分类是基于内容的......
文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处......
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势。特别是随着互联网技术......
在现实世界中,人们可获取的大部分信息来自文本数据库(或文档数据库),文本数据库包含大量来自各种数据源(如新闻、研究论文、报告、......
随着信息技术的发展,人们已经从信息缺乏的时代过渡到信息极为丰富的数字化的时代。如何从这些海量信息中迅速有效地获得所需信息也......
本文以主题数字博物馆为基础,对其信息分类系统进行了研究,其目的是为了对主题资源进行有效组织,以及使领域专家和主题爱好者能够......
因特网上的信息日益丰富,已经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资源......
文本分类(Text Categorization,TC)指的是把一个自然语言文本,根据其主题归入到预先定义好的类别中的过程。文本分类是自然语言处......
如何在浩若烟海而又纷繁芜杂的文本信息中获取最有效的信息是信息处理的一大任务。文本自动分类是实现这个任务的重要方法之一。在......
因特网上的信息日益丰富,己经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资......
进入九十年代以来,互联网得到了极大的发展,产生了海量的非结构化和半结构化文本信息。如何对之进行有效的组织和管理,使用户能方便、......
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具。九十年代以来,Internet以惊人的速度发展起来,它容纳了海......
随着Internet技术的迅速发展,Web信息日益膨胀,人们不得不花费大量的时间去搜索自己需要的信息。目前大多数的搜索引擎提供的服务......
身在电子信息量快速增长的社会,如何在海量的信息资源中迅速准确地找到所需信息,是当前信息处理领域的一个重要问题。文本分类的出现......
文本分类可以为文本提供有序的组织,网络信息的增长使文本分类对信息处理的意义变得更加重要。二十世纪八十年代以后,基于机器学习......
文本自动分类是数据挖掘和机器学习中非常重要的研究领域,本文将文本自动分类技术应用于海洋信息处理,主要研究通过机器学习的方法......
伴随着Internet的飞速发展,Web上出现了海量的、异构的、半结构化的、动态的信息资源,并且在这些Web信息中有80%以上的信息是以Web......
本文分析了文本自动分类的关键理论及技术,给出一个基于向量空间模型的文本自动分类系统的框架模型,重点描述此系统的实现算法。......
分类问题是机器学习与数据挖掘研究中最重要的问题之一,其中文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得......
研究基于语义网的文本分类问题,结果表明,SOM神经网络的文本分类可以在降低时间和窄间复杂度的基础上,提高分类准确度,从而为文本......
提出基于粗糙集理论的动态类别扩展算法,可以根据新文献与已有训练规则的匹配程度,有效地进行新类别的自动扩展和新分类规则的自动......
针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引......
为了提高文本自动分类准确率,提出一种改进的蜂群优化神经网络的选择特征的文本数据挖掘算法。该算法将文本特征选择转换成一个多......
支持向量机(SVM)是基于统计学习理论的一种新的模式识别技术.介绍了文本自动分类技术的主要研究概况,并进一步从支持向量机的原理......
信息检索的一个核心问题是自动文本分类。基于分类体系的文本分类需要全文抽取主题词、计算权重,再根据分类体系对文献进行分类。文......
对于接收到的邮件,基于向量空间模型的邮件过滤系统能够将其转换为向量表示,通过计算向量的相似度对其分类并做相应处理.......
目前大多数文本自动分类系统都采用向量空间模型(VSM)来表示文档.针对常规的VSM文档表示方法不能反映概念的问题,文章对VSM进行了......
支持向量机(SVM)算法可用来确定非线性可分文本的待分类文本类别。支持向量机的原始问题可以归纳为一个二次规划问题。当规模较大时,......
用词上下文向量来表达文本集内一个词语与其他词语之问的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量......
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分......
随着互联网的普及和发展,网络上的信息资源越来越丰富,它需要高效智能的工具来完成信息资源的采集.介绍了智能化网页收集工具系统......
随着互联网的普及和发展,网络上的信息资源越来越丰富,如何高效、准确地获得包含用户所需的信息的网页资源,日益成为需要迫切解决......
研究了在文本分类中,各种特征提取方法对分类效果的影响.比较了特征提取方法交叉熵(CE)、信息增益(IG)、互信息(MI)、及X^2对文本分类器性......
文本自动分类是搜索引擎研究领域的一个新热点。立足于实验性的小型搜索引擎,整合免费资源和多种开源工具,快速构建一个可供学校实验......
KNN方法是性能最好的文本分类方法之一,但它在分类时要计算待分类文档与所有训练样本的相似度,时间复杂度较大。文中提出了一种基......
本研究采用了三种数据挖掘方法,对大学英语六级(以下简称“六级”)、雅思、托福阅读文本进行对比。运用Coh-Metrix对所收集的340篇......
SVM是一种基于统计学习理论的新型机器学习方法,在文本分类领域能够取得很好的效果。对科研项目实施过程中生成的文本进行准确分类......
本论文依托于国家高技术研究发展计划863项目重大专项课题“‘缩小数字鸿沟——西部行动’第一批课题(课题编号:2003AA1Z2530)——......
KNN最邻近算法是文本自动分类中最基本且常用的算法,该算法中需要计算文本之间的相似度。以Jens-en-Shannon散度为例,在推导和说明......
随着互联网及其信息服务的快速增长,对于网络信息资源的获取越来越重要,而面向Web的文本挖掘技术的发展及应用对于解决这一问题将......
文本自动分类是数据挖掘和信息检索的核心技术,也是研究热点。在实际的应用中,时常会出现文本数据量很大,但是对人们有用的信息仅......
在广泛研究现有文本自动分类方法的基础上.发现人工神经网络具有很强的自学习性、自组织性、联想记忆功能和推理意识等,在文本自动分......
Internet上信息量巨大、信息种类繁多,信息检索具有盲目性及检索结果中冗余信息多。为了使用户能够更加有效的获得自己所需要的信......
文本自动分类是目前最常用的文本信息自动处理技术,也是机器学习、自然语言处理和信息检索瓴域的研究热点之一。本文比较全面、深入......