文本自动分类相关论文
信访系统是法院收集群众意见、接受人民诉求的重要途径。传统的法院信访工作多由人工进行,其步骤繁琐导致工作效率极低,以至于大部......
通过试验表明支持向量机比K-最邻近法具有更好的分类能力,而且不同特征选择方法对支持向量机的影响要小于K-最邻近法.通过对支持向......
科技情报工作中涉及海量的文本信息,但其杂乱、无序等特点严重了影响情报工作的效率,传统的人工标引成本高且主观性太强,准确性与效率......
本文提出一种适合数字图书馆特定专业领域小文档(如摘要等)的文本自动分类算法。该方法以同义词集合概念代替词条,建立分层的概念......
文本分类指在给定类别体系下,根据文本内容自动确定文本所属类别.目前流行的分类方法是SVM(Support Vector Machine,支持向量机),......
·电子工程·050101基于时分系统的无线自组织网络同步算法………………………………钟晓峰,王有政,梅顺良,等(01):1050102基于音......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
把人类语言与语音看成动态复杂系统,利用统计物理的理论方法对人类语言与语音进行实证研究和理论分析具有重要意义。它有助于了......
该文就文本自动聚类技术的发展及现状进行了系统的回顾,然后,针对社科领域的文本聚类进行了较为深入的探讨与研究,实现了两个实验......
随着计算机技术的快速发展和Internet的普及与应用,互联网上的电子文档信息急剧增加。面对如此海量的信息,人们迫切需要寻找一条能够......
我们生活在信息爆炸的时代。从海量信息中迅速查找资源需要对信息进行分类,因此文本分类技术应运而生。文本自动分类是基于内容的......
文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处......
自动文本分类是一种重要的文本挖掘工作.特别是对中文文本的自动分类,目前还没有达到一个统一的标准.该文在已有的研究基础上,对中......
本文首先对文本分类的概念、方法、类别及应用等方面进行了一个概括地介绍,然后结合汉语自身的特点较为详细地分析了中文文本自动......
在该课题的研究中,采用了向量空间模型来表示文本信息.我们针对网页结构的特点,详细分析了网页标识中对分类过程有贡献的结构成分,......
随着通信技术和计算机技术、尤其是Internet的飞速发展,各种各样的信息成几何级数增长,作为传统的信息载体,文本信息更是如此.为了......
自动文本分类是一种重要的文本挖掘工作.特别是对中文文本的自动分类,目前还没有达到一个统一的标准.本文在已有的研究基础上,对中......
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势。特别是随着互联网技术......
在现实世界中,人们可获取的大部分信息来自文本数据库(或文档数据库),文本数据库包含大量来自各种数据源(如新闻、研究论文、报告、......
随着信息技术的发展,人们已经从信息缺乏的时代过渡到信息极为丰富的数字化的时代。如何从这些海量信息中迅速有效地获得所需信息也......
本文以主题数字博物馆为基础,对其信息分类系统进行了研究,其目的是为了对主题资源进行有效组织,以及使领域专家和主题爱好者能够......
因特网上的信息日益丰富,已经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资源......
文本分类(Text Categorization,TC)指的是把一个自然语言文本,根据其主题归入到预先定义好的类别中的过程。文本分类是自然语言处......
如何在浩若烟海而又纷繁芜杂的文本信息中获取最有效的信息是信息处理的一大任务。文本自动分类是实现这个任务的重要方法之一。在......
因特网上的信息日益丰富,己经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资......
进入九十年代以来,互联网得到了极大的发展,产生了海量的非结构化和半结构化文本信息。如何对之进行有效的组织和管理,使用户能方便、......
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具。九十年代以来,Internet以惊人的速度发展起来,它容纳了海......
随着Internet技术的迅速发展,Web信息日益膨胀,人们不得不花费大量的时间去搜索自己需要的信息。目前大多数的搜索引擎提供的服务......
身在电子信息量快速增长的社会,如何在海量的信息资源中迅速准确地找到所需信息,是当前信息处理领域的一个重要问题。文本分类的出现......
文本分类可以为文本提供有序的组织,网络信息的增长使文本分类对信息处理的意义变得更加重要。二十世纪八十年代以后,基于机器学习......
文本自动分类是数据挖掘和机器学习中非常重要的研究领域,本文将文本自动分类技术应用于海洋信息处理,主要研究通过机器学习的方法......
在特征项分布不平衡的情况下,传统信息增益算法的分类性能会急剧下降,针对此缺陷提出了一种利用特征项分布信息来改进信息增益公式......
本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测......
随着网络学习资料的日益增多,学习系统必须聚合各种开放学习资源,通过对它们进行语义标注建立语义关联,从而构建有完整知识体系支......
本文提出了基于规则的个人便签短文本分类的方法,将个人便签分为日程、备忘、活动、目标、财务、联系人、收藏、健康等类型。首先将......
针对大批量文本的分类处理要求快速、高准确率的情况,本文提出了一种预处理文本信息方法,然后利用LIBSVM软件环境实现文本自动分......
本文旨在研究如何基于题材和感情,试对唐诗文本进行自动分类,即对现行的通用文本分类算法,做基于唐诗文本的比较实验和参数微调。本文......
伴随着Internet的飞速发展,Web上出现了海量的、异构的、半结构化的、动态的信息资源,并且在这些Web信息中有80%以上的信息是以Web......
文章以和讯博客为研究对象,建设了专门用于中文博客文章分类的分类体系和语料库,并采用支持向量机(SVM)和信息增益(IG)结合的分类......
针对兼类文本分类的问题,本文提出了一个对不带任何类别标记的文本进行准确分类的方法。首先利用SVM的1-a-1兼类文本分类算法为不......
分类问题是机器学习与数据挖掘研究中最重要的问题之一,其中文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得......
介绍文本分类是一个跨信息检索、机器学习和计算语言学的综合研究领域,是信息处理的重要研究方向,指出它在自动标引、信息检索、文......
互联网带来了信息爆炸的时代,Google、Baidu这样的通用搜索引擎取得了很大的成功,但是随着信息的增长,通用搜索引擎的检索结果越来越......
不平衡数据集是指在构成数据集的不同类别的样本中,某一类样本的数目远大于其他类别样本的数目,不平衡数据集广泛存在于现实生活中......
随着Internet在中国的迅速发展,中文信息资源越来越丰富.帮助用户快速、准确地查找网络上有用的中文信息,成为近年来Internet上的......