文本分类算法相关论文
本文在研究了多种文本分类算法基础上,提出了一种新颖的基于奖励机制的文本分类算法SAM.这种算法借鉴了基于语义知识的概念层次网......
随着Internet的迅速发展,以Web形式呈现的电子文本的数据量成几何速度增长。如何高效的组织和管理这些数据,并全面、准确、快速地推......
本文研究内容基于国家自然科学基金项目“项目管理中项目关联分析与立项决策支持系统研究”,项目的相关性分析依据项目建议书的研究......
由于半结构数据具有结构复杂、不规范和易变等特点,研究人员普遍采用灵活的图或树形结构来设计半结构数据模型。在数据模型的基础上......
2008年以来,云计算在IT业被广泛关注。云计算被看作是分布式处理、并行处理以及网格计算发展的产物,其中云计算的关键是并发、分布......
作为信息时代的重要标志之一,Internet上的万千信息,给人们的工作、学习、生活带来了极大便利。但在信息的海洋中,还夹杂着一些不良内......
随着计算机技术、数据库技术、网络技术的飞速发展和Internet的日益普及,在现实生活中,每一个领域都不断产生海量数据和信息,特别是海......
随着互联网技术的不断发展,INTERNET上的信息日益丰富,已经成为人们日常工作和生活中获取信息的重要来源。但是,由于INTERNET所固有的......
中文Web文档的自动分类主要还是以文本分类的算法思想为基础来进行的。但由于中文Web文档的数量巨大,内容多样,噪音繁多,很多比较......
随着互联网的高速发展,通用爬虫在浩瀚如海的网络世界里,对高效提取有效网页信息显得越来越力不从心。而主题爬虫是解决通用搜索引......
目前大量有用信息以文本形式存在,因此如何快速对大规模的文本分类成为亟待解决的问题。为应对这一问题,文本自动分类应用而生。文......
信息技术的飞速发展和互联网的广泛普及使得人们越来越容易地得到信息。然而,互联网的信息往往是包括各个行业的文本数据,为了高效地......
以网络为重要组成部分的计算机应用走到了一个空前繁荣的时代,各种新的应用环境、应用需求纷纷出现,在一些如搜索引擎、社交网络等大......
近年来,互联网技术迅猛发展,已经应用在我们日常生活中的各个领域。互联网技术也大量应用在农业领域,农业信息化开始出现在人们的......
博客飞速发展,博客文本检索和分类的研究价值日渐凸显。博客文本的内容、风格缺乏规范性,为自动文本分类带来难度。博客作者通常为文......
本文旨在研究如何基于题材和感情,试对唐诗文本进行自动分类,即对现行的通用文本分类算法,做基于唐诗文本的比较实验和参数微调。本文......
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分......
提出了基于粒子群优化技术的SVM文本分类算法,即PSOSVM算法.SVM文本分类的核心是一个有约束的高维优化问题.该算法的基本思想就是......
本文中,我们用CO特征定义来表述单词间的相互依存关系,并给出了基于 CO特征定义的文档表示法,特征筛选算法和朴素贝叶斯文本分类算法......
本文提出了基于规则权重调整的关联规则文本分类算法(WARC),该算法利用分类关联规则对训练样本进行分类测试,根据误分类训练样本的......
随着互联网应用、电子商务、网络通信的高速发展,其上流动的信息成几何倍数的增长,对我们的生活产生了越来越重要的影响。几乎所有我......
随着互联网技术的飞速发展,网上的资源呈指数增长,人工处理这些海量信息代价非常高昂,因此如何高效地组织和管理这些资源成为近些......
随着计算机和互联网技术的迅猛发展,网络已经成为人们获取信息的不可或缺的重要来源。自互联网进入Web2.0时代以来,网民越来越习惯......
在以新浪微博近九万条微博作为语料库的为背景的算例下进行实验,结果表明在召回率相近的情况下,该算法在话题推送时比CPAR和SVM算法,......
基于最大熵模型的文本分类算法对不同测试文档的训练结果相差较大.利用Boosting机制改进基于最大熵模型的分类算法,以提高该分类算法......
针对基于内容的文本分类问题,提出了一种Agent与朴素贝叶斯分类(Naive Bayes)相融合的反馈分类模型和算法(Agent-NB).朴素贝叶斯分类是......
文本分类常采用的算法一般是基于向量比较的分类技术。文本中关键字较多,形成的特征向量维数相当高,因而会导致分类比较处理的运算量......
近年来,智能手机和基于Android操作系统的其他移动设备从简单的通讯工具变成信息处理和服务的综合平台。随着高科技犯罪案件和民事......
<正>在基层警务的日常情报分析中,除了结构化的数据库数据外,还有大量的案件叙述性文本描述数据,如案件卷宗、审讯笔录/口供、简要......
...
随着互联网的迅速发展,越来越多的信息资源以网络为媒介呈现在人们面前,而通过搜索引擎获取生活、生产所需的信息资料也开始成为人们......
本文着重对SVM和KNN分类法进行分析,并结合实际的文档集测试了SVM和KNN分类法的性能,给出了实验数据。......