基于软计算的文本分类系统

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:dsfddsffd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随 INTERNET 网的普及,人们进入了一个信息爆炸的时代,如何从这些海量信息里快速、准确得到自己需要的信息,成了一个迫切需要解决的问题。文本分类是解决该问题的一个关键所在。本文的主要目标,就是结合软计算方法改进现有的文本分类方法。 文章共分五个部分。在绪论中介绍了文本分类问题的研究背景及意义、介绍了现有的文本分类系统的特点、国内外在文本分类问题上的研究现状和不足之处、文本分类系统的应用价值、并创新性的提出用软计算方法对文本分类问题进行优化研究。第二章主要介绍了文本分类的概念、目前常用的文本分类方法:比如简单向量距离算法、朴素贝叶斯、神经网络算法,K近邻(k Nearest Neighbors,简称:KNN)和支持向量机(Support Vector Machine,简称SVM)等进行了介绍和分析,为后续章节的研究提供了理论和实验基础。第三章对软计算方法进行介绍、深入探讨了针对文本分类系统具有复杂性、非线性、不确定性的特征、结合人工神经网络自学习自适应处理能力、模糊系统的专家处理、遗传算法的优化计算等特点。第四章是基于软计算方法改进的文本分类算法设计,算法思路为:用传统文本分类方法提取特征项,用神经网络根据特征项形成规则,再用遗传算法对规则进行筛减,得到基于软计算的文本分类系统。第五章是本文实证部分,结合具体数据验证该方法,证实其良好的分类性能,并对本文研究的不足以及有待进一步研究的问题进行说明。 本文在研究传统分类算法和遗传算法、人工神经网络的基础上,提出一种文本分类的改进算法,称为FNN-GA-KNN/SVM算法,并用MATLAB语言实现核心算法,C++语言实现成文本分类系统。该系统经实例分类讨论后,证明较原算法而言,有更高的分类准确率,且正确率都达到了85%以上,有较强的使用价值。
其他文献
近些年来,我国十分重视高铁事业的发展,我国的高铁交通网也逐步得以完善.但随之而来的就是动车检修工作任务逐步加重,在检修团队人员数量有限的情况下,检修工作压力逐渐增加.
重庆解放前夕,被关押在白公馆中的革命志士们,在生命的最后关头.共同讨论形成了一份关于地下斗争形势和经验的报告,其中第七部分是关于加强党的建设的八条意见。后来,这份报
发生在山西临汾、运城等地的“黑砖窑事件”,无疑是2007年最让国人震惊的黑色新闻。黑砖窑背后的奴工现象并不是2007年才出现的,山西省公安厅副厅长李富林在事件发生后的新闻发布会上承认,山西境内的黑砖窑非法用工问题,在上个世纪90年代即已存在。媒体对于此现象的报道最早可以追溯到1997年的《华西都市报》,近10年来,类似的事件不断地在各地报纸上零星出现,但都没有引起更大的波澜。  2007年。以山西
现如今,燃气被广泛应用在人们日常生活中,城市燃气建设工程随之增多.城市燃气企业是天然气利用环节中连接天然气长输管线与下游居民用户的重要一环,在连接地区发展和提高资源
新媒体是利用数字技术、网络技术、移动技术,通过互联网、无线通信网、有线网络以及电脑、手机、数字电视等终端,向用户提供信息和娱乐等内容的传播形态和媒体形态.充分运用
医院药房药品种类多、数量多,药师在日常工作中难免出现差错,这给药房药品的调剂带来了一定程度的压力,所以需要强化预防措施减少药房药品差错发生率.本文通过分析药品差错的
任何课程改革都是在一定的文化境遇中进行的,体育课程改革也是如此.体育课程改革必然要求体育课程与文化环境之间保持适当的张力,但当二者的张力过大时,就会造成体育课程改革
近年来,互联网发展迅速,应用规模迅速扩大,互联网的应用经历了从量变到质变的过程。作为互联网的基础应用,搜索引擎和网络新闻的使用率迅速增长。搜索引擎的使用改变了网民信息搜
我国艺术设计教育处于迅猛发展的时期,在其发展过程中面临着很多现实问题。如何更好地学习和弘扬人文精神,创造出既有鲜明个性,又具有国际地位的中国当代设计,是当前艺术设计
随着现代经济社会的发展,对于乡村发展也提出了新的要求和挑战.作为一项核心工作内容,经济振兴在整个乡村工作体系中占据着十分重要的地位.作为领导和具体实践工作人员,要积