基于神经网络的数据挖掘分类算法比较和分析研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:suanqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们生产数据和采集数据的能力愈来愈高,但是,我们在数据分析和知识获取方面,能力还相对滞后。因此,从收集数据、创建数据库,管理数据,到数据分析,数据挖掘技术渐渐产生和发展。数据挖掘(Data Mining, DM)是一门跨学科的课题,涉及许多领域,包括统计学(Statistics)、数据库(Database)、机器学习(Machine Learning)和人工智能(Artificial Intelligence)等。数据挖掘,也被称为数据库中的知识发现,是从“海洋般”的大量数据中获取新颖的、有用的、有效的、可理解的模式的非平凡过程,也就是从大量数据里提取知识。分类(Classification)问题是数据挖掘技术中非常重要的研究课题,利用分类技术,可以从数据集中提取出描述数据类相同的模型或函数,并且能够顺利把数据集中每一个未知类别的数据划归到某个已知的类别中去。目前,常用的数据挖掘分类算法主要有:统计分类法、决策树、人工神经网络方法等。不同的算法会产生不同的分类器,而不同的分类器又会影响数据挖掘的准确率和数据挖掘的效率。因此,当面对数据量庞大的分类问题时,选择适当的分类算法是非常有必要的。人工神经网络(Artificial Neural Network, ANN)是数据挖掘常用的方法之一,该方法通过模拟人脑生物神经网络,将若干个具有处理功能的神经元(neurone)节点,按照一定的网络结构连接起来,使它能够处理不精确数据、模糊数据或者复杂的非线性映射问题。人工神经网络能够识别的模式是由网络的连接权值、拓扑结构及神经元阈值决定的。通过优化人工神经网络的拓扑结构及网络的权值、阈值,可以达到优化人工神经网络模型的目的。本文针对实际应用中的分类问题,详细介绍了三种人工神经网络算法的网络结构和算法描述,以及三种算法的优缺点,重点阐述了极限学习机的理论基础。将极限学习机算法应用于六个真实的数据集中,实现分类应用试验,并对实验结果与支持向量机和BP算法实验结果进行比较分析。通过实验结果发现,极限学习机在分类时间和准确率等反面,均具有明显的优势。
其他文献
本文重点探讨了礼貌原则下的信件英汉翻译,其中的译例来自于笔者翻译的金陵大学史料中的部分信件。为了顺利与人进行交往,讲礼貌是必不可少的。礼貌是一种普遍的现象,因此中
职业生涯管理是组织关键性的人力资源管理,是帮助个人制定职业生涯规划并获得职业生涯成功的有效手段。职业生涯管理理论内容经过四五十年研究,随着社会实践的普及和研究的深
我国原创文学网站经过十余年的产业化发展,商业化程度很高。原创文学网站作为特殊的文化企业,早已形成稳定的营销模式。作为一个高度社会化的传播平台,微博引发了互联网的营
中国与老挝同属社会主义国家,推进同路的社会主义市场经济改革,而中国有着近三十多年的经济改革开放经验,尤其是国有企业改革方面。本文以老挝国有管理问题为主进行研究,并借鉴中
现今工程建设的发展与我国经济及城市化进程的加快息息相关,人们对建筑物的设计、规模以及难度方面也提出了越来越高的要求。由于主观或客观层次的原因,变形会出现在工程建筑物
节约资源和保护环境是我国的一项基本国策。党的十八大报告强调必须把生态文明放在突出地位,提出了努力建设美丽中国,实现中华民族永续发展的任务。建设美丽中国需要“绿色”大
北美冬青(Ilex verticillata (L.) A. Gray)是冬青科(Aquifoliaceae)冬青属(Ilex)的多年生落叶灌木,雌雄异株,复聚散花序,花白色,雄花几十朵聚生叶腋,雌花3-6朵聚生叶腋,核果
马王堆刺绣纹样是中国传统装饰纹样之一,出土的刺绣残片虽已埋藏地下几千年,但出土时仍然精致美妙、无与伦比,纹样、配色、针工运用得恰到好处。本文以乘云绣、信期绣、长寿
伴随着改革开放的逐渐深入,我国市场经济取得了显著的进步与发展,支撑市场经济有序发展的主要力量就是实体企业,政府与大众的眼光,多关注了企业的经济功能,并且认为企业的最终甚至
我国的建筑文化历史悠久,经过几千年的发展已经积累成了一笔宝贵的财富。邢台地区位于河北省南部,有着三千多年的历史,邢台地区现存的传统民居建筑多建立于清末民初,保存状况相对