连续属性离散化和LMS算法相关研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:baozhuangpms
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续属性离散化是数据挖掘和机器学习研究及应用中的一个重要方面。在很多规则提取、特征分类算法中,连续(实值)属性必须进行离散化。连续属性离散化就是在特定的连续属性的值域范围内选取若干个离散划分点,将属性的值域划分为一些离散的区间,最后用不同的符号或整数值代表落在每个子区间中的属性值。连续属性离散化的过程,从实质上来说,就是用特定的阈值来对连续的属性空间进行划分的过程。离散化算法的关键在于如何获得最优划分,最大程度地保持信息表示的意义,减少信息损失。1982年波兰科学家Pawlak提出了粗糙集[1 ] (Rough Set)理论,该理论通常被用来处理不确定知识,在数据分析、数据挖掘等领域得到了普遍地应用,传统粗糙集理论只能对数据库中离散的属性进行处理,倘若某些条件属性或决策属性的值域为连续值,在处理前必须经过离散化。本文从粗糙集的观点出发,在保证条件属性和决策属性相对关系不变下,提出了一种新的区间分割的方法连续属性离散化算法实验结果与理论证明了算法的实效性。近年来由于人工神经网络(ANN)独特的信息处理和计算能力,人们对它给予了更多的关注。人工神经网络是一种解决实际工程问题的有效工具,由于隐藏单元已经引入了人工神经网络,所以它已经具有了更强的分类和记忆能力。本文通过对BP模型构建输入向量之间的非线性关系,偏差和学习步骤,提出了一个新的基于神经网络控制的变步长LMS算法。该算法采用一种新的自适应步长控制技术,在新算法中,其学习的步骤是通过BP神经网络控制,可用于具有自适应滤波应用的理想的功能得以明显体现出来。仿真实验表明BP-LMS算法确实可以有效减少收敛时间并达到满意的效果。本文从以下4个内容方面展开工作:1>介绍了离散化研究的背景、粗糙集理论、神经网络理论以及本文的组织结构。2>介绍连续属性离散化的过程,并对离散化算法的研究现状进行了综合探讨。3>提出了一种基于粗糙集理论的连续属性离散化新算法,通过C4.5和支持向量机分别对离散化后的数据进行识别与分类预测。理论与实验结果证明了算法的有效性。4>介绍了BP神经网络,其具有良好的非线性处理能力。神经网络学习到的信息是蕴涵在大量的连接权中,不容易被理解。本文在神经网络上提出了一个新的基于神经网络控制的变步长LMS算法。并进行了相关的仿真实验。
其他文献
智能交通(Intelligent Traffic,IT)作为快速发展的城市交通现代化管理的重要手段,受到极大关注,同时它也与互联网一道成为未来现代化城市交通的发展方向。作为智能交通系统的
软件过程管理的目的是最大限度地提高软件产品的质量和软件开发的生产率。由于软件开发过程是一个非常复杂并且难以量化、估算的过程,因此非常强调对过程的建模,力求通过对软
电视节目的高清化进一步加剧了视频点播的网络带宽和服务器性能压力,导致IPTV和IP-QAM等在线视频点播的并发服务用户数成倍降低。特别是因为IP网缺乏有效Qos能力使其承载的IPT
随着计算机和网络技术的发展,可用的信息数量在不断增长。为了能够快速准确地获取信息,研究者们开发了很多有效的算法。这些算法主要针对结构化的数据,而事实上可获取的大部分信
近年来,光网络正逐渐向全光透明的构架演进。而在透明光网络中,由于没有传统网络中的电再生器,使得网络中的非理想光器件和设备引入的物理损伤沿着光路不断积累,造成信号的失
目前,视频点播系统(VoD)已经成为在网络上最主流的应用之一。建立在P2P网络基础上的VoD,结合了P2P网络的自动负载均衡,容错性高的优点成为VoD技术的新趋势。本文针对中心化和
图像分割是图像处理的一个重要工具,一个有效的、前端的、复杂的算法。它能够简化对图像的后续处理,并在视频和计算机视觉方面都有应用,如目标定位或识别、数据压缩、跟踪、
随着互联网和经济的快速发展,在互联网中存在越来越多不同类型的股票信息,这些股票信息具有高维度、信息量大、易变等特点,并经常给一般用户带来困惑。因此,用户需要好的信息
近几年来移动通讯设备普及率越来越高,计算能力与通讯能力越来越强,移动通讯网络的服务也越来越完善。通过移动通讯网络来从事工作、娱乐和消费对未来的用户来说将不再只是梦
随着信息产业的发展和三网融合进程的加快,IPTV(交互式网络电视)逐渐成为将互联网、多媒体、通信融为一体的热门技术。同时,随着网络规模的不断扩大,现有的IPv4网络所固有的