复杂数据的特征选择与关联分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cracezhangxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对特征选择进行了详细研究,主要集中在特征子集的搜索算法和特征的评价标准上。对于大脑胶质瘤数据集,采用了SVM-BFS算法,该算法采用支持向量机为分类器,浮动搜索为子集搜索算法,Wrapper模型为特征选择评价标准。通过实验,表明该算法有效的解决了中小型数据集的特征选择问题。对于三种氨基酸的多元校正课题,采用了神经网络为分类器,双层遗传算法为特征子集搜索算法,Wrapper模型为特征选择评价标准进行特征选择,实验证明这种特征选择算法有效的解决了数据特征数目较大的特征选择问题。 本文另一个研究重点是复杂数据的关联分析。利用支持向量机在大脑胶质瘤数据集提取出关联规则,得到了分类标准。在另一个实验中,利用模糊规则提取算法找到了实验目标量的三种主要干扰因素;并利用基于拟合参数规则提取算法找到了所需要的每种干扰模型的典型样例。实践证明这是一种从宏观到微观有效的进行数据关联分析的算法组合。
其他文献
DNA高通量测序技术的诞生是分子生物学研究的一次技术性的变革,它的低成本,速度快,通量高等特点使它迅速的替代了传统的测序技术。随着测序技术的不断发展,高通量测序技术不断的
本文首先从医学数据的特点出发,阐述了医学数据挖掘的一般步骤、关键技术和智能化方法.本文主要探讨粗糙集理论在医学数据挖掘中的应用,对粗糙集的基本理论以及基于粗糙集的
第三次工业革命以来,随着机器人控制技术的不断更新和网络通信技术的发展,促使一个新的研究热点的产生。就是将机器人控制技术与网络通信技术有效地结合在一起,在机器人原有控制
文本文档分类研究的比较多。而对于图像文档分类一般是利用OCR技术先将其识别成文本文档,再利用文本文档的分类方法进行分类。  本文主要研究脱离OCR技术的图像文档分类技术
近年来,少数民族文字的计算机信息处理是计算机应用领域的一个重要的研究方向。本文通过对机器翻译技术和Windows系统IME技术的深入研究,针对纳西象形文字的特殊特点,提出了
近年来随着激光等三维数据采样技术以及硬件设备的日益完善和机器人技术以及计算机技术的发展,基于散乱数据的物体三维重建获得了越来越广泛的应用。散乱数据点的三角剖分是
当前的网络管理系统普遍采用管理员,代理的集中式管理方法,但是随着网络规模的不断扩大,这种网络管理模式逐渐成为网络系统发展与扩充的瓶颈。近几年,智能代理技术、分布式计
论文主要工作及内容安排:第一章为绪论介绍了城市动态路径诱导系统的研究意义分析概括了国内外研究发展现状最后对全文作以简单介绍。第二章为路径诱导系统的基础知识为后续
随着仿生学的发展,仿生机器人在许多应用领域异军突起,其中以蛇形机器人最为突出。国内外的专家对机器蛇的研究相对较早,其相关理论和技术相对较完善。其中一些已经应用到了
本文对嵌入式汉语文语转换系统的实现进行了研究。文章重点研究了合成语音的韵律建模方法,采用了机器学习的方法,实现韵律规则的自动生成。基于上述工作,开发了一个语音合成内核