论文部分内容阅读
支持向量机是建立在统计学习理论和结构风险最小化原则上的一种新的数据挖掘技术,因为具有完备的理论基础、直观的几何解释和出色的学习性能,支持向量机己成为机器学习界的研究热点,并在很多领域都得到了成功的应用,如传感器故障诊断、网络设备状态识别、入侵检测、癌症诊断等。在无线传感器网络中,支持向量机作为一种新的分类和检测工具得到了越来越广泛地应用,近几年,基于无线传感器网络的分布式支持向量机算法引起了广泛关注。本文主要研究了分布式支持向量机算法,同时,探讨了支持向量机在信息基因提取中的应用。论文共分为五个部分。 首先,介绍了支持向量机的基本模型与几何描述,并对支持向量机算法研究及应用进行了阐述,从而引出本文研究的主要内容。 第二章,介绍了分布式支持向量机模型及其求解算法。 第三章,针对无线传感器网络,提出了基于分簇的分布式支持向量机算法。首先,提出了一种新的基于权值的分簇算法,该算法综合考虑了每个节点的最佳邻居节点度数、传输功率和能量消耗。利用该分簇算法将传感器节点分簇,各个簇头汇集簇成员的壳向量,与邻居簇头相互交流信息来训练分类器,最终得到全局最优分类器。该算法中,簇头不用将数据传递给基站,减少了能量损耗,而且簇头之间交流的信息不是自身的数据,具有隐私保护的优点。最后,进行了数值实验,结果表明了该算法的可行性和有效性,且更适用于大规模的无线传感器网络。 第四章,针对基因表达谱数据维数高、样本少的的特点,提出了一种新的信息基因提取算法。首先,利用巴氏距离与递归特征消除算法结合去除无关基因,然后运用基于相关性的快速过滤器算法得到信息基因,最后以支持向量机作为分类器对数据进行分类识别。本文利用结肠癌数据集进行了实验,结果表明,同现有的方法相比,该算法在提取基因的数量和准确率上都有明显的优势,从而为结肠癌诊断与研究提供了借鉴和参考。 最后,总结了本文的主要工作,并提出了进一步研究的课题。