DNA微阵列基因表达数据挖掘算法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:PYY7896321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文重点研究了DNA微阵列基因表达数据挖掘算法,涉及孤立点检测、特征选取以及聚类、分类算法研究,这些算法应用于DNA微阵列基因表达数据分析均取得了比较好的效果。 在DNA微阵列技术应用于中药研究方面,采用层次聚类方法筛选中药双龙方主要成分作用下的差异表达基因聚类,研究了双龙方主要有效成分对大鼠骨髓基质细胞(Marrow Stromal Cells,MSCs)增殖及分化的影响。 在孤立点检测研究方面,针对两种基于k最近邻居(k-Nearest Neighbor,KNN)图孤立点检测方法:入度统计法(Outlier Detection using Indegree Number,ODIN)和k最近邻居算法的不足,提出了一种改进方法:两阶段孤立点检测方法,并进行了适当扩充使之适用于数据集中孤立点数目未知情况下的孤立点检测。算法应用于DNA微阵列基因表达数据集进行样本孤立点检测取得了很好效果。 在差异表达基因选取和功能基因组分析方面,设计使用遗传算法(Genetic Algorithm,GA)挑选主基因,其中用k最近邻居方法作为模式识别方法,使用支持向量机构建一个分类器进行样本分类。通过实验,在经典的白血病DNA微阵列基因表达数据集上,对于34个样本的测试集,达到了100%的分类准确率。 基于模糊数学理论,构造了综合评价指标并应用于基因表达数据进行差异表达基因的选取,丰富了差异表达基因选取的手段;针对模糊C均值算法(Fuzzy C-Means,FCM)无法保证收敛到全局最优点的弱点,引入了粒子群优化进化算法,以增强其全局搜索能力,形成一个混合算法。将这一算法应用于DNA微阵列基因表达数据功能基因组聚类研究,取得了较好的效果。 将最优正交质心特征选取算法(Orthogonal Centroid Feature Selection,OCFS)成功地应用于DNA微阵列基因表达数据主基因挑选,并与基于信噪比的主基因挑选法和基于遗传算法的主基因挑选法进行了对比研究,证明了该方法的适用性。 在基于模型化聚类、分类研究中,提出采用非参数贝叶斯方法进行基因的自动聚类,然后结合经验贝叶斯方法对样本进行分类研究,取得了比较好的结果。
其他文献
自主/遥控水下机器人是近年来出现的一种新型水下机器人,其自带能源,通过微光缆与水面支持系统相连接,既具有自治水下机器人大范围自主航行的能力,又具有遥控水下机器人定点操作
在过去数十年,由于其广泛应用,例如优化,不动点计算和其他方面,神经网络已经受到相当的关注。众所皆知,时滞现象在神经网络中经常出现,不仅影响传递的速度,还易引起不稳定和震荡。因
PET瓶胚温度控制系统作为饮料瓶吹灌旋一体机的一个重要组成部分,设计的好坏直接决定了吹瓶的质量。饮料吹灌旋一体机是集吹瓶、灌装和旋盖于一体的饮料瓶生产机组设备,相对
本文主要研究了几何主动轮廓模型,和多特征集协作学习在图像分割中的应用。工作主要从以下几个方面进行:从定制矢量流的角度,讨论了集成多线索的信息到矢量场中,以用于驱动GAC模
传统的随机系统控制主要是控制随机系统输出的均值和方差等统计特性。近几年来,随机系统控制出现一个新的分支,即随机分布控制。这类系统的主要特点是其输出为系统变量的概率密
在复杂网络的研究中,当前不同领域的学者关注的热点是揭示节点数众多、连接结构复杂的实际网络的整体特性,特别是网络拓扑结构与网络动力学行为之间的关系、结构与功能的形成机
声学模型,是语音识别领域的核心研究方向之一。段模型放宽了隐马尔科夫模型(Hidden Markov Model,HMM)模型在给定状态时语音观测矢量相互独立的假设,获得更精确的声学模型。然而
光刻用准分子激光光源的激励技术有两大特点:其一,高重复率(2kHz至6kHz);其二,高压放电开关不采用闸流管(放电次数有限)。脉冲充电技术可与磁脉冲压缩开关结合起来达到快放电的目
基于内容的图像检索是计算视觉领域一个非常重要而且经典的研究方向,同时,相关的技术在工业界也有非常广泛的应用。近些年来,随着深度学习的兴起,由于卷积神经网络对图像特征很好
随着老龄化社会的到来,人们对家庭服务机器人的需求越来越大。人们期待家庭服务机器人可以通过人机自然语言交互的方式,实现自主导航并提供取送物品等服务。为了实现上述目标,服