基于DNA微阵列数据的密度峰值聚类算法研究与应用

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:hordark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息学领域中,通过对肿瘤样本的DNA微阵列数据进行聚类分析,来划分不同的肿瘤类型或亚型一直是研究的重点。利用DNA微阵列数据在分子层面上对肿瘤进行分析,不仅可以根据同一种肿瘤样本相关致病基因的不同表达区分不同的肿瘤亚型。还可以对未知亚型的部分肿瘤进行亚型的预测以及分类。而由于基因本身的特点以及DNA微阵列技术高成本的原因,DNA微阵列数据集大多呈现出高维度、小样本的特点。2014年在Science上提出的密度峰值聚类算法(Density Peak Clustering,DPC)由于其参数简单,聚类准确率较高的优点受到各个领域的广泛认可,具有很高的研究价值。本文主要针对DNA微阵列数据集的特点,以密度峰值聚类算法的改进为研究方向。并将改进后的算法应用在DNA微阵列数据集上进行肿瘤亚型的聚类研究。主要研究内容有:(1)为了解决DPC算法人为参与关键性参数的选取的问题,本文采用将DPC算法和智能优化算法相结合的方式进行改进。算法将蝙蝠算法(Bat Algorithm,BA)和DPC算法相结合。首先对蝙蝠优化算法搜索后期收敛速度变慢,易陷入局部最优的缺点加以改进。将自适应惯性权重加入到BA的速度更新公式中。然后通过聚类算法的内评价指标作为适应度函数运用改进后BA对DPC算法关键性参数进行合理选取。同时对初始聚类中心点的选取方式加以改进。通过实验对比,来验证方法的有效性。(2)为了改进DPC算法在高维复杂数据集上表现不佳以及非聚类中心点的分配策略过于简单的问题,同时也为在DNA微阵列数据集上的应用打下基础。本文采用将DPC算法和熵加权软子空间聚类算法(Entropy Weighting K-means Algorithm for Subspace Clustering,EWKM)相结合的方式进行改进。算法利用EWKM较强的高维复杂数据处理能力以及非聚类中心点分配策略的合理性,将两种算法的优势相结合,同时避免两种算法的缺陷。利用DPC算法进行初始聚类中心点的选取,同时利用EWKM算法进行后续数据点的分配来对算法加以改进。通过实验对比,来验证方法的有效性。(3)将本文提出的算法应用在肿瘤亚型聚类领域中。首先对DNA微阵列数据集进行预处理,剔除与肿瘤发病无关的基因的影响。然后将本文提出算法应用在DNA微阵列数据集上,通过探究基因的差异表达探究肿瘤不同亚型的聚类。通过实验对比,证明了算法能够通过对不同基因的差异表达的分析精确地对肿瘤亚型进行聚类,在实际应用领域具有重要意义。
其他文献
作为一种恶性疾病,颅内肿瘤威胁着我国居民的身体健康。对其进行早期医学影像诊断,可以最大限度地挽救病人的生命。微波成像系统作为一种新兴的医学成像手段,具有无损伤检测
数字全息术是在光学全息术基础上融合了光电探测技术和计算机技术而形成的一种新型显微成像技术。与传统显微术相比,它仅通过一张全息图就提供了更具优势的非接触、无标记、
随着近年来开关电源逐渐向小型化、高频化、高功率密度的方向发展,基于氮化镓和碳化硅等宽禁带半导体材料的功率开关器件因其导通电阻低、高频性能好等优势得到了越来越多的
Gossip算法是一种分布式网络系统中的重要算法,因此许多基于半分布式网络的区块链项目都采用Gossip算法来进行节点之间的数据同步。虽然Gossip算法具有简单、高效、容错性强
快速病理检测已经成为临床癌症诊断的重要应用点,病理切片的显微观测仍然是癌症病理诊断中准确性较高的检测方式。但普通光强成像通常需要观察经染色处理后的病理切片,才能较
进入21世纪以来,人类探索世界的脚步大大加快,通信环境也愈加复杂多变,网络时代的到来也使得人类之间的联系更加密切,交流更加频繁,信息量的传输也更加庞大。因此通信系统需
党的十九大报告明确提出实施乡村振兴战略的总要求——产业兴旺、生态宜居、乡风文明、治理有效、生活富裕,可见村级治理已经上升到国家战略的高度。与此同时,作为中国农村中
听力语言残疾人没有办法像正常人一样交流沟通,且受教育程度较低,大部分时间无法及时表达自己的诉求,因此,手语识别的应用显得尤其重要。在手语识别实际应用场景中,周围环境
以往在对铁路和道路两旁的监控视频中的异物进行入侵检测时,多以人工主动监测为主,在遇到突发状况时很难做到及时有效的提醒。随着网络系统的发展,如果能开发出针对监控视频
逆变器是新能源分布式发电系统的关键环节,因此提高逆变器的转换效率和功率密度、降低其成本对新能源的发展具有重要意义。电感电流临界连续型逆变器具有效率和功率密度高、成本低、电流响应速度快等优点,受到越来越多的关注和研究。为了进一步提高该类型逆变器的性能,本文从过零点附近的电流畸变和电感电流脉动大等关键问题着手开展系统性研究。正确认识电感电流临界连续型逆变器的工作原理及其特性,是优化逆变器性能的前提。本