一种基于主集分割的基因芯片聚类算法

来源 :软件学报 | 被引量 : 0次 | 上传用户：yangjia14

【摘要】

：

聚类算法广泛应用于生物芯片数据分析中,用于寻找表达相似的基因或样本.大多数已有算法都需要人为地给出一些参数,然而在没有先验知识的情况下,人为地确定这些参数是十分困难

【作者】

：

滕莉付旭平李宏宇李瑶陈文斌李荣宇沈一帆

【机构】

：

复旦大学计算机科学与工程系,复旦大学生命科学学院遗传研究所,复旦大学计算机科学与工程系,复旦大学生命科学学院遗传研究所,复旦大学数学系,上海博星基因芯片有限责任公司,复旦大学计算机科学与工程系上海2

【出处】

：

软件学报

【发表日期】

：

2005年09期

【关键词】

：

基因芯片主集聚类相关表达排序

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

聚类算法广泛应用于生物芯片数据分析中,用于寻找表达相似的基因或样本.大多数已有算法都需要人为地给出一些参数,然而在没有先验知识的情况下,人为地确定这些参数是十分困难的.为了解决这一难题,提出了一种迭代的聚类算法.首先用主集方法对原有基因进行重新排序,使高度相似的基因排列在特定区域.类的分割界线通常难于确定.提出一种标准,根据类内元素间的距离远小于类外元素间的距离的性质,从排序后的数据集中划分出一个类.将找到的类从当前数据集中排除以后,对剩下的数据重复以上处理,直到满足所提出的循环停止条件为止.从多方面分析了该算法的性能,并将该算法应用于酵母细胞周期的芯片表达谱数据聚类.理论分析和应用结果都表明,该算法是实用、有效的,并且有很好的抗噪性能. Clustering algorithms are widely used in biochip data analysis to find genes or samples with similar expression.Most existing algorithms need to give some parameters artificially, however, they are artificially identified without prior knowledge Parameter is very difficult.To solve this problem, an iterative clustering algorithm is proposed.First, the main set method is used to rearrange the original genes so that the highly similar genes are arranged in a specific area.The segmentation boundary is usually It is difficult to determine.A standard is proposed to classify a class from the sorted data set according to the properties that the distance between elements in the class is much smaller than the distance between the elements in the class.When the found class is excluded from the current data set, The above data are repeated until the proposed cycle stop condition is satisfied, the performance of the algorithm is analyzed in many aspects, and the algorithm is applied to the clustering of the chip expression profile data of yeast cell cycle. Both the theoretical analysis and the application result Show that the algorithm is practical and effective, and has good anti-noise performance.

其他文献

国画

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

ACTIVATION ENERGY OF DESORPTION OF DIBENZOFURAN ON ACTIVATED CARBONS

本文通过对荣华二采区10

期刊

TPDDibenzofuranDesorption activation energy

黄勇书法作品欣赏

作品简介:“似兰斯馨,如松之盛”源自南朝梁(502年-549年)周兴嗣所作的《千字文》,大意是让自己的德行像兰草那样的清香,像松柏那样的茂盛。书者行笔过程注重中锋的运用,线条

期刊

黄勇周兴嗣字体大小书法作品首尾呼应《千字文》南朝梁作品简介古朴典雅

花生单粒精播高产高效栽培技术

我国传统的花生种植方式是每穴播2粒种子,每亩播8500~10000穴,亩用种量(荚果)大花生23~25kg,小花生18~20kg,每年用种量约占花生总产的8%~10%,不仅用种量大、成本高,而且在高

期刊

花生生产单粒精播群体质量主推技术增产潜力栽培技术种植方式麦套花生土壤耕作层

孤独的版画——论版画在目前环境中孤独的原因

在中国,因为版画自己制作的独特性,并不像其他的画种很“明显”的去创作,所以不被大多数人所认识。而,版画有其独特“印刷”的效果,所以在市场中的价位不如别的画种高,在历史

期刊

黑白木刻一发不可收潜力股铜版印刷释迦牟尼佛一脸茫然波罗密辽代国外留学专业类

双雷电也有高性价比

期刊

颓败而又神秘的帝国——《北京的陷落》和《勒内·莱斯》中的中国

皮埃尔·绿蒂和维克多·谢阁兰这两位法国作家和中国都有着深厚的渊源联系。绿蒂将中国纳入到了他异国情调之中，在没落帝国中找寻异域之美。谢阁兰更是因为中国而闻名，他的诸多

学位

法国小说皮埃尔·绿蒂维克多·谢阁兰中国形象异域风情

深度体验

期刊

磁悬浮列车PLC监测系统的通讯技术研究

文章介绍了磁悬浮列车监测系统的一种方案设计。它采用 SIEMENS的 PL C采集列车信号并通过组成的网络将数据传到首车和尾车 ,并在车载计算机上显示。文章主要给出了 PL C网络

期刊

工作娱乐两相宜

期刊

一种基于主集分割的基因芯片聚类算法

与本文相关的学术论文