基因微阵列数据的分析算法

来源 :苏州大学 | 被引量 : 0次 | 上传用户:dianquan999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因微阵列(又称基因芯片)可应用对于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究、疾病诊断、新药开发、食品卫生监督等领域带来一场革命。与此同时,由基因微阵列技术带来的海量数据也对传统的信息处理技术带来了很大的挑战。鉴于此,本文对基因微阵列的预处理和聚类算法进行了研究。本文的主要贡献如下:   首先,提出了一种改进的稳健Lowess算法,对基因微阵列的数掘进行标准化处理。该算法首先利用局部加权线性回归对数据点进行平滑估计,然后再利用核估计算法对误差项进行估计,以进一步减小误差,最后对每个格子里的数据点进行缩放处理。实验证明了本文算法的高效性。   其次,本文提出了一种新的基因表达矩阵的缺失值估计算法。该算法首先利用迭代的K-means算法来挑选无缺失基因,再用James-Stein估计算法并结合核估计算法得出最后的估计值。实验证明该算法在低缺失率的时候优于其它传统估计算法。   再次,本文对模糊谱双向聚类算法进行了改进。虽然模糊谱双向聚类算法能够取得不错的效果,但是由于其使用的FCM算法对数据类型的敏感性及其局部搜索能力,限制了它的使用,因此本文应用GG算法和遗传算法来改进原算法的局限性。实验证明本文改进算法的优越性。   最后,本文提出了一种基于基因和条件提取的双向聚类算法。该算法利用央角余弦法排除那些对聚类结果贡献小的表达数据,使得聚类只在提取的基因和条件中进行,从而降低了计算复杂度。实验证明本文算法优于其它算法。
其他文献
图像配准指的是对描述同一对象或场景的两幅或多幅图像进行匹配、变换的过程。这些图像可能是在不同时间、不同视角拍摄的,也可能是由不同传感器所采集的。对于图像融合、变化
自从1996年6月美国联邦通信委员会颁布了E-911定位需求,移动台定位技术受到高度重视和深入研究。早期的定位算法均为直达波算法,在直达波环境下其性能能够满足定位精度需求。然
超宽带(UWB,Ultra Wide Band)主要有DS-CDMA(Direct Sequence-CodeDivision Multiple Access)和MB-OFDM(Multi-Band Orthogonal FrequencyDivision Multiplexing)两大技术标准
在许多应用场合,人们总是需要一些高质量的图像,但由于受到诸多因素的限制,如:成像系统、外界环境、成像技术等,使得获得图像的实际效果并不理想,这与人们的需求是矛盾的。考虑到硬
智能家居、智能流量计、智能电网、阶梯电价是目前十分热门的社会话题。在国家全面推动阶梯电价的背景下,智能电网中的用户会主动根据电价及自身用电需求,制定自己个性化的生产
为了满足无线数据业务日益增长的需求,下一代5G移动通信系统必须采用更高的频谱带宽,毫米波以其丰富的频谱资源作为5G重要的候选频段。同时,大规模天线阵作为5G的关键技术,具有更
点模式匹配的目的是从两个相关点集中找出对应的匹配点,其研究成果可以广泛地应用于计算机视觉、计算生物和化学等众多领域。由于待匹配点集间常常存在着较大的差异,增加了点
随着通信技术的不断发展、用户需求的不断增加,无线通信系统能耗不断上升,绿色无线通信成为重要的研究课题。基于此,本文研究中继网络架构下的能效优先的中继部署问题。在确保用
3G通信业务的蓬勃发展,要求运营商不断提高自己对网络维护和优化的能力;传统网络测试产品自动化程度不高,使用定制不便,且升级费用昂贵,在当前网络测试需求大量增加的情况下,越来越
本文针对标准多频带UWB-OFDM无线通信系统,提出了适用于该系统的基带系统设计方案以及基于FPGA的基带系统硬件实现方案。由于多频带UWB-OFDM系统是将跳频技术使用在普通OFDM系