基因微阵列数据分类系统的设计与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:xurikeji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因决定了一切生命从出生到死亡整个生命过程的表现形式。通过基因检测与数据分析可以帮助人们知道人一生的疾病走向与潜在隐患,并引导医学向更准确的治疗方向发展。基因表达数据是通过微阵列技术得到,即DNA微阵列技术,又被成为基因芯片技术。通过基因微阵列技术,人们可以获得大量的基因表达数据。对有着生物信息的癌症基因数据进行分析与研究,将有助于疾病的预测与诊断。然而,如何对有着数据维数高、样本小、相关性大、冗余特征和噪声特征干扰性强等特点的基因微阵列数据进行快速、高效、准确的提取与分类,已经成为当前针对基因微阵列数据研究的重要课题之一。本文在阅读大量国内外相关文献,多次实验的基础上,以癌症基因微阵列数据为研究对象,开发了基因微阵列数据分类系统。本文由基因微阵列数据的特征选择、特征提取、分类等部分组成。在特征选择与特征提取部分,利用小波变换将其快速的降维,减少冗余特征数据对样本分类的影响。鉴于微阵列实验复杂性与环境等因素的影响,以及采集数据对象又存在差异,这使得相同分类器在不同数据集上,表现出不同的学习效果。文本将通过改进Borda融合算法,将多特征选择方法得到的特征排序序列,融合成一个最优的特征排序结果。同时,还研究了用粒子群优化算法对小波系数进行筛选,进而得到最优的特征子集。为了验证本文算法能够有效地实现基因数据分类,并且其系统具有一定的可行性与实用性。本文将在三个数据集上进行实验,分别是急性白血病数据集、前列腺数据集、肺癌数据集。实验结果表明:本方法能得到较好的微阵列数据分类结果。并且将改进后的算法应用到分类系统中,不仅进一步验证了本文算法的有效性,同时验证了基因微阵列数据分类系统的合理性与可用性。
其他文献
通过破析NBA的运行机制和透视我国足球职业体育发展遭遇到的问题,认为我国的职业体育俱乐部发展,在市场经济环境下,必须明确“受众”是单项职业体育项目生存的基础;必须提升
<正>玉璧是良渚文化出土和传世最多的玉器,在反山遗址曾经一次出土了130件玉璧,寺墩3号墓也一次出土了24件玉璧,估计民间收藏的良渚玉璧也不在少数。在杭州、嘉兴、南京、合
期刊
国学经典具有浓厚的文化底蕴及韵味,是我国传统文化的精髓。在小学教学中引导学生对国学经典进行诵读,可有效培养学生的品德素养及学习能力。让小学生与圣贤为友,以经典为伴,
《固体矿产地质勘查规范总则》是各分矿种地质勘查规范的纲领性规范,在指导各分矿种勘查规范的制订、修订,指导全国地质勘查单位开展工作,评价固体矿产资源储量等方面都发挥
电动汽车达到一定规模后可能带来大量充电负荷,为使收益最大,提出充换电站应采用充电与换电相结合的工作方式,充電模式采用直接从电厂购电,而换电模式通过电网购电。以充换电
论述了特种冶金技术 ,包括真空感应脱气浇铸、冷坩埚感应悬浮熔炼等真空冶金 ,真空电渣重熔、电渣快速重熔、电渣复合技术等电渣冶金和等离子冶金技术的新进展 ,并评述了其发
<正>普及急救知识、开展现场救护是减少意外伤害、降低病死率的有效手段。大学生是社会上的一个特殊群体,大学生急救知识的掌握情况直接反映一个国家的公众急救水平[1]。同时
在APON和EPON相互竞争的推动下,一种无源光网络的新技术———GPON出现了。ITU-T已经通过了部分GPON标准,GPON正在成为光接入网领域的研究热点。概述了GPON技术的产生与发展
我国保障房建设的融资难题亟待破解,需要更多地利用金融创新,开拓新的融资渠道,将政府直接主导型融资方式转化为政府引导下的市场化运作方式。本文将公租房为例,探讨REITs融
<正>题目(2018年全国高考题数学卷Ⅰ文科试题)直线y=x+1与圆x2+y2+2y-3=0交于A,B两点,则|AB|=.分析本小题考查直线与圆相交的弦长问题,考查数形结合思想、方程思想及运算求解能
期刊