基于Laplace谱的基因表达谱数据分类研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:tom0101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达谱数据分类研究就是通过分析DNA微阵列实验中所获取的基因表达谱数据,发掘出不同样本间的基因表达差异,寻找基因与组织病变之间所存在的内在联系。虽然模式识别领域的各种算法在这些年来都有了长足的发展,但是在针对基因表达谱数据的分类研究中仍有许多问题需要解决。基因表达谱数据由于其获取方式的独特性,具有高维度,低样本的特点。传统的机器学习方法在面对这种数据时,无法取得较好的分类结果,并且其极高的运算复杂度,大大降低了数据分析效率。本文基于谱图理论展开针对基因表达谱数据的分类研究,将反映图结构的特征表示引入到基因表达谱数据分类中,研究基因表达谱数据的特征提取及基于谱图理论的基因谱表达数据分类方法,并对算法的性能进行分析。主要研究内容有:1.基因表达谱数据蕴含着大量的生物信息,如何有效地从中挑选出特征基因将对算法的准确率及实时性产生巨大的影响。本文提出一种利用熵度量作为指标进行癌症基因表达数据特征提取的方法。首先对基因表达数据进行筛选并计算各个基因的熵,然后提取出熵最大的若干基因作为特征基因,并用支持向量机进行分类。对前列腺癌基因表达数据的留一法以及分组法实验都证明了该方法的有效性。2.尝试着将一种基于Laplace谱的算法应用于癌症基因表达谱数据的分类上。该方法首先挑选出与类中心欧式距离最小的若干个样本通过高斯权构造Laplace完全图,记为代表该类的标准图。然后用待测样本依次替换标准图中所有的点,将生成的新图与标准图进行特征点匹配,并计算匹配点数总和。最后将待测样本划分为总匹配点数最多的那个类。3.提出一种基于图的Fiedler向量的癌症基因表达谱数据聚类算法。该方法将分属不同类的所有样本通过高斯权构造Laplace完全图,经SVD分解后获得Fiedler向量,最终利用各样本所对应的Fiedler向量分量的符号差异来进行基因表达谱数据的分类。
其他文献
多孔结构可以使氧化钨薄膜的气敏、电致变色等性能得到增强,但目前多孔氧化钨薄膜的制备仍存在困难。本文采用W和Al双靶磁控溅射的方法得到了W-Al合金薄膜后,把合金薄膜浸入N
文章分析了Sakai平台的在高校教学中的优势,重点介绍了"资源","练习与测验"模块在教学中的使用方法及教师对教学效果分析的方式。Sakai平台作为高校教学的辅助学习管理平台,
三十年来,索尔.贝娄在中国的传播与接受发生了显著变化。一、普通读者人数呈日益减少的趋势,八十年代的人气旺盛已演变为新世纪的门前冷落;二、专业研究人员数量与日俱增,新
<正>节奏交错!是一种内在东西,需要从内心去感受。这将是今年的热身舞场,人们期待已久的本年度该城市的大都会文化庆典和纽约最好的社区聚会。三角形的庭院到处都是用1/4英寸
"两票制"、"一肩挑"、"一制三化"和青县模式,是在实践中产生的、比较典型的、旨在解决农村两委关系的四种基本模式。但前三种模式只是在一定程度上协调了两委关系。而青县模
深衣是华夏民族传统服饰中最具影响力的一种上下连属的袍服,深衣所代表的是以儒家思想为精髓的传统华夏文化,后世亦称儒服。作者依据文献资料,首次对深衣的形制变化分为四个
目前我机电产品对非洲出口较少。扩大对非机电产品出口虽有困难,但潜力很大,只要我们采取切实可行的措施,是很有希望的。
《聊斋》中有八篇于篇末所附评论短文,体现了蒲松龄内心深层的隐痛以及伦理道德倾向。可以理解为孤愤之思的直接表达。骈体文形式的运用,典故的堆砌,既是文人生命形式的彰显,
地质和地热勘查中,为评价勘查区地质环境条件,需要选择代表性钻孔进行地温测量。由湖北省地质局第七地质大队研制的HBDZ 7-1型深孔数字地温测量记录仪,解决了以往观测设备笨
轴对称以及性质不仅是中学数学重要的知识,还是一种重要的解题工具.在解析问题时若能合理利用轴对称变换或轴对称的性质,则可以挖掘题目中的隐含条件,建立高效的解题思路.文