基于PCA+LLE组合降维的基因组进化研究

来源 :石家庄铁道大学 | 被引量 : 3次 | 上传用户:bjbysj44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据绛维在计算机模式识别中起着重要的作用,我们可以把高维的研究数据降低到低维,通过低维数据可以很方便的发现数据的特性。在基因组研究中,由于其包含的信息量大,涉及面广,提取到的特征必定是高维的,把计算机模式识别中的数据降维借鉴过来应用一定会有很好的效果,进而对发现其进化规律会产生良好的作用。本文提出了一种基于PCA+LLE的组合降维算法来分析原核细菌基因组数据的方法,并根据此方法的分析结果构造出了生物系统图,与此同时本文针对于LLE的K近邻值与本征维数的选取问题提出了较为科学的解决方案。主要工作如下:(1)研究了局部线性嵌入算法在处理高维非线性数据时涉及到的两个实际的问题:近邻参数K的选取问题以及本征维数d的选取问题。综合分析了近些年关于在局部线性嵌入算法中近邻参数K选取问题的研究进展情况,并对其进行了综合比较。根据重构误差函数提出了一种选择近邻参数K的选取方法,并且利用此方法进行了实验验证,经试验证明此方法对与近邻参数K的选取具有一定的优越性。在如何选取本征维数d的问题上利用损失函数最小化的特点引入了拓扑相似度这一概念,并从理论上分析了本征维数d与拓扑相似度之间的关系,利用其关系特点总结了一套本征维数d的选取方法,并用此方法做了实验和讨论。(2)提出了PCA+LLE的组合降维算法提出并分析了PCA和LLE存在的一些问题;根据PCA与LLE的问题及自身的优劣特点提出了解决各自问题的PCA+LLE组合降维算法,并用实例对其优越性进行了分析;在基于PCA+LLE组合降维算法的基础上对23个原核细菌进行了降维分析,根据降维效果将其分为了两大类,此结论符合以前学者的研究成果,从而证明了实验的正确性以及PCA+LLE组合降维算法使用的正确性。(3)基于PCA+LLE组合降维算法对23个原核细菌基因组进行了降维分析与生物系统树图的建立。对于分子水平的系统分析方法以及基于基因组水平的系统分析方法作了简要的概述;根据不同原核细菌的DNA序列中的GC含量之间的差异的特点提出一种DNA序列的特征选取方法,并在此基础上对于选取的特征进行PCA+LLE的组合降维分析;根据降维后的图形结果对23个原核细菌进行生物系统树图的建立。最后,对论文的工作做出了总结,并指出了下一步的研究方向。
其他文献
目的:探讨自知力不良强迫症患者的临床特征和神经认知特征。方法:比较66名健康对照(HC)、61名自知力良好强迫症(OCD-GI)、48名自知力不良强迫症(OCD-PI)和41名精神分裂症伴强迫症(SOD)患者的临床特征以及神经认知特征。结果:相较于OCD-GI,OCD-PI与SOD的自知力水平更低、强迫思维更严重;相较于SOD,OCDPI强迫行为更严重。相较于HC和OCD-GI,OCD-PI和SO
新中国罪犯改造体系从提出到完善,经历了一个不断实践和理论升华的过程。在不同时期只有构建与之相适应的罪犯改造体系,才能更好地满足监狱工作和罪犯改造的实际需要。以"五大改造"为根本的罪犯改造体系为新时代监狱工作发展指明了方向,提出了具体路径,也为罪犯改造提出了新的要求。完善以"五大改造"为根本的罪犯改造体系,关键在于充分发挥政治改造的统领作用、监管改造的关键作用、教育改造的核心作用、文化改造的基础作用
为了实现隧道穿越富水断层破碎带施工突水涌泥安全风险评估,首先总结出了一套全面的关于隧道穿越富水断层破碎带突水涌泥风险因素评价指标体系,其次运用层次分析法(AHP)与模糊数学(Fuzzy)理论,构建了隧道穿越富水断层破碎带施工突水涌泥风险发生概率和风险后果损失的定量评估模型,最后通过开展关于碧峰寺隧道穿越F7断层破碎带突水涌泥的工程实例验证,得到碧峰寺隧道风险发生概率等级为Ⅳ级,风险后果等级为Ⅱ级,
文章对隧道断层破碎带超前支护技术进行分析,先论述断层破碎带对隧道工程施工产生的影响,其次在依托某隧道工程实例的基础上,从确定施工工序、隧道开挖、超前支护以及拱墙衬砌等方面,详细论述隧道断层破碎带超前支护技术实践要点,以期提升隧道工程安全与质量。
本文以萤石矿斜井开拓遇富水性含黏土破碎带开拓工程时,采取哪些施工技术手段和安全措施进行简要论述。萤石矿脉主要赋存于断裂构造中,因此萤石矿的采掘活动遇断裂构造的概率非常大。断裂构造内岩石呈块状、碎块状,裂隙发育,裂隙面多为泥质充填,且水系径流发育,穿越难度较大,如何既经济又安全的通过成为本文论述的主题。
重粒子的纯轻衰变,能够为新物理的发现提供非常有效的信息,通过对重粒子纯轻衰变的研究可以确定其衰变常数,同时也有助于对其半轻与非轻衰变进行研究。另外对重介子的辐射性衰变的研究也有利于检验和完善物理标准模型(SM)。对于介子的纯轻衰变来说,由于其末态全部是轻子,强作用的干扰也比较小,所以理论计算上非常的干净。然而其纯轻衰变的螺旋度是压低的,分支比很小。比较幸运的是人们在研究中发现,如果在介子的纯轻衰变
由于能够实现电能和机械能的相互转换,压电材料被广泛用于制作传感器、滤波器、换能器和执行器等各种压电装置。这些器件通常是层状的,而且他们的许多应用以弹性波的传播知识为理论基础。因此,压电层状结构中弹性波的传播性能一直是应用物理、力学和声学等领域内的重要研究内容。假定界面是非理想粘接的,本文研究了两种层状压电结构中的SH波传播问题,一种是平面层状的,另一种是层状复合柱体。压电材料具有横观各向同性的性能
电磁材料是一类新型的多功能材料,其特有的电磁耦合效应使其在电子技术、超声技术、智能工程以及其它先进智能结构中得到了广泛的应用。在电磁结构的设计过程中,对其缺陷的研究有十分重要的意义。裂纹,作为一种常见的缺陷,经常预先存在于器件中或者在器件使用过程中因外部荷载产生。因此,近年来人们对关于此类电磁材料断裂力学的研究产生了广泛的兴趣。本文在前人工作的基础上,采用两种界面裂纹模型即经典界面裂纹模型和含接触
玉液还丹、六根震动、金液还丹,内丹修炼过程中这些神奇的体验,让无数修道者津津乐道。丹经里令人神往的描写,成为了内丹养生实修者前行中源源不断的动力。特别是大周天,更是实修中不可能绕过的一座高峰,今天我们就来聊聊这个话题。让我们从最熟悉的小周天说起吧。
期刊
以工程信息为背景,针对在工程信息的长期安全保存和可靠调用过程中存在的信息和其使用系统之间不兼容的问题,研究了工程软件格式之间的转换以兼容不同的系统,并建立软件格式转换网络。以该类网络为基础,将复杂网络理论引入到工程信息领域中,深入研究了工程软件格式转换网络的拓扑结构、验证了网络模型并且对所建立网络的社团结构展开分析。搜集较为全面的工程软件属性信息,以软件格式为节点,格式转换关系为边建立适度规模的软