【摘 要】
:
全基因组关联研究是指在全基因组水平上识别与某种表型相关的单核苷酸多态变异(SNP)。由于SNP之间存在连锁不平衡性,使得SNP位点之间存在强相关性。为了降低位点之间冗余程度
论文部分内容阅读
全基因组关联研究是指在全基因组水平上识别与某种表型相关的单核苷酸多态变异(SNP)。由于SNP之间存在连锁不平衡性,使得SNP位点之间存在强相关性。为了降低位点之间冗余程度,减少基因分型的成本,从所有SNP位点上选择最具有代表性的信息SNP即信息SNP选择是当前研究的热点。目前已经有一些机器学习或者组合优化算法用于信息SNP选择,然而它们仍然存在一些不足,如计算复杂度高、信息量较少等不足。针对当前方法的不足,本文提出一种基于多位点连锁不平衡度量的信息SNP选择框架,该框架包含初选及精选两个阶段,其中初选阶段利用简单、计算量小的度量方法剔除大量的噪声、冗余位点,从而节约精选阶段的计算成本,而在精选阶段利用贪婪算法从候选信息SNP中精选出少量的信息SNP,主要工作如下:为了克服以往方法计算复杂度高等不足,本文方法在初选阶段设计一种新的多位点度量,然后将该度量作为优化目标,并改进蚁群算法搜索最优解,从而筛选候选信息SNP子集。与传统方法相比,本文提出的基于信息熵理论的多位点度量不仅能更为准确地描述多个位点相互关系,从而去除更多冗余信息,同时该度量优化比传统方法中预测分类过程所消耗的时间复杂度大大减少。在精选阶段,本文利用人工神经网络作为学习模型以重构非信息SNP位点上基因型,然后以预测准确度为优化目标设计贪婪算法不断从候选信息SNP子集中剔除信息冗余位点,从而提高预测准确度并减少信息SNP数目。在仿真实验中,本文在多组HAPMAP数据集上与其它方法进行比较,实验表明,本文方法在时间复杂度、预测准确度等指标上具有一定优势。
其他文献
2014年伴随着《中华人民共和国预算法》的修改,“讲求绩效”首次作为法律原则与“统筹兼顾、勤俭节约、量力而行、收支平衡”相提并论,习近平总书记在党的十九大报告中提出“建立全面规范透明、标准科学、约束有力的预算制度,全面实施绩效管理。”随后,“绩效”二字首次写入党的纲领性文件,开展绩效管理达到了前所未有的政治新高度,进一步强化了绩效管理在现代财政制度中的重要性,再一次将绩效管理的紧迫性提上发展与改革
本世纪初从云南土壤链霉菌Streptomyces Autolyticus培养液中发现的自溶霉素是一种结构新颖的聚酮类大环内酰胺化合物。它由含酚羟基的芳基与十五元安莎环构成,桥环部分包含
空间光学相机是获取遥感图像的重要工具之一,被广泛应用于天文观测、军事侦察、环境监测等领域,具有极高的经济与军事效益。随着应用的不断发展,对空间光学相机的空间分辨率、时间分辨率、质量、可靠性等提出了更高的要求。空间相机在进入轨道工作前,需要经历地面装配、运输及发射的过程,相机所处的环境发生变化,如温度、压力等的改变以及碳纤维吸湿膨胀、冲击振动等因素,均会对空间相机内部光学系统带来影响,使光学系统内部
微机械加速度传感器是一种测量惯性力的传感器,具有体积小,重量轻、低成本、易于批量成产等优点。谐振式传感器输出频率信号,不需要A/D转换器模块便能与数字电路接口,降低了
环境科学钻探主要是在松散软、欠固结的湖泊相沉积盆地内获取岩心样本,要求取心连续、无污染、无扰动,保持岩心的原状性。因此,设计一种在松散软地层中能够有效保护岩心的新
通过光催化分解水制氢技术将太阳能转化为氢能,已成为近年来的研究热点。本论文通过溶剂热法,以乙二胺为溶剂制备的具有光催化活性的Zn0.5Cd0.5S纳米片材料为基础,通过进一步
Top-down裂缝(TDC)已经成为高等级沥青路面早期损坏的主要类型之一。目前对其形成原因和扩展规律有了一定认识,但尚未形成共识。鉴于现有宏观手段无法准确采集混合料内部的应
目的:本实验拟用SD大鼠构建整体心肌缺血/再灌注(Ischemia/Reperfusion,I/R)损伤模型,探讨丹参酮ⅡA在心肌缺血/再灌注损伤中的作用及机制;并利用H9c2细胞构建缺氧/复氧(Anox
在本文的研究中,从实验室已构建的文库中获得L-LECT2全长EST序列,L-LECT2是由全长cDNA序列中含有606-bp ORF编码的201个氨基酸组成。对L-LECT2氨基酸序列进行生物信息学分析
1990年《著作权法》中第四条规定:“依法禁止出版、传播的作品,不受本法的保护。著作权人行使著作权,不得违反宪法和法律,不得损害公共利益”。这条规定其实存在很多问题。2007年中美WTO知识产权争端一案,专家组判决我国败诉。于是2010年2月26日《著作权法》第四条进行了修改,这次修改解决了原《著作权法》第四条存在的一些问题,即违法作品有著作权,对违法作品进行著作权保护。但仍然存在一些问题,首先,