【摘 要】
:
生命医学领域在本世纪以来得到了全面且快速的发展,当前的生物信息学结合数理统计学已经为人类健康事业做出了巨大贡献。在这个生物大数据的时代,全基因组关联研究(Genome-Wide Association Study,GWAS)出现了。这种方法是以单核苷酸多态性(single nucleotide polymorphism,SNP)作为分子遗传标记,以发掘与生物体遗传疾病以及重要的生理性状相关的突变基
论文部分内容阅读
生命医学领域在本世纪以来得到了全面且快速的发展,当前的生物信息学结合数理统计学已经为人类健康事业做出了巨大贡献。在这个生物大数据的时代,全基因组关联研究(Genome-Wide Association Study,GWAS)出现了。这种方法是以单核苷酸多态性(single nucleotide polymorphism,SNP)作为分子遗传标记,以发掘与生物体遗传疾病以及重要的生理性状相关的突变基因为最终目的,在整个人类基因组范围内进行相关性分析和遗传研究。而针对同一研究问题的多个GWAS,往往会由于研究方法、样本规模等诸多因素的不同,使得研究结果不尽相同,一种有效且全面的解决方法是利用Meta分析对这些结果进行定量综合评价,更准确地识别出显著变异。随着Meta分析在临床医学和遗传研究方面的应用越来越广,相关的理论算法也得到了大量研究,然而对于需要同时检测成千上万个基因的大规模多重检验而言,这些方法大多数坚持关于检验统计量零分布的常规统计假设,这将会导致不正确的显著性测试结果。基于此,本文围绕基于Meta分析的生物大数据分析算法展开研究,主要研究成果如下:(1)在理论方面,深入研究了现有的Meta分析方法,并针对传统方法采用常规统计假设可能会导致多重假设检验中存在大量假阳性结果这一缺陷,提出基于随机符号翻转的MRSF算法,并在甘油三酯基因数据集上对比其它四种P值组合方法,实验结果表明,MRSF方法在整体上拥有更好的识别有效变异的能力。(2)在应用方面,应用MRSF方法发现与血糖特征相关的显著变异。收集整理三项葡萄糖稳态GWAS研究的基因数据,并进行预处理,用MRSF对其进行Meta分析,实验除了识别出3个已被报道过的结果,同时识别出rs494874等6个未曾被报道过的与血糖稳态相关的SNP。
其他文献
聚苯胺(PANI)作为重要的导电聚合物之一,因制造成本低、导电性好、稳定性好和可加工性好等优点而在气体传感器领域显示出广阔的应用前景。作为气体传感器而言,纯相聚苯胺传感材料存在着形貌较单一、灵敏度较低、检测下限高等问题。通过提高PANI材料的晶化度和表面活性以及与氧化物复合是解决上述问题的有效途径。然而,目前报道的PANI与氧化物复合材料在进行气敏性能测试时均体现出聚苯胺的响应特性,且灵敏度较低,
缓解教育高压成为多国教育改革之重点。近邻韩国“双减”政策肇始于20世纪70年代,以社会发展诉求、教育内卷严峻、社会负担加重为现实背景,以通过推行“平准化教育”和取缔校外补习机构为主要内容,但终究无力扭转教育高压现状,憾以失败告终。研究认为韩国“双减”政策失败原因为其政治体制框架下多因素综合作用导致的必然,基于教育视角可总结为三点:其一,受古代科举与现代高考影响,立身扬名与考试竞争价值体系根深蒂固;
在本论文中制备了三种半刚性芳香多羧酸配体,分别是:H_3cbca(4?-(1-carboxyethoxy)-[1,1?-biphenyl]-3,5-dicarboxylic acid),Hcmtna(4-(carboxy methoxy)-6-methyl-1-(p-tolyl)-2-naphthoic acid)以及H_2cmna(6-(carboxy methoxy)-2-naphthoic
十八大以来,在国家推进党风廉政建设和反腐败斗争高压形势下,我国反腐败斗争取得里程碑式的进步。面对复杂严峻的反腐败形势,我们一定要认识到,腐败仍然是执政党面临的最大风险。存量仍未清底,增量仍在发生。在深刻把握反腐败斗争新形势下,毫不动摇地查处不收敛不收手的腐败分子,重点关注政治问题和经济问题交织的腐败案件,是我国在过去几年的反腐实践中,得出的宝贵经验。本文从中央纪委监委官方网站上公布的中管干部党纪政
在体育比赛伤害事故案件中,适用自甘风险规则的频率较高,但因我国之前法律尚未明确自甘风险规则,因此在哪些范围可以适用自甘风险,未成年人是否能适用自甘风险,在适用自甘风险的情况下能否再适用公平原则,这些都存在争议。已生效的《民法典》第1176条首次规定了自甘风险规则为独立的抗辩事由,过于原则化,其适用范围“文体活动”应作扩大解释,包括文艺活动、文化娱乐活动、体育活动,其中体育活动包括:极限体育运动、职
研发新药是一个代价高昂的事情,既耗时又费钱。为已经问世的药物探寻新的治疗效果有助于降低药物的研发成本。在先前的研究中,大部分预测方法只考虑了单一来源的药物和蛋白数据。即没有从多个维度去考虑药物、蛋白相关的信息,也没有充分利用全部的已知数据信息。因此,开发一个将多种药物和蛋白相关数据融合起来方法是很有必要的。本文提出了三种融合多种生物信息数据的预测方法,一种是基于梯度提升决策树探究药物与蛋白之间的相
赫哲族是中国黑龙江省的一个少数民族,只有语言,没有文字。伊玛堪作为赫哲族独特的曲艺形式,虽然没有伴奏,但是其通过叙述和诵唱两种方式的结合对赫哲族的民间故事进行了传神的演绎。伊玛堪包括赫哲族的生活方式、宗教信仰以及民间音乐等内容,研究伊玛堪对研究赫哲族文化和团结赫哲族群众有着重要作用。然而,由于种种历史原因,赫哲族的人口急剧下降,赫哲族语言面临消亡风险,如今没有人能够演唱完整的伊玛堪故事,伊玛堪的传
随着化石能源的逐渐减少和环境的不断恶化,发展高效、清洁、可持续的能源以及能源转换新技术已经迫在眉睫。由电解水制备高纯氢气是获得氢能源的一种有效方法。电解水可分为在阳极上进行的析氧反应(Oxygen Evolution Reaction,OER)和阴极上进行的析氢反应(Hydrogen Evolution Reaction,HER)现阶段,贵金属及其相关的氧化物是目前最高效的催化剂,但是其高成本以及
随着信息时代的到来,越来越多的数据、信息填满了我们的生活。关系抽取是知识图谱中的一个重要任务,能够从非结构化的自由文本中提取出可以存储到知识库中的结构化信息。本文研究了基于神经网络的关系抽取技术,针对现有研究存在的问题,提出了两个有效的基于神经网络的关系抽取方法。首先,针对远程监督带来噪音从而影响抽取结果的准确度这一问题,设计了一个基于BiLSTM和空洞卷积神经网络联合编码的关系抽取方法。该方法从
我国的综合性档案馆是集中管理档案的文化事业机构,承担着传播档案文化的重要使命,肩负着利用馆藏档案开展宣传教育活动的职责。因此,综合性档案馆网站作为建立在因特网上的档案信息服务平台,在其建立之初,即被赋予了教育宣传功能,与此同时,教育服务模块也成为综合性档案馆网站不可或缺的一个重要构成部分。档案馆网站教育服务模块可通过多种形式的档案文化资源服务,有效地发挥档案价值,不仅帮助人们更深切地理解档案、档案