【摘 要】
:
DNA微阵列技术推动生物信息学跨入了多基因、全基因组研究的崭新时代,同时也产生了远远超出传统数据分析方法处理能力的海量基因表达数据,设计符合表达数据特征的高效数据分
论文部分内容阅读
DNA微阵列技术推动生物信息学跨入了多基因、全基因组研究的崭新时代,同时也产生了远远超出传统数据分析方法处理能力的海量基因表达数据,设计符合表达数据特征的高效数据分析方法已成为生物信息学研究的热点和重点。人类疾病通常与基因相关,诊断基因是指与某一特定疾病表型紧密相关的基因,具有很强的区分不同样本表型的能力。DNA微阵列数据的聚类和分类分析对于研究基因功能和基因调控机制有重要的实际意义,从基因角度解释了疾病。第一,提出了基于序投影距离的无监督表型和诊断基因发现算法MSMD。本文提出了一个新的表型聚类算法,该算法的基于序投影距离的概念计算区分这些样本子序列的能力,然后根据最能区分样本的子序列对样本进行聚类,同时能找到诊断基因。该算法主要包括下面几个部分,第一,把微阵列数据转化为Ewave模型。第二,找到平凡子序列,对等价维组数据进行削减删减掉平凡子序列并且为简化后的微阵列矩阵创建位置矩阵。第三,用模版进行枚举,其中通过投影距离的上限进行削减,为每个样本找到最大区分能力的子序列。第四,根据每个样本的最大区分能力子序列划分块,最后把这些块聚成K类,同时发现诊断基因模式。实验结果证实,本文提出MSMD算法在运行效率和有效性方面均大大优于与之比较的算法,而且发现的诊断基因具有很强的生物学意义。第二,提出了基于Top-K覆盖不可约对比序列规则的诊断基因模式发现算法。基于Top-K覆盖不可约对比序列规则的诊断基因模式发现算法从序列规则的视角来分析微阵列数据。本文首先给出对比序列规则、规则组、不可约对比序列规则相关的概念,并且继续使用上一章提出的分析微阵列数据的模式——Ewave模型。接着在数据模型上,找出满足阈值要求的Top-K覆盖不可约对比序列规则,每个样本都找到自己的Top-K最好的规则作为区分样本表型的诊断基因模式。最后,用这些规则来构建分类器,从而完成对未知测试样本的分类预测工作。
其他文献
为了研究缺失里氏木霉中内源表达量最高的两种纤维二糖水解酶(CBHⅠ, CBHⅡ)或进一步敲除转录抑制因子Crel是否有助于提高重组甘露聚糖酶的表达水平,本文在里氏木霉中建立了
目的分别采用鼻内针刺、外迎香穴针刺两种针刺方案治疗变应性鼻炎,针对两种临床效应穴位在变应性鼻炎治疗中的作用做出有效评价;采用ELISA法分别于治疗前、后检测变应性鼻炎患者血清中Eotaxin、CCR3以及鼻腔分泌物CCR3的含量;应用静息态fMRI技术初探变应性鼻炎患者异于健康人的脑功能活动特征,以及重要脑区功能活动在鼻内针刺前、针刺时、起针后的变化情况。方法1.在第二部分中,共纳入变应性鼻炎患者
我国红黏土广泛分布于华南和西南地区,多为不受冻红黏土。而分布于青藏地区为多年受冻红黏土,由于大连地理位置决定红黏土受季节冻融的影响。大连地区红黏土主要分布于陆地和浅海中石灰岩的低洼处,由于大连是全国海岸线最长的城市,土壤受海水不断侵蚀形成以氯化物为主的滨海盐土。结合大连金州湾国际机场建设的红黏土路基填筑作为研究背景,通过试验研究与数据理论分析相结合的方法,研究红黏土的渗透特性和裂隙发展规律。通过室
多波束测深声纳作为当前最重要的海底探测设备被广泛应用于现代海洋监测与海底资源调查等领域。在多波束测深过程中,由于绝对真实水深无法获知,且测量结果受众多不确定因素影
目的 探究右美托咪定对脑缺血再灌注损伤时是否通过血管内皮糖萼途径发挥脑保护作用。方法 本实验选用110只鼠龄8~12周,体重25~30g的雄性C57小鼠作为研究对象,按照随机数字表法
目的:探讨正念认知疗法对于糖尿病患者相关痛苦、自我管理水平、正念水平的干预效果,以期为糖尿病患者制订心理干预方案提供参考依据。方法:根据纳入标准与排除标准,采用便利抽样的方法,抽取深圳市某三甲医院内分泌科的70例2型糖尿病患者作为研究对象,根据患者入院时间的先后顺序将其分为干预组和对照组,其中以2019年3月~2019年5月入院的35例患者为对照组,以2019年6月~2019年10月入院的35例患
PRKAA1属于AMPK家族中的一员,是生物体内一种重要的蛋白激酶,在能量稳态、脂肪代谢和细胞增殖中具有重要调控作用;LncRNA在生物体胚胎发育、脂肪沉积和细胞分化等过程中发挥重要的作用。本研究用贵州从江香猪和大白猪为研究材料,通过qRT-PCR、分子克隆、细胞培养、细胞转染、Western blot等技术,筛选和鉴定PRKAA1相关LncRNA-ALNC1和ALNC2基因,检测脂肪相关基因的表
随着化石燃料的大量消耗以及环境问题的不断增加,全球生物能源的重点已经从非可再生的石油型碳源转向农业和林业的副产品这些可再生的碳源。为了充分利用纤维素这一主要的可
随着全球经济一体化发展,企业间的竞争加剧,经营的不确定性增加,资金流断裂或投资机会错失均可能对公司造成致命打击,同时我国企业普遍面临融资约束问题,在这种情况下,越来越多企业通过高比例现金持有、低财务杠杆等财务政策安排,留存适当的财务弹性,以此为企业未来经营不确定性提供缓冲,降低融资约束对企业发展的限制。值得关注的是,财务弹性不是越高越好,过高的财务弹性更易引发代理问题进而损害企业价值。在这样的背景
随着国家经济的快速发展,公路、铁路以及城市轨道等基础设施逐渐完善,越来越多的人选择汽车、火车和地铁出行,这些交通工具给人们的工作和生活带来了极大的便捷与享受,但随之而来的是道路交通事故激增。根据统计数据显示,全世界每年发生的交通事故中有一半以上是由于驾驶员疲劳驾驶所导致的。因此,对驾驶员行驶过程中的疲劳状态进行有效的检测对于减少或避免交通事故的发生具有重要的现实意义。本文的主要工作和创新点如下:(