人基因组芯片数据分析方法的相关研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：bbs_zj

【摘要】

：

人类基因组计划于2003年4月14日在华盛顿大学完成，这标志着生命科学研究全面进入了后基因组时代。以基因功能鉴定为中心的功能基因组学是后基因组时代研究的核心，而生物体中基

【作者】

：

李力

【出处】

：

华南理工大学

【发表日期】

：

2013年期

【关键词】

：

基因芯片人基因组芯片数据库内参基因图聚类 miRNA靶标

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人类基因组计划于2003年4月14日在华盛顿大学完成，这标志着生命科学研究全面进入了后基因组时代。以基因功能鉴定为中心的功能基因组学是后基因组时代研究的核心，而生物体中基因功能的实现无不与RNA的表达密切相关，各种以分析RNA表达为基础的研究方法成为当今生物学研究的重要手段，基因芯片技术就是其中之一。基因芯片技术自发明以来，由于其高通量的特性，可以在短时间内测定各组织部位及各生理状态下基因的差异表达，一直被广泛地应用于基因表达谱和基因的生物学功能研究。世界各地的生物芯片研究人员也通过生物学公用数据库与全球共享芯片的试验数据。如何对这些海量的原始数据资源进行有效的分析，提取出更多有价值的信息并寻找其中隐藏的生物学规律，尚未有令人满意的解决办法。本研究以从公用数据库中下载的人基因组芯片数据作为研究对象，通过分类整理，比较已知人管家基因在这些样本数据中的表达稳定性数值；针对现有聚类方法在人基因组芯片数据分析中的不足，提出一种基于模块性指标和子图平滑度的全局图聚类方法；最后在miRNA靶基因预测方法的研究方面对人基因组芯片数据的应用进行尝试。首先，研究从两大公用芯片数据库下载人基因组芯片数据样本共16398块，通过分类、整理、数据预处理、转换等步骤构建本地的人基因组芯片数据库；使用geNORM算法，对566个已发现的人管家基因在库中所有试验样本中的表达稳定性进行研究；将分析得到的最稳定的管家基因作为内参基因，应用于三组与黄曲霉毒素B1致癌毒性相关的人基因组芯片的数据分析中，试验证明通过使用多样本间表达稳定性更高的管家基因EEF-2作为内参，发现了更多的相关基因。然后，为了更有效地分析人基因芯片数据，针对现有基因芯片数据图聚类方法的不足，研究提出一种基于模块性指标和子图平滑度的全局图聚类方法(Module smoothness)。为防止算法陷入局部最优解，引入子图平滑度的定义，打散每次聚类结果中产生的平滑度较低的子图，再对得到的单节点进行下一次聚类，经多次迭代后得到全局最优的聚类结果。将该方法与经典图聚类、K-means、SOM及Fuzzy四种常用聚类方法一起，对同一组基因组表达数据进行分析比较。结果表明：该方法在聚类过程中的平均类间重叠度和FOM’值总体上优于其他四种算法，在将数据集分类到最佳聚类数39时，其FOM’值分别比上述四种方法低28.41％、19.21％、9.84％和24.67％；其分类准确度高于层次聚类和SOM算法，算法执行效率则与SOM算法相近，比Fuzzy算法高5.94%。最后，将人基因组芯片的数据挖掘应用到miRNA靶标预测的方法研究中，提出一种新的miRNA靶标预测方法(Dual sites SVM)。除了以机器学习算法SVM为核心，设计双种子位点搜索等机制外，还在其它基于碱基互补原则的特征向量基础上，定义两个利用本地人基因组芯片数据库中的试验数据产生的特征向量。使用该方法训练得到的模型执行效率比单种子位点模型高19.09%，比PicTar高16.76%；所构建的分类器性能与MirTarget2，miRanda，PITA，TargetSpy，TargetMiner和TargetScan六种常用方法相比，在不降低分类结果准确性的同时有效的提高了算法的敏感性。该预测方法已编写为在线工具，为生物信息学研究人员服务。本研究从构建本地人基因组芯片数据库入手，对基因组芯片数据的相关处理分析方法展开研究，在内参基因表达稳定性和表达谱聚类方法等方面取得了初步成果，为人基因组芯片数据的进一步挖掘研究和应用提供参考。

其他文献

紫花簕杜鹃控水促花试验

在光照充足条件下,通过1~5周的控水试验,研究控水对紫花簕杜鹃开花的促进作用。试验表明:紫花簕杜鹃开花受水分影响明显,控水1~3周促花效果呈增长趋势,控水效果最好的是第3周

期刊

紫花簕杜鹃控水花期调控

外贸企业如何利用仲裁解决国际贸易纠纷

外贸企业面对的国际贸易纠纷,是当前外贸企业需要着力解决,并且也不容忽视的一个重要问题。本文主要是从整体出发,介绍我国外贸企业目前外贸纠纷的主要现状,从数量、对象、产

期刊

外贸企业仲裁贸易纠纷

多障碍物环境下基于无人机的移动目标监控

移动目标监控是无人机系统中一个基本的功能需求。虽然已存在很多监控系统用于管理智慧城市和智能交通等,但是,如何设计一个高空环境下基于有限计算资源的移动目标在线监控系统仍是一个研究难点。此外,在监控期间,移动目标可能被诸如树木、建筑物等各种障碍物遮挡。针对以上问题,传统的移动目标监控系统存在诸多的不足,极大地限制了应用范围。而近些年随着无人机和传感器技术的发展,基于无人机的移动目标监控系统受到了越来越

学位

无人机路径规划移动目标检测移动目标追踪在线监控

小学班主任职业倦怠现状的调查研究

教师同医生一样,是一项高压力高强度职业,极易产生职业倦怠,一旦产生职业倦怠,除了危害自身,还危害学生。班主任是特殊的教师群体,是学校教育中的一线骨干力量,是学校教育工

学位

小学班主任职业倦怠调查研究

物理法立式活化炉的炉型及工艺参数对活性炭质量、收率影响的讨论

<正> 随着国民经济的发展,活性炭的需要量越来越大。这样就要求我们立足于生产能力大、质量高、活化剂来源经济,生产的活性炭适应性广。比较起来,用物理法生产活性炭便于因地

期刊

活性炭木炭块工艺参数活化温度物理法

血浆KRT-14对ARDS患者的临床指导意义

目的:ARDS是一种严重的ICU常见合并症,致死致残率高,目前还没有发现价值较高的生物学标志物,该研究旨在探讨血浆中的KRT-14表达水平对急型呼吸窘迫综合征(ARDS)患者的临床意

学位

急性呼吸窘迫综合征角蛋白-14诊断预后

企业价值创造中财务杠杆的作用

财务杠杆是指企业利用负债来调节权益资本收益的手段。市场经济条件下，负债经营是企业选择的必须和必然，通过负债，可以发挥积极的财务杠杆作用，能促进自有资金收益率的提高，是企业

期刊

财务杠杆财务杠杆效应企业价值

昆明市业余网球竞赛组织管理与对策研究

随着全民健身计划的深入开展,2008年北京奥运会的成功举办,业余网球运动在我国取得了迅速的发展。近年来,昆明市网球运动发展迅速,业余网球运动比赛在逐年增加,业余网球比赛

学位

业余网球竞赛组织管理对策

会展产业发展的现状与对策研究——以陕西省为例

会展业在国际上被称为"触摸世界的窗口"和"城市的面包"。会展业在贸易往来、技术交流、信息沟通和经济合作诸方面都发挥着重要的作用。改革开放30年,我国会展业已经成为一个

期刊

会展产业现状对策

论行政不作为

近年来,行政不作为现象日益突出,行政不作为类型案件已成为行政诉讼案件新的增长点,社会各界对此反映强烈。对行政不作为进行研究,无论是对行政行为本身还是行政诉讼均富有重

学位

行政行为行政作为行政不作为行政不作为的构成要件行政不作为救济

人基因组芯片数据分析方法的相关研究与应用

与本文相关的学术论文