基于Bi-cluster的基因表达双向关联模式发现

来源 :天津大学 | 被引量 : 0次 | 上传用户:or4108432566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达谱数据的分析研究对于生物学和生物信息学而言具有极其重要的意义,尤其是对基因功能与条件的关联研究尤为重要。传统的聚类方法是用相似性度量函数确定基因的相似程度,从而将基因分组。然而在很多情况下,对基因的聚类需要找出在一部分实验条件下表达水平上调或下调一致的基因组,即对基因进行聚类的同时对实验条件也进行聚类,由此引出了双向聚类问题。δ-Bicluster算法是基于MSR(最小均方残差)理论和迭代贪心搜索策略的一种经典双向聚类算法。在分析了该算法优缺点的基础之上,本文提出了ProBicluster算法。ProBicluster算法从两个方面入手:针对双向聚类模式单一性问题,通过二部图理论发现线性模式;针对交叉聚类问题,对结果进行二次聚类。并将算法在人工模拟数据集上测试,说明了ProBicluster算法改进的有效性。本文还实现了基于ProBicluster算法的数据分析平台。对酵母菌细胞周期数据集进行基因与条件的双向关联分析。将ProBicluster与其他四种聚类算法同时应用到酵母菌细胞周期数据集上,利用基因通路和双向聚类结果评价指标进行聚类结果比较及分析。评分结果表明,ProBicluster算法的相关系数评分均高于其他几种算法,恢复系数评分与OPSM算法各有高低。总体说明ProBicluster算法具有良好的准确性和有效性。在NCI60数据集上对基因与药物进行双向关联分析。利用ProBicluster算法进行双向聚类分析得到聚类结果,并从基因和药物两个角度对实验结果进行分析。利用通路对基因之间进行分析,同时从药物类别、理化属性等方面对药物进行分析。经过文献验证发现,在子模式一中基因CCND1对药物Cisplatin具有抗药性,说明双向聚类算法对于发现基因与药物双向关联的有效性,对进一步的药物筛选和药物设计提供帮助。
其他文献
视频车牌检测技术是智能交通领域中研究的热点问题,它作为机器视觉及模式识别研究领域里长期关注的一个重要课题,具有极高的学术研究价值和重要的实际应用价值。同时,Adaboost算
在通信技术和网络技术飞速发展的今天,企业收集、传递、整理信息的途径越来越多,效率要求越来越高,传统传真的机械传真机收发方式已经无法满足企业信息化的要求。本文结合某
随着视频与图像处理技术的发展,基于摄像头的视线估计技术作为人机交互领域的一个重要分支受到了广泛关注。传统的视线估计技术大多采用瞳孔角膜反射向量法,因为它具有良好的
自动化文本分类是数据管理的重要组成部分,目标是自动地将文本划分到已知的类别中去。基于关联规则的文本分类方法相对于其他的文本分类方法,不仅可以产生易于理解的分类规则
遗传算法是模仿自然选择和生物遗传学机理,通过人工方式构造的一种随机搜索算法,具有搜索的隐并行性、进化的自适应性和不依赖于问题特性的鲁棒性等特点。作为一种启发式随机搜
护士排班问题是一个具有挑战性的题目,由于医疗机构和护理工作的特殊性,护士排班问题通常具有各种各样的约束条件。良好的排班方案有助于鼓舞团队的士气,营造良好的工作氛围,从而
为了解决现有Internet面临的高速交换、服务质量(Quality of Service, QoS)保障、网络安全和移动性方面的问题,四川省网络通信技术重点实验室提出了“单物理层用户数据交换平
随着互联网服务爆发式增长,用户对海量数据的需求加大,如何在动态网络环境中设计具有高可用性和高可靠性的分布式存储系统,已经成为热点问题。P2P技术的成熟推动了网络存储技
作为一种新型的群集智能算法,蚁群算法从20世纪90年代提出至今,被广泛应用于求解复杂的组合优化问题,如调度问题、TSP问题等,取得了比较好的效果。然而蚁群算法自身也存在着不足
SQL注入已成为数据库严重的威胁之一,目前主流的防御SQL注入的方式是采取预编译SQL以及基于特征库的过滤,但是这两种方式在实际的应用中缺乏部署的灵活性和识别的准确性。本