【摘 要】
:
我国胃癌患者占全球发病人数的47%,其发病率和死亡率在所有恶性肿瘤中均占第二位,严重威胁人民的生命和健康,胃癌死亡率高的重要原因是其早期症状不明显,多数患者确诊时已发展到进展期,进展期胃癌易转移和复发,因此,早发现早治疗对降低胃癌死亡率具有重要意义。识别关键致病基因确定治疗靶点,是诊断和治疗的关键。传统医学实验识别关键致癌基因存在代价高、耗时长等缺点。随着组学技术的发展,积累了大量的转录谱数据,使
论文部分内容阅读
我国胃癌患者占全球发病人数的47%,其发病率和死亡率在所有恶性肿瘤中均占第二位,严重威胁人民的生命和健康,胃癌死亡率高的重要原因是其早期症状不明显,多数患者确诊时已发展到进展期,进展期胃癌易转移和复发,因此,早发现早治疗对降低胃癌死亡率具有重要意义。识别关键致病基因确定治疗靶点,是诊断和治疗的关键。传统医学实验识别关键致癌基因存在代价高、耗时长等缺点。随着组学技术的发展,积累了大量的转录谱数据,使得用算法预测潜在关键致病基因成为可能,从而为医学实验提供候选基因,缩短实验时间和降低成本。本文基于m RNA、mi RNA和lnc RNA三种转录谱表达数据,结合多种特征选择方法,构建了胃癌非冗余致病基因识别模型,并筛选出胃癌核心基因和重要信号通路。主要研究内容与成果如下:构建了基于差异性表达分析和相关性分析的胃癌致病基因识别模型。通过使用edge R和relief算法筛选胃癌相关差异表达基因和胃癌相关基因,从m RNA、mi RNA和lnc RNA三种转录谱的上万个基因中分别选择出200,50和200个潜在的胃癌相关基因。通过随机对照实验,以分类准确率作为评价指标,分类准确率分别是93.78%、95.15%和94.67%,证实了其有效性。针对识别的胃癌相关基因存在冗余基因的问题,构建了基于非支配排序进化算法和粒子群算法的胃癌非冗余致病基因识别模型。建立数学模型将删除冗余基因问题转化成多目标优化问题,设计优化目标函数最小化基因子集个数和分类错误率,通过多次迭代同时不断优化目标函数。最终在三种转录组中分别选择出56,12和48个潜在的非冗余胃癌相关致病基因。为进一步证实潜在非冗余胃癌相关基因的有效性,对可以编码蛋白质的m RNA分别从GO富集性、KEGG通路等角度进行了生物功能分析,发现m RNA转录谱中有多条基因通路与胃癌的形成有关,多个基因与胃癌的发展有关。对三种转录谱中的胃癌相关基因子集构建ce RNA网络,筛选网络中重要信号通路,发现四条影响胃癌患者生存预后的基因通路,发现一条通路是潜在的胃癌ce RNA基因调控网络,为探索更有效的胃癌诊断和治疗靶标提供了理论依据。
其他文献
为了更深入地研究蛋白质的功能与性质,需要通过多种方法获得它们高分辨率的三维空间结构。如果我们已知确定了组成蛋白质的氨基酸分子的序列,就可以预测出蛋白质的三维空间结构。一般进行蛋白质结构预测都会有多个结果,为可以辅助使用同种类型蛋白质结构在实验中所测得的蛋白质冷冻电镜的图像,将二者的结构进行高精度的匹配,通过定量计算二者的匹配度,对预测得到的结构进行评分,从而实现冷冻电镜图像辅助蛋白质结构预测。首先
可视化机器学习平台依赖拖拽式建模方法进一步降低了入门机器学习的门槛,也简化了专业领域从事人员定义和训练模型的操作,逐渐成为未来机器学习的主流工具之一。目前,不少头部企业如阿里巴巴、微软等将机器学习平台商业化,为其它企业、公司和个人提供服务。但这类云平台购买价格高昂,配置和使用各不相同,平台学习成本较高,当处理中小规模的机器学习问题时往往显得繁杂和冗余。同时,进行算法实验时需要将数据集上传到云服务器
时钟同步作为水下无线传感器网络一项重要技术,为网络多节点提供统一的参考时钟,从而有效协同节点工作。基于AUV辅助的水下无线传感器网络虽然能够利用AUV提高水下应用的数据聚合效率、数据传输速率、定位精度。但是,AUV自身移动性将严重影响到传感器节点的时钟同步性能。因此,本文针对AUV辅助的水下无线传感器网络时钟同步展开深入研究。本文针对基于AUV辅助的水下无线传感器网络时钟同步问题展开了三个方面的研
好莱坞“超级英雄”电影直至今日在世界电影领域发挥着它无可替代的作用,在国际电影市场上不断创造出票房奇迹,带来的“超级英雄”文化也辐射至全世界,范围之广、影响之深令全世界电影人瞩目。好莱坞“超级英雄”题材电影因发展良好,形成一套属于自己成熟的类型特征和叙事模式,堪称经典。但它并没有因此止步不前,近几年,好莱坞不少“超级英雄”电影带着新的视角和突破闯入观众的眼帘,“超级英雄”系列电影有了进一步的突破和
在当前世界各国为了实现智能制造都先后提出了关于制造业先进发展战略的背景下,如何在产品制造过程中实现信息虚体和物理实体的交互和融合是实现智能制造的关键,而数字样机理念则为其提供了一种解决思路。本文基于数字样机技术提出了在生产线的设计阶段就能对设备进行仿真评估的解决方案,并以换向器生产线中的刷钩台为对象进行数字样机搭建,并对其功能和性能进行了验证。本文的主要研究内容有:首先,设计了基于PLC数据驱动的
近些年来,互联网越来越普及,国民的素质教育也明显提高,各种培训学校和教育机构也越来越多。基于大数据分析和云端动态应用的信息化、智能化课堂教学已经成为大多数教育机构的需求。通过互联网技术的介入,课堂可以在师生之间建立便捷高效的技术联系、知识联系和情感联系,有效地实现教师与学生之间、学生与学生之间以及学生与平台和教学资源之间的互动。借助在线教学资源和信息技术促进课堂教学,可以取得良好的教学效果。在线课
电力工程总承包是指符合电力行业资质要求的企业在电力工程建设过程中,参与项目的可研、设计、采购、施工、验收等全过程。华网电力公司对市场反馈快,但是资金、技术、管理的短板暴露的十分明显。如何针对华网电力公司实施工程总承包的风险特点,建立一套适用华网发展的风险管理体系是提升工程总承包管理能力的关键。本文以全面风险管理模式为切入点,尝试建立一套切实可行的工程总承包风险管理模式,为其实现工程总承包管理目标提
能源危机和环境污染是当今社会关注的热点问题,也是内燃机行业发展所面临的首要问题,解决这些问题的一个较好途径是研发新的替代燃料。甲醇因其价格便宜、含氧量高、火焰传播速度快等特点被认为是较为理想的内燃机替代燃料。甲醇进气道喷射结合汽油缸内直喷的复合喷射模式能较好实现甲醇和汽油的混合燃烧,而发动机燃烧分析系统能够实时测量缸内压力并进行缸内燃烧过程分析,是复合喷射系统研发的重要支撑。因此,本文以甲醇/汽油
随着计算机网络技术的蓬勃发展,防火墙技术成为重要的网络安全保护组件。尤其是对于嵌入式设备而言,如何确保防火墙的安全性能是备受关注的课题。目前而言,网络防火墙数据包匹配算法以及防火墙策略检测算法还存在一些问题。例如,目前大部分网络防火墙中的数据包匹配算法还是基础的顺序匹配算法,不能满足大型网络防火墙下对过滤性能的较高需求。而目前的防火墙策略检测算法对于处理实际情况下的IP地址任意前缀长度的问题缺乏很
目前,机器学习在网络研究领域得到了广泛应用,但是研究人员使用的网络环境不一致,导致算法结果难以复现,阻碍了机器学习网络研究的发展。目前主流工具ns3-gym利用ns-3作为统一的网络仿真平台,并使用了 ZMQ套接字实现ns-3和OpenAI Gym的数据交互。但是其数据传输速率较慢,在数据量较大和对传输速率较高的场景下不能够很好地满足要求。并且,ns3-gym使用的OpenAIGym仅针对强化学习