【摘 要】
:
蛋白质是调控生命活动的重要分子,翻译后修饰(简称:修饰)是蛋白质功能的重要调控机制。发生在特定氨基酸残基的磷酸化、琥珀酰化和棕榈酰化等修饰,通过动态改变蛋白质的构象、活性和亚细胞定位,参与几乎所有生物学过程。蛋白质修饰与功能的异常则与人类疾病的发生发展密切相关。因此,系统整合蛋白质修饰与功能相关的生物医学大数据,利用以深度学习算法为代表的前沿人工智能技术,设计、优化和完善修饰底物、位点和功能预测的
论文部分内容阅读
蛋白质是调控生命活动的重要分子,翻译后修饰(简称:修饰)是蛋白质功能的重要调控机制。发生在特定氨基酸残基的磷酸化、琥珀酰化和棕榈酰化等修饰,通过动态改变蛋白质的构象、活性和亚细胞定位,参与几乎所有生物学过程。蛋白质修饰与功能的异常则与人类疾病的发生发展密切相关。因此,系统整合蛋白质修饰与功能相关的生物医学大数据,利用以深度学习算法为代表的前沿人工智能技术,设计、优化和完善修饰底物、位点和功能预测的计算方法,能够为进一步实验研究和临床实践提供重要的参考信息。本文中,我们围绕蛋白质琥珀酰化位点预测,整合赝氨基酸组成、k-间隔氨基酸对组成、正交二进制编码、氨基酸指数、自相关函数、分组打分系统和位置特异性打分权重共7种序列特征,以及可及性表面区域、二级结构和骨架扭转角共3种结构特征,结合“深度神经网络”算法和传统机器学习算法“惩罚逻辑回归”,设计了“混合学习”(Hybrid Learning)新框架,构建了相应的计算工具Hybrid Succ,实现了0.885的综合预测性能,准确性比已有方法高17.84%–50.62%。我们进一步设计了“渐变概率密度分布”统计方法,结合Hybrid Succ预测了370个潜在影响琥珀酰化的癌症突变。围绕棕榈酰化位点预测,我们设计了“图像表征系统”(Graphic Presentation System,GPS)算法,构建了GPS-Palm软件,提出了“数-图转换”和“数据质量定量评估”两种新策略,将质控之后的位点数据转换成图像数据,再利用图像识别算法“并行卷积神经网络”进行预测,实现了0.855的综合预测性能,准确性比已有算法高31.3%。我们还应用迁移学习技术开发了GPS-PBS软件,能够准确预测磷酸化蛋白质结合结构域特异性结合位点。近期,我们整合了公共数据库中的基因组、转录组、蛋白质组、表观组和药物-靶标等多个层次的大数据,系统开展了液-液相分离相关蛋白质的功能分析,推测重要突变通过改变蛋白质的相分离参与人类疾病发生发展的潜在机制。疫情期间,我们与合作者联合开展了新冠患者血浆样本的定量蛋白质组分析,利用机器学习方法设计了“新冠标志物组合优化”(Prioritization of Optimal biomarker Combinations for COVID-19,POC-19)算法,预测并验证了11个新的分子标志物。此外,我们收集、整合和注释了1,521例新冠患者的胸部CT影像和临床诊断大数据,构建了综合数据库i CTCF,设计了“基于混合学习的新冠无偏预测”(Hybrid learning for Unbia Sed predic Tion of COVID-19,HUST-19)人工智能诊断软件,实现CT影像学和临床诊断数据的高效融合。该系统不仅可准确判断患者是否罹患新冠肺炎,还可以精确预测病情的严重程度及潜在死亡风险。从新冠临床数据中,我们预测了多个与患者生存显著相关的蛋白质标志物,为新冠诊断、病理机制探索和药物靶标发现提供了重要线索。综上所述,我们整合了序列、结构、组学、影像学和临床检测等不同类型的复杂数据,设计了以“混合学习”为代表的人工智能新框架、新技术,初步实现了蛋白质修饰与功能的精准预测,为后续实验研究提供了重要的计算工具和参考信息。
其他文献
水电机组作为重要的清洁能源生产装备,其安全稳定运行直接关系到电站乃至整个电力系统的安全稳定。为大型水电机组配置状态监测与故障诊断系统支持机组运维科学决策已经成为学术界和业界共识,其中基于振动信号的方法最为有效,应用也最为广泛。水电机组是一个强耦合、复杂非线性的系统,其振动受到机械、水力、电磁等多种因素的综合影响,此外由于水电机组承担电力系统调峰、调频任务,运行中经常启停,工况切换频繁,其振动信号表
由于软物质(软材料)在软体机器人、柔性电子和柔性医疗器械中具有广泛应用,其制备工艺和力学性能近年来得到了巨大提升。为了使软体结构能更精准、更高效地执行功能,相关的力学建模与分析必不可少。在已有工作中,软体结构的大变形行为研究主要借助实验测试和商业仿真软件模拟等手段。实验测试和仿真模拟的手段既降低了力学分析的效率,又难以全面揭示和理解软体结构的大变形机理。软体力学作为一门介于经典固体力学与经典流体力
【目的】收集行新辅助化疗(NACT)后广泛性子宫切除术的宫颈癌患者NACT前后的肿瘤组织,利用七色免疫组化技术,分析NACT前后配对肿瘤组织样本中免疫指标的改变,评估NACT对免疫微环境的影响,探究其与NACT治疗反应性及临床预后的关系,为寻找新的免疫治疗靶点、扩大NACT敏感人群提供理论依据。【方法】收集FIGO分期为IB3、IIA2、IIB及以上期别的宫颈癌患者,患者行1~2疗程的NACT后行
在医疗器械、航天航空、模具等行业,其产品表面光洁度和性能要求不断提升,传统的机械抛光和电化学抛光等技术,已难以满足要求。近几年,高能束微熔凝抛光技术因具有非接触加工、可改善表面性能、易实现自动化等特性而受到广泛关注。但相对于传统抛光技术,高能束微熔凝抛光的相关机理和规律、工艺模型等还有待深入研究。由于微束等离子弧是一种稳定性强、弧柱温度高、能量传递效率高、热影响区小的等离子体高能束,有良好的经济性
超滤不仅可以有效去除水中体颗粒、胶体及病原微生物,还具有高效、节能和操作方便等优点,已成为饮用水安全保障的重要技术之一。然而,超滤膜在运行过程中产生的膜污染仍限制其进一步推广应用。膜前预处理能够改变污染物性质与浓度,从而有效缓解超滤膜污染。本论文以近年来新兴的紫外/过硫酸盐、紫外/氯等基于紫外的高级氧化技术作为预处理工艺,系统考察其缓解超滤膜污染的效能及机理。论文首先选取腐殖酸、海藻酸钠和牛血清白
研究背景:恶性胸腔积液(MPE)是晚期肺腺癌常见的并发症,由肿瘤细胞侵犯胸膜所致。调节性T细胞(Tregs)和肿瘤细胞介导的免疫抑制是MPE恶性进展的主要原因。关于卵巢癌的研究发现肿瘤坏死因子受体-2(TNFR2)高表达在Tregs和肿瘤细胞表面,介导着肿瘤坏死因子(TNF)传递的生物学活化信号,促进微环境中的免疫抑制。但迄今为止,TNFR2介导的信号通路在恶性胸腔积液进展中的作用尚未阐明。研究方
光纤法-珀干涉仪(Fabry-Perot Interferometry,FPI)传感器具有体积小,测量精度高、稳定性好、等特点,被广泛应用在静态参量传感领域,例如测量机翼的应变来监测飞机疲劳状况,对桥梁大坝等大型结构进行健康监测,还能用于化工领域实时监测反应物的折射率和温度。对于法-珀传感器来说,解调精度和灵敏度决定了传感器的探测精度,传感系统的覆盖范围则在很大程度上受到传感器复用容量的限制,在实
集成的高相干性自参考光频梳(Optical frequency comb)在超快精密测距、光学频率合成、光学时钟等领域展现出巨大的应用前景。为实现低噪声且倍频程展宽的光频梳,本文首先研究了基于单晶氮化铝材料的光学微腔,及倍频程Kerr光频梳的产生,并首次展示了基于这种材料体系的单泵浦、低噪声、高相干性的倍频程Kerr光孤子。由于Kerr光频梳的自由频谱范围(Free spectral range,
伴随着数字化在社会应用中的不断深入推进,数据采集自动化、数据治理主体多元化、公共事务复杂化的趋势将不断增强,“合作”的逻辑在理论与实践中也不断凸显。数字技术发展为政府数据治理提供必要的技术支撑与数据资源积累,复杂社会问题催生了跨边界合作的诉求,数据生产要素的概念在国家政策层面得到了进一步明确,数据治理领域的多主体合作成为国家治理改革实践的重要内容。尽管世界各地针对政府数据治理的跨部门公私合作项目呈
基于重金属/铁磁复合薄膜的新型自旋电子器件具备小尺寸、高处理速度、低功耗等优点,是“超越摩尔”时代信息器件的重要组成部分。由于铁磁薄膜上下表面的非对称结构,在重金属/铁磁界面处会产生一种各向异性交换作用,即界面Dzyaloshinskii–Moriya(DM)作用。此DM作用导致铁磁层中形成具有特殊手性的磁畴壁以及Skyrmion等拓扑非平庸的磁结构。同时,界面DM作用也会对铁磁共振(FMR),自