DNA结合蛋白—药物结合位点与拟南芥泛素化位点的预测分析

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:nibeibei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物体中一切生命活动的重要载体。DNA结合蛋白可参与调控生物体的遗传、变异和细胞转录等过程,且与许多疾病的治疗息息相关。泛素化作为蛋白质翻译后修饰的过程之一,能使蛋白质的结构更复杂,功能更完善,调节更精细,作用更专一。但由于蛋白质的结构非常复杂,许多蛋白质的功能尚不清楚。因此,采用计算方法研究蛋白质结合位点对了解蛋白质的功能具有重要意义。传统的生物实验方法虽然可以精确识别蛋白质结合位点,但随着生物数据的快速增长,传统的生物实验方法在蛋白质结合位点研究中,往往存在实验成本高、耗费时间长,且无法大规模实现等问题。采用计算方法研究高通量的蛋白质结合位点预测已成为生物信息学的重要研究方向。本研究以蛋白质的序列信息和结构信息为基础,运用机器学习方法对DNA结合蛋白-药物结合位点和拟南芥蛋白泛素化位点进行预测与分析研究,提出了新的预测模型。主要研究内容分为以下两个方面:(1)通过探索PSSM和残基相互作用网络预测DNA结合蛋白-药物结合位点。针对DNA结合蛋白-药物结合位点的预测与分析,本文提出了一种基于蛋白质序列特征和网络拓扑特征的预测模型。本实验数据来源于PDB和sc-PDB数据库,其生物类型包含大肠杆菌、家鼠和拟南芥等。该模型采用位置特异性评分矩阵和残基相互作用网络特征来描述氨基酸残基,并构建基于极端梯度增强算法的分类模型预测DNA结合蛋白-药物结合位点。实验通过比较不同特征、不同机器学习分类模型,以及多种交叉验证方法对比实验的预测性能。实验结果表明,我们提出的方法达到了较好的预测性能。(2)基于蛋白质结构特性和氨基酸物理化学性质预测拟南芥泛素化位点。针对拟南芥蛋白泛素化修饰位点的预测与分析,本文提出了一种Pse Ara Ubi预测模型。实验数据来源于Uni Prot KB/Swiss-Prot和NCBI蛋白质数据库。针对拟南芥蛋白序列数据,从Chou-Fasman参数、氨基酸疏水性特征和氨基酸极性信息中提取特征,并使用Boruta算法进行特征筛选,获得了共30维的最优特征集合,训练模型采用支持向量机作为分类器。通过五折交叉验证实验,提出的模型相较于之前的方法取得了较好的预测性能。并在独立测试数据集上进行了实验验证。该方法有助于为生物实验方法验证拟南芥泛素化位点研究提供支撑。
其他文献
剩余寿命(Remaining Useful Life,RUL)预测是滚动轴承健康管理、预防性维修的关键工程环节之一。近年来,深度迁移学习技术已被初步应用于轴承RUL预测问题,利用不同平台或工况下采集的历史数据提高数据量不足情况下新RUL预测任务的效果,并开始成为研究热点。但是,现有研究中,深度迁移学习模型往往以黑箱模式运行,对于RUL迁移预测的工作机制和影响预测效果的关键因素并不能提供完备的解释,
学位
随着传统的组织形态由金字塔式向扁平化发展,领导授权行为在众多转型企业中普遍存在。城投公司是一类带有政府性质的企业,组织形态上仍表现为金字塔式。在工作环境日趋复杂的今日,单纯的“下级服从上级”的权力分配方式为公司的有效运营以及进一步创造绩效带来了阻碍,公司的领导层需要向下级授予一定的自主决策权,以释放下级员工的工作潜能。通过梳理既有文献,发现学者们讨论了领导授权行为对员工积极工作行为的影响,对于领导
学位
随着社会的发展,国内外出现了越来越多的民办的社工组织,作为新的社会主体的组成部分,在促进社会的全面发展中有着非常重要的作用。民办社工组织可以很好的解决亟需社会关注的群体的问题,是对政府和其他市场主体职能空缺的补充,为社会的和谐稳定提供了重要的支撑。民办社工组织虽然本质上公益的,但因为是非政府性质的,因此也需要创造一定的收益来支持各种服务的正常运行,为员工发放工资奖励等,组织的运行和管理是需要自负盈
学位
在高端机械制造、智能制造等工业领域,关键零配件具有价值大、需求量少、缺货损失大、可再制造等特点。如何实现关键零部件及时供应和减少管理成本为企业的供应链调度管理能力提出了挑战。近年来,机器学习技术带来了全新的解决方案,相较于传统方法,基于仓库业务搭建的数学模型能够构建数据中的潜在联系,立足于多维度的价值评判标准,提供更准确、稳健的库存管理方案。目前库存优化工作仍存在以下挑战:1)在库存优化模型中实现
学位
在日常生活中许多复杂系统都可以抽象为网络或者图,即由节点和边组成的数据结构,例如社交网络、生物网络、电子商务网络等。随着对网络性质的深入研究,人们发现许多实际网络都具有一个共同特点,即整个网络由若干个内部节点连接紧密外部节点连接稀疏的团体组成,这些团体一般被称为社区。社区发现是网络分析中的一项重要任务,主要目的是发掘网络中的社区,它有助于洞察网络的组成结构。良好的社区检测算法可以发现网络中真实的社
学位
建筑业、制造业等传统工业与互联网技术的融合,构成了工业互联网这一新发展理念。国家接连出台相应政策和措施鼓励支持工业互联网的发展。LZ网络科技有限公司正是在这样的时代背景下成立,旗下LZ APP是一款以建筑业全要素、全流程数字协同管理为核心,集合金融、物流、通信等资源的资源共享平台。运营至今,LZ APP已取得不错成绩,但也遇到了困难和挑战。本文旨在对LZ APP的营销策略进行深入探析。为此,首先回
学位
随着大型车辆制造企业高质量发展,企业出售的车辆基数和售后维保订单数量逐渐增多,后市场服务成为企业增加资产收益的利润源泉,受到企业高层管理人员的重视。但由于企业售后配件种类多、规模大、配件库存管理混乱等因素,导致企业运营效率降低,同时加大了企业管理开支和资金占用。为了解决这一问题,企业需要制定合理的安全库存优化策略优化库存配置,降低库存占用,加快配件周转。然而高端核心制造企业产品具有高精尖的特性,配
学位
高考新政策的实行,标志着我国高考制度进入了新的阶段。新高考模式在志愿设置、填报规则和志愿录取等方面都发生了较大变化。在考试科目上,取消了文理分科的方式,采取“3+3”选考的形式;在高考志愿填报方面,由采用“院校+专业”志愿模式转变为“专业+院校”模式。志愿填报方式的转变不仅增加了对考生选科的要求,而且提升了考生的志愿填报数量。这些变化在扩宽学生选择权的同时,也增加了志愿填报的复杂度。大量的志愿信息
学位
无人机由于其成本低、机动灵活、应用方便等特点,已经为不同领域的研究提供了支持。在农业领域,利用无人机航拍获得的农田场景图像具有分辨率高、细节特征多的特点,相比卫星遥感图像而言,其能更加清楚的反应农田地表情况。利用深度学习的方法对无人机农田场景图像进行精准的语义分割,能实现图像的有效解读,可以为作物监测、科学灌溉等方面的研究提供重要支持。本文针对无人机农田场景图像的背景复杂、特点,对现有的经典语义分
学位
精准营销是新型营销模式的一种,通过科学的信息技术与方法,对目标市场进行针对性定位,针对目标受众进行信息传播过程中,提高信息的针对性、衡量性与有效性,从而能够激发目标受众的购买意愿,对目标消费群体的购买行为进行激发,由此使营销目标得到实现。企业在精准营销下的营销成本降低,并且借助于量化的营销过程与可衡量的营销效果,能够明显提高企业的投资回报率。当今社会步入大数据时代,企业面临的市场竞争日益激烈,精准
学位