核受体蛋白、生物荧光蛋白的预测算法研究

来源 :内蒙古农业大学 | 被引量 : 1次 | 上传用户:fangdong520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核受体(nuclear receptors,NRs)是配体依赖性转录因子,通过与配体结合而调控基因表达,它们是一类扩散并能与特异性配体结合的细胞内信号蛋白。核受体(NRs)对机体的生长发育、分化和新陈代谢等多种生理过程发挥重要功能。研究其功能和作用机制可以预防和控制许多疾病。  生物荧光蛋白(Bioluminescent Proteins,BLPs)是活的有机体,在不同的细胞过程中可发射生物荧光。它的发光原理被广泛应用在细胞内基因调控、监测和免疫。生物荧光蛋白的生物技术在医疗领域有很多应用。  本文所研究的核受体蛋白数据集和生物荧光蛋白数据集采用已发表文献中的可信数据集,选取氨基酸组分信息、二肽组分信息、伪氨基酸组分信息和物理化学特征组分并结合随机森林算法、支持向量机算法、加权K邻近算法,在5折交叉检验下分别进行预测。对核受体蛋白,采用两层分类器进行预测,第一层分类器预测是否为核受体蛋白,成功率达到96.84%,第二层分类器针对核受体蛋白的八种生物学功能进行分类预测,均取得了较高的预测成功率。在此基础上,选取各种特征参数对生物荧光蛋白数据集进行预测,当选用伪氨基酸组分信息作为特征向量结合支持向量机算法对生物荧光蛋白进行预测时,总体预测准确率最高为74.12%。
其他文献
水稻既是我国三大粮食作物之一,又是基因组学研究的模式材料,在生产实践和科学研究中都具有极其重要的地位。基因组学研究取得的巨大成就以前所未有的深度和广度推动了生命科学各个研究领域的飞速发展。水稻基因组的破译是水稻科学研究的重要里程碑,同时也宣告了功能基因组学时代的到来。蛋白质组学是研究细胞内全部蛋白质的动态表达及其相互关系的新兴学科,是功能基因组学研究的重要组成部分和战略制高点。本论文以籼稻93-1
植物雄性不育在杂种优势利用中具有重要作用,开展植物雄性不育发生的机理研究对其利用具有重要的指导意义。大豆核不育突变体CT-2s由大豆品种南农CT-2天然突变而产生,本文对CT-2s开展小孢子败育的细胞形态学和不育基因的SSR标记研究,主要结果如下:压片和石蜡切片结果表明CT-2s小孢子从单核居中小孢子期开始出现败育,到单核靠边小孢子期时败育更为明显,不能进行有丝分裂,从而不能形成包含一个生殖细胞和
MB-N(Microbial biomass N,简称MB-N)和MB-P(Microbial biomass P,简称MB-P)对土壤中N、P的植物有效性及循环的影响很大,通过对微生物量的研究可以了解N、P的动态以及土壤肥
前庭系统是脊椎动物高度保守的感觉系统,对保持身体的空间位置、姿势平衡,调节肌紧张及协调眼球运动、自主神经活动的调节等起着重要作用。前庭系统由前庭器官、前庭感受器、前
隐花色素是植物的一类重要蓝光受体,它通常由一个小的基因家族编码。在本研究中,通过综合运用简并引物PCR、Southern杂交和生物信息学方法,揭示了小麦CRY基因家族的组成为CRY1a,C
聚羟基烷酸酯(Polyhydroxyalkanoic,简称PHA),是目前世界上发现的唯一由微生物完全合成的一种热塑性生物高分子材料。PHA与化学合成塑料相比,除具有良好的热塑性、易加工成型、
本实验分别以江西农业大学自选的恢复系昌恢121,昌恢606,昌恢891,昌恢T025选作为母本,以华中农业大学提供的转基因恢复系明恢63Cry1C,63Cry2A,明恢63Cry1C+2A,明恢63Cry1Ab+2A,明恢63Cry1Ab+1C为父本,经人工杂交得到F1,并分别以昌恢121,昌恢606,昌恢891,昌恢T025为轮回亲本进行回交。回交7次,再自交两次,在此过程中采用试纸条法,室内人
昌恢T025是优异的籼稻恢复系,亦是超级稻品种五丰优T025的父本;Habataki是从日本引入的优良籼稻品种,二者杂交存在明显的杂种优势。为挖掘Habataki与昌恢T025杂交中的优势位点,本
昆虫杆状病毒表达系统(BEVS)作为一种优秀的真核细胞表达系统,具备插入大片段外源基因的能力。同时昆虫杆状病毒表达系统所产生的蛋白与人体蛋白的表达修饰(磷酸化),生物活性及
L-阿拉伯糖异构酶(L-Arabinose Isomerase,L-AI)是生物法异构化D-半乳糖为D-塔格糖的关键酶。本研究从腌菜和泡菜中分离出一批乳酸菌,经纸色谱法初筛和改良半胱氨酸咔唑法复筛,获得1株粗酶酶活达13.95U/m L的高产D-塔格糖的乳酸菌,通过NCBI进行16S rDNA序列比对及生化特征分析,鉴定其为植物乳杆菌并命名为WU14。上传这株菌株部分16S rDNA基因序列至NC