关于真核基因受体位点识别问题的研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:heartless850
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核基因受体位点识别问题是生物信息学中的重要问题之一.该文基于智能信息处理技术对受体位点识别问题进行了尝试性的研究,取得的主要研究成果如下:(1)该文建立了真核基因受体位点数据库,对真假受体位点数据各坐标位置的碱基含量进行了统计,计算了各坐标位置与数据真实结果的相关系数.论文对统计结果进行了分析,结果表明在AG碱基上游存在着一段对受体位点识别有重要作用的保守序列,可以帮助识别受体位点.(2)该文提出了基于LVQ网络的受体位点识别模型,该模型的输入是基于4维编码方式的受体位点序列,序列长度为50碱基,每位碱基由4个神经元编码,因此模型的输入层为200个神经元,竞争层神经元取25个,输出层神经元设计为2个,分别对应真实和虚假受体位点.实验研究显示,此模型对测试集中正负样本的识别率分别达到70%和85%以上.作为一种方法,LVQ模型对真核基因受体位点识别具有参考价值.(3)真核基因受体位点识别作为基因识别中的重要环节,一直受到研究人员的关注,研究结果显示受体位点的识别与分支位点有关,然而目前无人将其作为专门的问题予以深入研究.该文从受体位点识别出发,选取了不同的受体位点序列长度,以BP网络为识别工具,对分支位点在受体位点识别中的作用做了深入研究和分析,实验结果表明,受体位点序列的特征信息集中在分支位点一侧,因此分支位点在受体位点识别中具有重要作用.最后,该文在相同情况下对BP网络和LVQ网络的识别性能做了比较,实验表明在受体位点识别问题上,BP网络的识别效果优于LVQ网络.(4)该文提出了一种基于受体位点Motif序列的受体位点算法,首先提取学习组数据Motif序列组成受体位点Motif数据库,然后提取训练组数据Motif序列与Motif数据库数据进行匹配,得到相应的分值,分别取训练组中正样本的最小分值和负样本最大分值作为判别依据.实验研究结果表明,此方法对测试组中的正样本识别率达到85%以上,负样本的识别率达到90%以上.该文部分研究成果发表于《生物物理学报》、《Proceedings of 2004 World Congress on Intelligent Control and Automation》和《第22届中国控制会议论文集》.该课题得到了国家自然科学基金的资助.
其他文献
切换系统是一类重要的混杂系统,具有重要的理论研究价值和广泛的工程应用背景。切换系统的最优控制和随机系统最优控制是目前控制领域的研究热点。而其中的最优切换时间控制问
异步转移模式ATM(Asynchronous Transfer Mode)采用基于连接的快速分组交换方式进行数据传输。它具有多业务传输特性,能同时传送语音、视频和数据等业务。与传统的网络有区别,
该文首先介绍了移动通讯的发展过程,然后介绍了移动通讯网络结构的演进,并重点介绍了第三代移动通讯系统的网络结构.IMS(IP Multimedia Subsystem,IP多媒体子系统)是移动通讯
作为计算机视觉的研究领域难点之一,视觉目标跟踪在视频监视,虚拟现实,增强现实,人机交互,动画运动捕获,视频压缩,视频会议,智能交通,军事制导等方面都有广泛的应用前景,同时目标跟踪也
该文中首先系统地分析了工业以太网的优点和在工业控制中需要改进的地方.CIPS系统是流程工业发展的一个方向.成功的实施CIPS可以提高流程工业企业的综合竞争力.企业的计算机
基于同时设计思想的机电一体化设计突破了传统设计方法的框架,开辟了一种新的设计思想,它对传统的柔性机器人手臂课题提出了许多新的问题与解决问题的新思路.研究基于同时设
进入新世纪以来,我国高速公路呈现出“路网”的建设。如何增强公路运输能力、提高公路管理水平、增加经济效益、降低交通事故和各类自然灾害的负面影响是我们面临的课题和任务
供应链管理是进入21世纪后企业适应全球竞争的一个有效途径,是一种新的管理模式.而供应链的集成是供应链管理中很重要的一个方面,它从整个供应链的角度对所有节点企业的资源
本论文主要以作者设计和开发的基于USB的数据采集与控制系统为研究背景,介绍了USB1.1、USB2.0、USB OTG协议及其相关技术,研究了数据采集和控制系统的数据传输问题,实现了数据采
随着生物技术的发展,发酵过程在国民经济中的地位越来越重要,但由于发酵过程具有高度的非线性、时变性和模型不确定性,关键变量如生物质浓度和产物浓度难以在线测量,离线分析