基于图形表示的蛋白质编码区识别方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:ujjih
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的实施和基因组测序技术的快速发展,生物学家已得到几百种生物的全基因组序列,这些序列的背后隐藏着丰富的生物学知识和生物学规律。基因组序列测定之后,识别序列中的蛋白质编码基因是进行基因组分析首先要解决的问题,本论文致力于蛋白质编码区(特别是短编码区)的识别,论文从图形特征和分类算法两个方面对蛋白质编码区的识别进行研究。针对短编码序列的识别问题,论文根据碱基在密码子三个位置的偏性和碱基自身物理化学性质的分类,提出新的序列图形表示方法,然后在新图形上,提取了9个有效的面积矩阵特征,并使用支持向量机对人类的短蛋白质编码区进行识别实验。在识别过程中,为了提高识别率通过递增特征选择算法添加了4个统计特征到面积特征中,使识别特征表达的信息更加完备,并采用PCA方法对这13个特征进行降维。实验结果表明,与其他方法相比,该方法使用较少的特征(7个或4个)取得了更好的识别结果。针对传统支持向量机计算量大,对孤立点和噪声数据太敏感的特点,论文使用最小二乘模糊支持向量机代替传统支持向量机进行编码区识别。论文为最小二乘模糊支持向量机设计了一种新的充分考虑了样本与样本之间关系的样本隶属度计算方法,实验结果表明,与传统支持向量机和最小二乘支持向量机相比较,该方法的识别精度更优。
其他文献
当前我国各级政府在“中国电子政务上程”号召下,都存进行信息化网络建设和办公自动化业务改造,实现政府各级部门之间、政府与政府之间、政府内部的信息网络互联互通,在强化政务
双目立体视觉基于视差原理,主要研究如何从(两幅或者多幅)图像里获取场景中物体的距离(深度)信息。其中一个重要研究问题是立体匹配,即如何在多幅图像中确定对应点。随着大量
虚拟校园是虚拟现实技术在现代教育领域的重要应用,虚拟现实是一个由计算机产生的三维立体空间,用户可以与这个空间中的对象交互,观看以及操作,并可在空间中自由移动,进而产生身临
如何有效分割复杂场景图像,一直是计算机视觉领域的研究热点之一。在分割含有未知噪声及灰度分布不均匀或异质的复杂场景图像时,目前很多分割算法要么无法进行精确分割,要么分割
随着Web搜索日益被人们接受和使用,关键字查询成为了查询文档和网页的最简单、最流行的信息检索技术。由于应用需求的推动,关系数据库上的关键字查询(KSORD)成为近年的热点研
生物特征识别技术是建立在对人的生物特征辨别的基础上的识别技术。基于指纹纹线形态的终生不变性及唯一性,指纹识别技术成为最安全最可靠的生物特征识别技术。自动指纹识别
随着互联网(Internet)的高速发展,在Web信息呈现几何级数增长的情况下,人类的信息来源得到了极大的丰富。在文献管理方面,如何能够快速准确的对文献信息进行收集和管理成为学
近年来,社交网站蓬勃发展并成为当今社会的一个热点。尽管这些网站给用户提供了一系列吸引人的特征,但是遗憾的是,它们倾向于暴露用户的隐私。在本论文中,为了解决社交网络中
移动对象数据库技术是计算机科学的新兴研究领域,主要用来管理随时间连续变化的移动对象,有着广泛的应用需求。随着计算机网络、无线定位等技术的快速发展,移动信息服务越来
表格识别是当前图像识别领域中的一个重要研究课题,由于信息化的普及和表格数据的大量出现,表单数据自动处理技术已经在很多行业和领域中取得应用。表格图像识别技术不仅可以