基于支持向量机的DNA序列分类系统的研究

来源 :华北电力大学第五届研究生学术交流年会 | 被引量 : 0次 | 上传用户:wj3722858
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用支持向量机这一新的机器学习方法对DNA序列进行分类,以VB和Matlab为主要工具开发了基于支持向量机的DNA序列分类系统。结果表明:该系统能够动态选择DNA训练样本,待测试样本,以及支持向量机模型中的参数,并根据用户的指定条件动态输出计算结果;对于预测一批已知正确分类答案的DNA序列,系统能够自动统计识别率,以观察参数变化对于算法执行结果的影响。支持向量机能够在概率分布函数未知的条件下对DNA序列进行分类。其中,将DNA序列数字化是设计的一个关键步骤,本文中利用氨基酸出现的概率,得到一组64维的向量组,实现了数字化;训练样本和测试样本均是数据库中的已知样本,这里选择了20组训练样本和10组测试样本,实现一个简单的二分类问题;SVM分类算法采用Matlab语言编写;核函数的选择对实验结果有很大的影响,正确选择合适的核函数也是得到良好实验结果的关键。总之,支持向量机作为数据挖掘的一项新技术,应用在DNA序列分类系统的总体设计中,与传统方法相比取得了相当或更好的结果,使得人们能够在基因组水平上以系统的、全局的观念去研究生命现象及本质。
其他文献
电量的预测对于市场的稳定运行非常重要,特别是对于发电侧:在短期,他们必须在实时市场设置投标价格;在中期,他们要设定合约政策;在长期,他们必须制定扩展计划。神经网络在各个领域中
会议
本文采用基于邻接终点矩阵的最小割集法,对高速铁路牵引变电站主接线进行可靠性评估,并将这种算法用java语言来实现。根据电气主接线图的拓扑数据,利用程序求出该网络的最小路集
会议
针对两台主变或多台主变运行的变电所,如何在负荷变动时能及时准确的投切主变,既能满足负荷的需要,又能使主变损耗小、效率高,达到经济运行的要求,是当今电网调度运行工作的重点。
本文首先介绍了远程视频监控系统的基本概念、应用价值,然后针对某单位的使用需求设计了整个远程视频监控系统的系统结构、模块功能,最后运用VC++语言编程实现了远程视频监控系
本文定义了基于模糊T相似关系的模糊相似类,研究了模糊相似类的性质;定义了广义模糊划分,利用构造性方法和公理化方法研究了广义模糊划分与模糊关系之间的联系,构造了基于广义模
备受关注的奥园集团南沙大盘南沙奥园,于7月21日公开发售。这个集度假、会议、酒店、别墅、公寓和洋房于一体的大型综合性项目,首期推出二区的一线环湖联排别墅,均价约1万元
XLPE电力电缆的温度是反映电缆运行状态的一个重要指标,通过温度不仅能够实时反映电缆绝缘的状态,通过温度也可以得出系统容量的负荷状态,因此对电缆运行温度的监测是现在研究的
会议
由于流域决策方案的评价标准繁多,既有定量又有定性,为了能更好地决策,有必要综合所有的相关因素,本文运用多标准决策分析方法(MCDA)和非精确线性规划模型(IMILP)对流域规划方案
会议
本文通过研究多式联运过程中的各种用时和成本情况,从各种联运备选方案中决策如何在规定的用时内使得运输总成本最小。通过构造时间矩阵进行运算可以得出各种备选方案的多式联
1940年的冬天,冰心同丈夫带着三个儿女辗转来到重庆。到重庆以前,冰心带着孩子们一直住在云南呈贡山的“默庐”之中,而丈夫吴文藻则留在昆明继续人类学的讲座。没想到就在194