基于 TIGA -S4 VM 改进算法的蛋白质序列识别方法

来源 :山东大学学报(工学版) | 被引量 : 0次 | 上传用户:z444567059
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对安全的半监督支持向量机( safe semi-supervised support vector machine,S4VM)存在参数选择盲目性、正负样本比例不平衡等问题,建立了基于改进的TF-IDF( term frequency-inverse document frequency, TF-IDF)、遗传算法( genetic algorithm, GA)和S4VM的蛋白质序列识别方法TIGA-S4VM。利用改进的TF-IDF算法提取出蛋白质序列中的特征项,将各个特征项在蛋白质序列中出现的频率归一化后作为识别模型的特征值,并结合GA以及S4VM对蛋白质序列进行识别。实验结果表明,TIGA-S4VM优于其它5个识别方法,即使在训练样本率较低时,也能有效地识别蛋白质序列。
其他文献
在分析手眼标定问题数值特征的基础上,提出一种新的基于非最小化优化的手眼标定方法。采用张量的形式描述手眼标定方程,提出了非最小化优化条件下的代价函数,通过特征计算求
为有效提高交通标志分类的准确度,提出一种融合全局特征和局部特征的多特征交通标志分类方法。首先提取能够描述标志图像内部纹理信息的局部二值模式(local binary pattern,LBP)
在已知城市中压配电网的变电站位置、数量和容量的前提下,提出一种基于密度的改进K均值聚类算法,从初始聚类中心的选择和最佳聚类数K的确定两方面进行改进,并提出基于类间差异度
基于复杂网络理论建立高速公路网络演化模型,并对该模型的度和度分布关系进行分析。分析结果表明,该类型网络最终会演化成无标度网络,具有小世界性特征。为了研究该网络在遭
为了解沥青砂的复杂力学行为,给沥青混合料细观力学研究提供数据支持,将几种沥青混合料的配合比转变为沥青砂的配比,采用自主研发的沥青砂成型装置及流变仪夹具获取沥青砂的
为研究渠河河堤跨河大桥桩基工程对河堤稳定性的影响,采用有限元方法对河堤边坡加固方案及施工过程进行稳定性计算分析。对渠河大桥处渠堤断面图进行概化,构建二维平面应变有
随着特高压输电容量的不断提高,受端电网的短路电流超标问题,特别是单相短路电流超标问题越来越严重。分析单相短路电流的超标原因及其专门限制措施,并对各种限流措施的灵敏度和
重点分析长距离电缆对谐波适应性测试的影响,以空载条件为基准提出基于电缆分布参数模型的海上风电机组谐波适应性远端检测方法。在双馈风机并网负载条件下,分别比较不同电缆长
从长江流域重要地位和管理上的实际需要出发,从流域水资源自然属性的客观要求、解决长江流域存在的突出问题应采取的重要措施、完善长江水法规体系的内在要求等几个方面论证