论文部分内容阅读
针对真核生物DNA序列中蛋白质编码区的识别问题,提出基于深度置信网络(Deep Belief Network,DBN)的组合模型。通过信号处理技术对真核生物的DNA序列进行数值转换,并结合统计学知识提取转换后DNA序列的数值特征;利用随机森林对所提取的特征变量降维;用深度置信网络模型对DNA序列分类判别;根据短时傅里叶变换(Short Time Fourier Transform,STFT)技术对外显子区准确定位。在三个标准测试集上比较组合模型与传统Logistic回归模型、贝叶斯判别模型的判别效果,结果