基于混合特征选择的水稻抗病基因预测研究

来源 :湖南农业大学 | 被引量 : 0次 | 上传用户:luo2kai3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水稻作为我国的重要粮食作物之一,各类病虫害的侵袭已严重影响了其品质和产量,水稻的抗病性研究意义重大。随着基因芯片技术的飞速发展,利用机器学习方法分析水稻基因表达数据,并从中挖掘水稻抗病基因,成为水稻抗病性研究的新手段。与病虫害相关的水稻基因芯片数据多具样本少、维度高、噪声大、冗余度高等特点,要做到抗病基因的精确预测难度较大。本文针对水稻基因表达数据特点,围绕特征选择模型的构建、水稻抗病基因的预测与抗病基因的功能分析展开了研究,主要结果如下:(1)构建了以mRMR算法和改进的Relief算法作为特征预选过滤器,以SVM分类精度作为评估函数的mRMR-Relief-SVM混合特征选择模型。首先,利用mRMR最大相关最小冗余特征选择方法对基因进行重要性排序,基于支持向量机SVM分类器,序贯引入排序基因并依训练集交叉测试精度去冗余,得特征基因子集A;同时,利用改进的Relief特征选择方法得到指定权重以上的排序基因,基于SVM序贯引入排序基因并依训练集交叉测试精度去冗余,得特征基因子集B;最后,合并两组特征基因子集A和B得到最终的特征基因子集C。(2)基于mRMR-Relief-SVM模型预测水稻抗病基因。在GEO数据集中,选取了水稻东格鲁病基因芯片数据GSE16142和水稻条纹病基因芯片数据GSE11025来进行分析。将原始二分类数据集按2:1比例划分为正负样本均衡的训练集和测试集,考虑模型的鲁棒性,对每个数据集都随机抽样3次,即分别得到3组训练集与测试集。将m RMR-Relief-SVM混合模型应用到上述多个数据的独立预测中,结果表明,新模型所选特征基因子集在多个分类器中均取得了较高的预测分类精度。(3)特征基因的生物学意义分析。对所选的特征基因,使用DAVID生物信息数据库进行生物学意义分析。其中,在水稻东格鲁病特征基因中发现有6个基因同抗病性相关,在条纹病特征基因中发现8个基因同抗病性相关。另外,针对同种疾病不同训练集所获特征基因子集不尽相同,使用分子交互网络分析软件Cytoscape以皮尔逊相关系数构建基因互作网络图。结果显示,不同分组的特征基因之间具有较强的相关性,即组间不同的基因之间存在共表达。
其他文献
育成鸡新城疫是鸡育成阶段需要特别防控的疾病,要从免疫、饲养管理方面分析发病原因,根据临床症状、病理剖检、实验室诊断等作出判断,做到及时、准确防治鸡新城疫。
本文首先对离网型风力发电系统做了介绍,并对蓄电池智能充放电控制器作了总体设计,其次对控制器的实现进行了分析,并完成了离网型风力发电系统智能充放电控制器的设计。
碳化硅(SiC)作为第三代半导体材料,其具有禁带宽、电子饱和漂移速度快、临界击穿场强高,以及耐高温和抗辐射等优良特性,广泛用于大功率、高频、高温、抗辐射电子器件的制造领域。SiC PiN器件在核辐射探测器方面有巨大优势,首先SiC优良的材料特性使器件能在高温和强辐射环境中工作;另外PiN结构灵敏区厚度大,适合高能辐射的探测,因此对SiC PiN器件的研究成为半导体核辐射探测器的热点之一。本文基于离
核能的公众接受性是一个快速发展的交叉研究课题,也是风险认知学科最具代表性的研究主题之一。当前国内学界在该领域仍处于探索阶段,理论水平和研究方法相对落后于国际学术前
随着互联网技术与数字音乐技术的发展,音乐成为了互联网主流应用之一,线上KTV也逐渐流行起来。音效处理对KTV效果起着至关重要的作用,但各种KTV软件音效处理功能会受到移动设
目的观察短期鼻腔给予染料木黄铜(Genistein,Gen)对脑梗死后脑内神经元的影响,为探索治疗缺血性脑损伤的有效策略提供一定依据。方法成年双侧切除卵巢的SD大鼠随机分为假手术
高光谱遥感图像是由机载或星载成像光谱仪对地表在电磁波谱可见光-红外区域获得的窄波段连续光谱图像,可以表示为一个包含二维空间信息和一维光谱信息的三维数据立方体。由于
有关太平天国风琴衙的工作对象,一直被我国音乐工作者错误地解读着。本文根据历史文献,在探讨风琴衙在不同历史时期的工作任务的同时,分析了我国学者没能正确理解太平天国风琴衙
随着人们健康意识的提高,对健康越来越重视,加上我国即将进入老龄化社会,对医药类产品的需求越来越大,对医药类企业来说是巨大的机遇。近年来我医药类企业的取得了一定程度上