基于类别空间的基因选择

来源 :中国科学E辑 | 被引量 : 0次 | 上传用户:ylfly5257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因选择通常是在基因空间中进行的. 由于基因空间的维数(基因数目)比该空间中的样本数要多得多, 这种做法存在严重的维数发难(curse of dimensionality)问题, 其结果是在基因空间中所建立数据模型难于获得满意的精度, 基于所建立模型的基因选择结果可信度低. 如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题. 将基因空间变换为它的对偶空间, 称为类别空间, 从而空间的维数仅为基因空间中样本的类别数, 空间中的样本数则为基因空间的维数. 显然, 在类别空间中不存在任何维数发难现象; 提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法. 对真实基因数据的基因选择实验, 并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标, 与其他两种基因选择方法进行了深入的比较, 结果表明该方法是十分有效的.
其他文献
当今一些企业采取了多种措施增强投资控制,取得一定的效果,但仍然有个别的项目超投资是比较严重的。从目前的工程项目建设来看,投资控制主要是在项目决策后的设计阶段,把造价渗透
黑龙江省农村社会养老保险制度起步较早,发展缓慢,而农村地区对社会养老保险又有较强的需求。国家发布新型农村社会养老保险试行指导意见,为黑龙江省建立新型农村社会养老保险制
可持续性是当前设计界最重要的议题之一,信息和技术的飞速发展是现代设计教育改革的推动力,互联网的普及潜在地改变了现代设计教育、设计实践和设计消费。本文基于视觉传达设计
选用 9个不同类型的水稻品种 (系 ) ,按双列杂交设计 ( 6× 5 )配成两套亲本和F12个世代的遗传材料 .采用数量性状的加性 显性遗传模型、发育遗传模型比较分析了水稻谷粒重
本院在整体搬迁后,规模和职工数量实现倍增。面临新形势、新任务,医院大力加强党建工作,提高党建科学化水平,引领了医院的快速发展。 After the overall relocation, the si
矿山环境问题,是人类工程活动引发的各类环境问题中最严重的类型之一。矿产资源的开发给人类带来了巨大的经济利益和丰富的物质财富,极大地促进了经济繁荣、社会进步和人类文明