混合mRMR和改进磷虾群的肿瘤基因特征选择算法

来源 :西北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:justdoitterry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了从高维基因表达谱数据中识别出与肿瘤分类高相关的基因子集,提出一种基于最小冗余最大相关(minimal redundancy maximal relevance,mRMR)和改进磷虾群(improve krill herd,IKH)算法的两阶段混合特征选择算法,即采用最小冗余最大相关算法评价特征重要性以筛选出高相关、低冗余的基因子集,然后,结合改进磷虾群算法迭代寻优对特征进一步提取.采用支持向量机(support vector machine,SVM)算法作为分类器,在6个肿瘤基因数据集上进行实验分析和比较.实验结果表明,文中提出的方法在分类准确率和特征选择数量方面相比其他算法具有更好的表现.
其他文献
2015年英国政府针对其经济统计数据开展了一次独立评估,评估内容涉及英国未来经济统计的需求、国家统计局(ONS)当前的能力建设,以及经济统计管理所依赖的治理框架.评估工作由伦敦政治经济学院经济学教授、前英格兰银行货币政策副行长查尔斯·宾爵士(Sir Charles Bean)负责,在一个由英国财政部、国家统计局和英格兰银行官员组成的小组支持下进行.评估过程中,审查小组曾经向经济统计数据使用者发放问卷,与相关组织和利益相关方举行大量座谈,还与其他国家统计局代表沟通以便从国际视角审视英国的统计制度及其实践,最
行动的前提是监测.为了实现全球各国的一致行动,首先要建立国际标准化的监测体系,帮助、督促各国按照国际标准编制本国的温室气体排放数据.本文将围绕国家温室气体清单的编制问题做介绍:讨论国家温室气体清单提出的背景,梳理《IPCC国家温室气体清单指南》的演变过程及其主要内容,最后简要概括美国和中国的清单编制实务.
19世纪上半叶,概率论这门学科正处于门庭冷落、被一些数学家排除在精密科学之外的时候,俄罗斯圣彼得堡大学切比雪夫创立的圣彼得堡数学学派,以大数定律和中心极限定理的严格证明为突破点,为现代概率论奠定了坚实理论基础,挽救了濒临危机的概率论.在切比雪夫众多杰出弟子中,作为概率论领域最紧密的追随者和最“圣彼得堡化”者当属马尔科夫(Markov,1856-1922).马尔科夫出生于莫斯科东南的梁赞省,5岁时父亲遭人诬陷被迫辞职,因此举家搬迁到圣彼得堡.同期,腿部患上骨结核,10岁经手术治疗仍留下后遗症,这点也与其恩师
对统计人来说,报告的主要内容缺不了各种表格,尤其是各级领导要求定制的各种交叉表.交叉表的学名是高维列联表,能够从特定角度出发挖掘和展示数据中隐藏的关联.报表定制是一门高深的科学和艺术,很多年前就有报表软件公司的专家表示,如果某种制表软件能够在我们这里畅行无阻,那就足以横扫任何一个国家的制表市场了.这么多年过去了,似乎让大家满意的报表软件仍然在建设中?
期刊
“没有调查,没有发言权”是毛泽东同志在1930年《反对本本主义》中提出的著名论断.rn历史的车轮浩浩荡荡,滚滚向前,中国特色社会主义进入了新时代.习近平同志在2017年再次强调:“调查研究是谋事之基、成事之道.没有调查,就没有发言权,更没有决策权.”国家调查队系统自2006年成立以来,经过15年栉风沐雨,奋发图强,2021年迎来了建队15周年.
期刊
延安革命纪念馆馆藏一级文物“毛泽东骑过的马”是军功马,属川马,1960年制成标本(简称小青马).保存中,曾遭受洪水浸泡,多次修复材料的老化,馆藏环境不稳定等因素,导致小青马出现了各种病害,其中裂隙病害最为严重,共8处,严重的长42 cm,宽1.5 cm,危及小青马的保存.通过模拟粘接实验,筛选20%牛皮胶为主要粘接剂,在20℃,湿度30%~40%环境下,借助内窥镜监测,清除裂隙周边泥土,背衬纱布或羊皮,从裂隙边缘注射胶料,用5 cm x 10 cm的镀锌防锈铁片按压,纱布绑缠固定48 h后,去除铁片和纱布
新词的有效识别是文本预处理过程中一项非常重要的任务,关系到分词效果的好坏.针对传统新词发现方法未考虑单字新词的识别,且忽略了上下文句法结构与语义信息对新词识别结果的影响,提出一种统计量计算结合相似性判断的网络新词发现算法.首先,基于字的粒度,依次计算单字词频、最大增强互信息和加权左右邻接熵,从左向右逐字扩展多字词,获得具有高成词概率的候选新词集合;再利用基于句法与语义的改进相似性计算模型,得到语句相似度,过滤无效新词.对比实验结果表明,该算法能够有效识别新词,相较于传统新词发现方法具有更高的准确率、召回率
经典历久弥新,雅言浸润人生.翻开儒家经典《论语》,开篇第一即:子日:“学而时习之,不亦说乎?有朋自远方来,不亦乐乎?人不知而不愠,不亦君子乎?”简简单单的三个反问句,揭示出做人做事做学问的准则.细细品来,统计工作,从《论语》开篇中能够得到更多的启示.rn“学而时习之,不亦说乎?”——要持续钻研统计专业知识,并且经常温习巩固和实习演练,不断提升业务本领和工作水平,不是一件很开心的事吗?
期刊
针对红外图像在分割过程中容易产生过分割和边缘断裂的问题,该文提出了 一种联合最大熵的改进Niblack红外图像分割算法.首先,根据图像的像素矩阵确定邻域窗口,再利用图像整体与局部的灰度值信息选取修正系数,改善了传统Niblack参数选择方法的不足;然后,通过局部邻域熵确定背景因子,实现图像的背景分类;最后,采取最大熵法和改进的Niblack法对不同类别的图像进行分割.实验证明,该文算法和Niblack法、OTSU法、最大熵法和分水岭法相比,分割交并比IoU平均值为0.833 5,相比该文其他对比算法均有所
在时间矩阵分解方法的基础上,利用概念漂移检测捕获随时间动态变化的用户兴趣和项目偏好特征,可以有效提高个性化推荐算法的准确性.为此,该文提出特征漂移约束(feature drift constraint,FDC)算法,首先,根据输入样本的评级反馈构建评级矩阵的时间序列,采用矩阵分解方法将评级矩阵分解为用户特征矩阵和项目特征矩阵;其次,在输入新的评级样本后训练模型,采用随机梯度下降方法获得优化的学习参数,计算概念漂移的动态特征加权用于调整模型;最后,结合用户兴趣特征向量和项目偏好特征向量内积计算得到预测的项目