基于粗糙集方法的癌症基因微阵列数据分类研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:tianbentb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是当今世界上危害人类健康乃至生命的主要疾病之一。科学证明,癌症早期发现对治疗癌症以及延缓癌细胞扩散有极大的帮助。基因微阵列技术的发展,使得癌症的诊断从形态学转向分子层面的研究,为临床诊断提供了一种快速准确的检测手段。然而基因微阵列数据具有“样本小、维度高、基因间具有很高的相关性”的特点,这样就容易造成分类器分类精度低、泛化能力弱、可解释性差等问题。因此,如何设计一种合理的分类机制能够克服上述问题,已经成为当今基因微阵列数据分类研究的热点。粗糙集理论是一种能够有效提取数据的分类信息的工具,它并不需要用户提供先验知识和附加信息,在实现特征降维的同时能够最大化的保留数据集的分类信息,同时对信息的不确定性能够给出良好的度量,而且利用粗糙集方法构建的分类器比一般的分类器具有更好的解释性。因此,利用粗糙分类器来分析基因表达数据分类问题具有良好的前景和不可比拟的优势。本文在总结前人研究成果的基础上,开展了对基因微阵列数据与粗糙分类器的研究工作,主要有以下几个方面:1、对粗糙分类器的分类信息进行描述。在粗糙集粒论框架下,对单个数据集分别给出利用对象刻画属性包含的分类信息和利用属性刻画对象包含的分类信息。2、将粗糙集方法中的两种基本约简策略——基于区分矩阵的策略和基于划分的启发式策略。对两种策略的优劣进行了简要分析,将优点加以融合,针对基因微阵列数据的特点设计了一种能够在稀疏数据中提取数据集规则的方法,以克服粗糙集方法在处理稀疏高维数据训练时间长、泛化能力低的缺点。通过在UCI数据集上的实验可以看出,本文提出的算法相比单纯的基于划分的策略在泛化能力方面有所提高,比基于区分矩阵的策略在时间方面有所提高。经过这样的修改,可以将其应用与基因微阵列数据分类仲。3、设计了一种对基因微阵列数据进行降维的方法,并以此设计了一种基因微阵列数据的粗糙分类器。通过利用主成分分析方法提取出基因微阵列数据中的基因主要表达方向,并以主要表达方向上的投影为中心对基因进行划分,利用规则提取方法提取规则,形成粗糙分类器。通过两常用基因表达数据对粗糙分类器进行检测。实验结果表明,该算法是有效的。本文围绕基因微阵列数据的特点,对粗糙集力法在解决稀疏高维数据的分类问题、基因微阵列数据降维方法等方面进行研究。本文取得的成果为利用粗糙集解决基因微阵列数据的分类问题提供了一种模式。
其他文献
日前,国家发布《国务院关于调整固定资产投资项目资本金比例的通知》,要求自5月25日起各行业固定资产投资项目根据新的“最低资本金比例”执行。对于高能耗的行业如电解铝调
在临床中,由于体质素虚、疾病后期、大病久病之后,气血不足,伤阴损阳,形成虚证,必有脏腑机能衰退,而老年患者尤为明显。笔者以健脾益肾方配合艾灸治疗老年虚证患者35例,收到
本刊讯2007年12月28日,广西华银铝业有限公司氧化铝一期工程投产庆典仪式在革命老区百色市德保县隆重举行。广西自治区党委书记郭声琨等自治区党政领导、中国铝业公 The new
内蒙古道伦达坝铜多金属矿位于大兴安岭南段西坡,突泉—林西Fe(Sn)-Cu-Pb-Zn-Ag-Nb(Ta)成矿带内。工业矿种为Cu、Ag、W、Sn,赋矿地层为林西组砂板岩,成矿期次主要为燕山期,为
国外典型大都市区新城规划建设过程中的经验与教训,能为雄安新区建设提供镜鉴。雄安新区规划应从未来一定时期内城市性质、发展目标、发展规模、土地利用、空间布局及各项建
前沿研究技术进步与能源消费的关系大多基于静态线性模型,而忽略两者之间的动态非线性关系。为此,本文采用MS-VAR模型探究技术进步与能源消费的动态非线性特征。研究发现:技
慢性病引起的高额医疗费用危及我国医疗保障制度的可持续发展。丹麦医疗保障制度的慢性病管理探索取得了较好的健康效果,其中详细规划慢性病管理实施路径和服务内容、严格规
单以水解酸化-生物接触氧化法作为生化工艺处理印染废水已不能满足现有印染废水排放标准的要求,同时采用该处理工艺的已建污水处理厂也在运行中遇到运行成本高、污泥量大、出
在马克思与正义的相关争论中,一些学者立足于狭窄的分配正义或法权正义视角主张“马克思反对正义”。从宽广的社会正义路向来解析“马克思与正义是和解的”,英美学者认可的自
随着人口老龄化趋势的出现,老年人颅脑损伤比例也随着增多。由于老年人的自然保护和防御能力较差,适应性保护机能低下,增加了外伤时的易损性。老年人脑组织呈退化趋势,蛛网膜