基于无监督基因选择的癌症分类算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:KurtJohns
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在癌症的治疗中,尽早正确地诊断肿瘤类别性质有助于疗效提高。DNA微阵列技术的发展使得人们可以从基因角度研究癌症诱发和病变的原因,极大地提高了肿瘤类型确诊准确率和癌症疗效。基因数据通常具有高维度,高冗余的特点。一个样本的基因个数可以达到数千甚至数万,但并不是所有的基因都与癌症类别有关,往往仅由少数关键基因决定病变。因此,直接对原始数据进行分类将会受到严重的干扰。同时,高维数据还带来了高昂储存成本和巨大计算量等一系列挑战。所以从原始巨量基因中选择出与疾病分类相关的重要基因,是基因数据分类的关键研究内容之一。当前的基因选择算法多是基于数学方法学习基因数据的结构信息。尽管这些方法在过去的研究中被证实是有效的,但是也不可避免的忽视了算法模型在生物学方面的解释。如何提高基因选择算法在生物学上的意义是基因选择算法重要研究问题之一。针对上述问题,本文工作如下:1)针对自适应特征选择算法在全局结构方面的忽视,本文提出一个在统一框架下进行基因选择和结构学习的方法。具体地,本文设计了兼顾基因表达数据全局与局部结构的回归函数,利用多维放缩(MDS)算法将基因表达数据从原始的高维空间投影到欧式距离相似的低维空间。然后利用稀疏性,在低维空间学习重构系数以期回归残差最小化,从而保持降维过程中原始数据空间的全局结构。最后利用基于样本基因的概率邻域图模型保持数据局部流形结构。通过与当前6个经典无监督特征选择算法进行比较,实验表明所提算法(MDS-AUFS)在5组真实的不同癌症数据集上表现均为优异。2)针对基因表达数据的高冗余特点,本文基于正交约束,对MDS-AUFS施加一种松弛的不相关约束用来进一步筛除冗余基因(UCMAUFS)。所提算法与MDS-AUFS在5组真实的基因数据中进行实验分析,结果表明前者比后者有显著的进步。3)针对当前的基因选择算法缺少在生物学方面的解释,本文基于基因表达数据和基因-生物路径网络关系提出一种基于双网络约束的基因选择算法(DNCGS)。首先,本文设计一种由基因-生物路径引导的基因相关性邻接矩阵,然后利用拉普拉斯算子构造网络约束项加入整体算法当中。第二个网络约束则由概率邻域矩阵来构造,自此完成双网络约束的设计。所提算法与URAFS等五个经典无监督算法在5组真实且不同类型的基因数据中进行实验分析验证。
其他文献
研学旅行作为近几年教育学和旅游学两大领域中的高频词,得益于国家及地方各级教育部门的大力支持与学生日益增长的研学需求、旅行热情,在理论和实践上都取得了丰富的成果。其中历史研学旅行以其综合性特点和独特育人价值往往成为学校主要选择之一,通过历史研学旅行对学生进行理想信念教育、爱国主义教育、革命传统教育和国情教育。但是由于目前历史研学旅行的研究尚处于起步发展阶段,在各地相关历史研学的具体实践中普遍存在着“
学位
随着史料教学的重要性与相关教学方式的不断深入探索,历史教育者对各种可用于教学的史料类型进行了诸多研究并在教育实践中得到显著成效。历史教学中的跨学科交叉也随着新课改理念的普及得到了一定的关注,尤其是文学作品作为反映客观历史的一种载体更是在历史课堂中大放异彩,然而近年来教育研究者对于文学作品在历史课堂中的应用研究主要集中于价值探索层面,其应用策略仍有很大的探索空间。文章主要对文学作品的客观性与主观性进
学位
随着新课程改革的深入,教学模式的研究逐渐受到重视。传统的中学历史教学模式以教师为中心,以传授知识为目的,形成了教师单向传输、学生被动接受的局面,忽视了学生在学习中的主动性。这种教学模式忽视学生能力的培养,只关注到学生知识的学习,不利于学生的学习兴趣、创造性思维和学科核心素养的培养,不能满足新时代我国对于综合性人才的需要。“循环”教学模式的理论基础是怀特海的循环学习理论和母小勇的循环教学理论,具有自
学位
无线携能(Simultaneous Wireless Information and Power Transfer,SWIPT)技术因其能够同时满足无线用户对信息和能量的需求受到无线通信领域广泛关注。但是无线信号天然的开放属性导致了SWIPT网络极易被窃听者攻击造成信息泄露,因此利用协作通信技术提高SWIPT网络物理层安全是当今的研究热点。但是在SWIPT网络中应用协作通信技术也存在诸多问题,如在
学位
无线传感器网络(Wireless Sensor Networks,WSNs)主要是由成本低廉、数目庞大的微型传感器节点之间采用协作互联、自组织的方式构成的通信网络,具有可靠性高、部署成本低廉的等特点。移动汇聚节点的引入,缓解了静止汇聚节点带来的传输热点问题,扩宽了WSNs的应用场景,使得WSNs在军事、医疗、民用等领域得到更加广泛的应用。由于节点自身的能量有限,移动汇聚节点的频繁的位置信息广播会导
学位
随着云存储的发展,越来越多的用户将自己每天拍摄的照片外包到云端,在享受云服务便利的同时,也面临着隐私泄露的威胁。加密技术可以有效保护图像的隐私,然而传统的图像加密方案通常将明文图像加密成为类噪声的密文图像来保护隐私,不可识别的外观限制了它们的可用性,用户必须下载所有上传的密文图像并在本地端解密才能浏览原始图像的内容,这无疑会大大增加用户的传输和计算成本。因此,为了取悦用户,在保护隐私的同时不能放弃
学位
膝骨性关节炎(knee osteoarthritis,KOA)是临床中最常见的慢性退行性骨关节疾病,其主要的病理特征是关节软骨的退变、软骨下骨小梁骨重塑失调和滑膜病变,严重影响患者的生活质量,对家庭和社会造成巨大的经济负担。中药在防治KOA方面具有一定的优势,其中,淫羊藿中有效成分淫羊藿苷对防治KOA具有一定作用。通过对淫羊藿苷从抗炎、保护软骨细胞、抑制细胞凋亡、抑制破骨细胞方面防治KOA作用机制
期刊
中生代是东天山—北山地区地壳演化过程中重要的构造转化阶段,也是一个重要的内生矿床成矿期,形成了一批重要的矿床和矿种。印支期内生成矿时间为250~210Ma,主要形成钨、钼、金、铅、锌、铌、钽、萤石、稀土、花岗岩、银、铼、铁、脉石英等矿床;燕山期内生成矿时间为180~150Ma,成矿规模比印支期小,主要形成钨、铌、钽、铅、锌、铜、金、锑、汞、硫铁矿、萤石、脉石英等矿床。从空间上看,东天山—北山4大成
期刊
中学时代是个体身心加速发展的特殊时期,是从幼稚走向成熟的关键时期,同时也是动荡、冲突、危机频发的“矛盾”时期。伴随着这种新的特点,迷茫与困惑随时都会在中学生身上表现出来,如果对这些心理问题不加以及时地引导,将会导致初中生问题行为的发生。篮球运动作为“三大球”之一,在社会中具有很强的普及性,同时也是初中校园体育中最常见的运动项目。为了探究篮球运动对初中生问题行为是否存在影响,本文运用文献法、问卷调查
学位
显著目标检测旨在模拟人类的视觉注意机制检测并精确分割出图像中具有吸引力的目标,其作为图像预处理方法,已经被广泛应用于计算机视觉的多个领域,如目标跟踪、行人重识别、图像检索等。近些年,显著目标检测吸引了众多研究学者的广泛关注,越来越多的显著目标检测算法被提出。一方面,深度学习强大的特征提取能力使得RGB图像显著目标检测算法在准确定位、精确边缘分割方面的性能得到极大提升。另一方面,人们开始利用具有丰富
学位