头颈鳞状细胞癌的分期及存活问题的特征建模算法研究与开发

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yl723694886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会以及网络的发展,人们会在日常活动中产生越来越多的数据,很多研究人员已经利用这些数据做了大量研究,比如,一些购物网站上的推荐算法,利用某个消费者以往的消费记录,可以预测此消费者可能需要的产品。商家也可以利用很多消费者的消费记录进行分析,以帮助制定合适的产品套餐。数据在当今的社会已经成为一种很重要的资源,利用数据可以挖掘出很多重要的信息。人体本身也带有很多数据,那么是否可以利用这些数据挖掘出一些重要信息,常见的基因方面的数据有转录组数据,以及甲基化数据等。转录组数据主要用来研究在单个细胞、或者特定类型的细胞、组织、器官或者发育阶段的细胞群内所产生的各类RNA(通常是m RNA)分子的类型和数量。转录组数据测量的是在某个特定样本里表达的基因丰度及其类型。其中,m RNA的丰度是指每个细胞里每一种m RNA分子的平均数。甲基化一般是指在酶的作用下,DNA胞嘧啶以特定方式被甲基化修饰。目前已经有多个研究发现,DNA甲基化水平以某种方式影响人类肿瘤的发生以及发展。检测得到的DNA甲基化水平值可用于判断肿瘤的分期以及肿瘤的预后判断,这对于肿瘤的治疗具有重要意义。在头颈部癌症中超过90%的癌症属于头颈鳞状细胞癌。头颈鳞状细胞癌是世界上十大常见癌症之一,并且存活率也较低。如果能找到与头颈鳞状细胞癌相关的基因标记,并对疾病的分期以及病人的存活时间进行有效的预测将具有重要意义。本文主要是利用原发性头颈鳞状细胞癌的转录组数据以及甲基化数据进行分期以及存活时间的预测。首先,甲基化数据和转录组数据都有上万级的特征,我们利用所设计的算法对合并后的数据集进行特征选择,也就是从大量特征中选择出对区分头颈鳞状细胞癌分期有用的特征。同时,由于数据样本类别分布不均衡,也就是处于Ⅳ期的样本数量最多,大约占总样本数量的60%,所以,我们设计算了“OROO”方法解决这个问题,提高预测效果。本文在进行特征提取以及参数优化后,从原来上万级的特征中选择出了154个特征,在这154个特征中,有144个特征属于转录组数据,有10个特征属于甲基化数据。最终,我们以较高的准确率预测了头颈鳞状细胞癌的分期,其中平均绝对误差为0.027、准确率为97.98%。同时也证明了我们选择出的特征与头颈鳞状细胞癌的分期密切相关。接下来,我们利用挑选出的特征再次经过特征选择,选择出了31个特征,以14.175个月的平均绝对误差预测了样本的存活时间。同时也说明了,这31个特征与存活时间密切相关。此实验对于头颈鳞状细胞癌的研究以及制定合适的治疗措施具有重要意义。最后,利用本文中提出的SFMC方法进行头颈鳞状细胞癌的二分类分期预测,并与目前的头颈鳞状细胞癌的二分类分期预测效果进行了比较,我们的实验方法取得了更好的预测效果。
其他文献
新兴市场企业升级和创新的最优路径是从简单的原始设备制造出发,经由原始设计制造,最终实现完全自主的原始品牌制造。在原始品牌制造产业模式下,供应链中的原始品牌制造商与
水液代谢虽与肺、脾、肾、心、肝、膀胱、三焦、小肠等脏腑有关,但遗尿病位在膀胱,根在心肾。阎兆君教授治疗从心肾入手,在交通心肾的基础上注重醒神强志,处方醒神强志方:桑
煤矿的安全管理一直是煤炭行业关注的重点。煤矿企业频发的事故很多都是因企业内部的生产管理组织产生的错误所致。基于此,同煤安全管理监察局较为系统地分析了煤矿企业安全
随着互联网技术的发展与普及,大批专门从事电子商务的小型企业相继诞生并快速成长。然而与之相对应的是,大量小型电子商务企业后续经营状况步履维艰,直至倒闭。究其原因,只看
以3参量Merchant模型、Poyning-Thomson模型,以及4参量Burger模型为例,推导3种常用微分型本构方程的松弛剪切模量Prony级数形式,并确定其在ABAQUS中的输入参数,供ABAQUS调用
本文较全面系统地回顾了国内外旅游学术界对旅游概念的界定,分析了其演化过程。指出,一直以来对旅游本质的认识都失之泛化,其结果导致实践中旅游概念混乱,也误导了旅游学科建设的
解决“三农”问题始终是中国共产党工作的重心。近年来,中央不断将工作重心聚焦于农村基础设施建设,将农村基础设施的建设作为重点工作,这对加强农村基础设施建设,改善农村生
本报讯 记者蔡立军报道 近期,爱伦斯特钻石品牌全面登陆天津、北京高端市场。爱伦斯特将欧洲悠久古老的文化精髓和艺术传统孕育出的钻石文化引入中国,将完美钻饰呈现给天津、北
报纸
选择具有代表性的福建南靖客家土楼的南向房间作为实验对象,以室外环境和当地砖混民居为对比对象,进行冬、夏两季的热环境实地测试.采用比较的方法,分析3个实验对象的室内热
结合延安大学新校区建设工程,阐述EPC模式下高校基建项目管理的内容及要点,并分别从业主和承包商角度提出EPC模式下新校区项目管理建议,以确保EPC总承包项目顺利实施。