基于矩阵填充和岭回归模型的抗癌药物敏感性预测

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yczcjlk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精准医疗是治疗癌症的必然趋势。如何从庞大的数据中挖掘关键信息,根据遗传信息等特性预测抗癌药物的治疗效果或毒副作用,及时为患者提供最合适的治疗方案,是精准医疗的意义所在。实际上,抗癌药物敏感性数据(通过实验检测的细胞系药物药理学反应数据)往往有空缺元素、大的误差甚至是损毁等现象,使得数据在分析处理时难度加大。聚焦上述问题,本文基于癌症药物敏感性基因组学(GDSC)和癌细胞系百科全书(CCLE)两大经典数据库,建立矩阵填充、岭回归以及矩阵填充—岭回归加权预测模型,对抗癌药物的敏感性进行有效预测,为抗癌药物的筛选提供理论依据。首先综合考虑药物敏感性数据之间的关系,将抗癌药物敏感性预测问题转化为矩阵填充问题,建立矩阵填充预测模型。采用OptSpace算法,结合十折交叉验证方法,通过计算预测值与观测值之间的皮尔森相关系数确定模型的最优参数。矩阵填充模型取得了很好的预测效果,结果均高于流行的“细胞系网络模型”、“药物网络模型”和“细胞系—药物双层网络模型(即细胞系网络模型和药物网络模型的加权组合)”。基于假设“基因表达谱与药物敏感性数据之间存在线性关系”,论文接下来将基因的表达谱数据作为输入特征,建立单个药物岭回归模型,借助十折交叉验证和皮尔森相关系数筛选出与药物敏感性相关较强的标志物基因(233~12535个),大大降低了数据的维度。虽然模型预测结果低于“药物网络模型”和“细胞系—药物双层网络模型”,但却优于“细胞系网络模型”。此外,每种药物选取岭回归模型的前1000个回归系数较大的基因做了David基因功能在线分析。最后,结合矩阵填充和岭回归结果建立了矩阵填充—岭回归加权模型,实现两者的优势互补,预测效果尤为突出:至少83%的药物,其预测值与观测值之间的皮尔森相关系数要高于“细胞系—药物双层网络模型”。由此可见,矩阵填充—岭回归加权模型可以作为抗癌药物敏感性预测的可选择工具之一。
其他文献
教师和学生是始终贯穿教育过程的两个基本要素,师生关系的性质和模式影响着教育活动的一切环节,师生关系问题成为教育研究的重要课题之一。教学是教师与学生双方都参与的双边
自2009年开始,广东省政府就根据中共中央办公厅、国务院办公厅《关于深化政务公开加强政务服务的意见》和《中共广东省委、广东省人民政府关于加强社会建设的决定》的有关精
先天性遗传病在世界范围内都是治疗的难题,目前很少有手段能够治愈这种人类天生带来的疾病。本文主要介绍一种新型的诊断遗传疾病的技术——染色体检测技术,论述该技术目前的
基于税收之债理论及时效制度的法理相通性,海关追补税的时限设置可借鉴但不可完全照搬民法的诉讼时效,须充分考虑海关追补税行为的公法属性及海关执法的自身特点。对于核定时
社会主义新农村建设是一项长期而艰巨的任务,促进农民生活富裕、农村经济发展是新农村建设的重中之重。各地政府为了抓住发展先机,积极采取各种措施调整农业结构、发展致富项
信息技术在课程内容、课程教学方式等方面对地理课程的实施产生了越来越重要的影响,新课程要求重视地理课外活动教学, 《课标》中提出“重视地理问题的探究,提倡自主学习、合
在我国社会全面深化改革和社会主义市场经济体制下,农村经济得到前所未有的发展,新农村建设使基层干部获得更多的资源控制和谋求私利的机会。“村官”虽小,一旦蜕化,仍会严重
新世纪以来,我国少数民族电影创作取得了新的突破,但与普通观众的距离越来越远:很难进入院线公映,很少进入公众视野;即使进入院线,也很少会有观众问津。这一现象引起我们的思
在调查和研究洪泽湖区最近10多年的船舶事故原因和有关因素的基础上,明确引起洪泽湖区船舶事故的主要因素是风浪.根据湖区的环境因素,综合计算在正常水位条件下5个风级、8个
针对厂家在电缆桥架结构设计上应如何符合规范所面临的困难,对电缆桥架的设计方法进行了讨论,并建立一种快捷方法。设计人员可以参照该方法进行强度、刚度和稳定性设计;同时