基于矩阵分解的circRNA-疾病关联预测

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:sjmaomaoqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息学的发展,具有共价闭环结构的circ RNAs已经被证实在各种生物过程中扮演着重要的角色。Circ RNAs参与有机过程,其紊乱和突变可导致疾病的发展。因此,预测与疾病相关的circ RNAs可以促进生物标志物的鉴别和疾病的预防和治疗。然而,circ RNA在疾病发病和进展中的功能和分子机制尚不清楚。关于circ RNA-疾病关联的研究主要依赖生物实验,而生物实验是耗时且昂贵的。因此,迫切需要一种计算方法来推断潜在的circ RNA-疾病关联。近几年以来,一些将矩阵分解方法与深度矩阵分解相结合的方法已经被提出。但相当数量的相关生物数据没有得到充分的利用,其改进的空间仍然很大。为了充分利用相关生物数据,以及深度矩阵分解算法的应用在预测潜在的circ RNA-疾病关联上得到更好的表现,本文提出了一种基于多源融合深度矩阵分解方法来预测潜在的circ RNA-疾病关联(DMFMSF)。DMFMSF首先选择了几个有用的circ RNA和疾病的相似性信息,然后通过相似性核融合(SKF)进行整合。此外,通过加权K近邻(WKNKN)来消除缺失的未知关联对该方法的影响。最后,通过使用奇异值分解(SVD)和深度矩阵分解来挖掘线性和非线性特征,推断潜在的circ RNA-疾病关联。在两个基准数据集上,DMFMSF的性能通过留一验证法(LOOCV)和五折交叉验证法(5折CV)进行了严格的评估。对于LOOCV,DMFMSF对这两个基准数据集的AUC值分别为0.945和0.938。对于5折CV,DMFMSF对这两个基准数据集的AUC值分别为0.920±0.001和0.912±0.002。实验结果表明,DMFMSF优于现有的几种计算方法。此外,五种重要的疾病,即肝癌、乳腺癌、急性骨髓性白血病、结直肠癌和冠状动脉疾病被应用于案例分析。结果表明,DMFMSF可以作为预测circ RNA-疾病关联的准确而有效的计算工具。注意力机制的优势是可以在深层框架内被用来确定重要因素而忽略不可用因素,使用注意力机制替代深度矩阵分解方法对DMFMSF模型进行进一步优化,从而得到新模型DMFMSF-X。通过LOOCV和5折CV来评估模型性能。对于LOOCV,DMFMSF-X对这两个基准数据集的AUC值分别为0.949和0.941。对于5折CV,DMFMSF-X对这两个基准数据集的AUC值分别为0.923±0.001和0.915±0.001。结果表明,改进模型DMFMSF-X的性能优于比DMFMSF。此外,DMFMSF-X的案例分析表明,该方法在预测宫颈癌、肺癌和胶质瘤相关的circRNAs方面是有效的。
其他文献
上世纪八十年代我国展开了电力市场化改革,自此,电力市场化进程不断推进,有效缓解电力这一基本能源的供需不平衡问题。电力市场化改革是以放开发售电环节,促进市场化竞争,实现资源的最优配置为目标,从而释放改革红利。2002年的电力市场化改革,实行“厂网分开”的方针,将发电企业从电网中分离出来,促进了电力市场的竞争。2015年新一轮电力体制改革,以“放开两边”为方针,放开发售电侧,开展大用户直购电的市场化交
学位
在绿色发展的时代背景下,推进产业结构优化是我国经济发展的重点任务。绿色金融作为绿色发展理念应用于金融业而诞生的重要金融手段,对推进产业结构优化具有重要作用。本文从绿色金融的金融本质出发,就其对产业结构优化的影响进行了研究。首先,本文对现有研究成果进行了梳理,明确了绿色金融与产业结构优化的内涵,结合相关经济学理论厘清了绿色金融对产业结构优化的影响机理。其次,本文通过构建指标体系、选取指标的方法分别测
学位
探究黄河流域新型城镇化与农业现代化的耦合协调状况对于黄河流域城乡一体化的发展、黄河流域生态保护和高质量发展至关重要。构建黄河流域新型城镇化与农业现代化的指标评价体系,在运用熵权法对二者进行测量的基础上,采用耦合协调模型对黄河流域新型城镇化与农业现代化的耦合协调度进行实证分析。研究结果显示:黄河流域新型城镇化与农业现代化的水平呈现逐年上升的态势,二者在空间上均存在差异性,但整体水平仍然偏低;黄河流域
期刊
新中国成立后,城镇化建设经历了爆炸式的增长。现代历史街区在这个过程中承载了城市的记忆,见证了城市的发展。那些建设于二十世纪的居住街区即将面临着拆建或改造的命运。其中不乏有许多具有开创性历史意义的现代历史街区。对于它们的保护大多数是沿用传统与近现代历史街区的保护方式,较少的从现代主义特征及价值的视角进行考虑。面对十四五规划中改造21.9万个20世纪中后期建成的老旧居住街区的艰巨任务,避免现代历史街区
学位
在“2030碳达峰,2060碳中和”的硬性目标和国家大力发展绿色金融,构建绿色金融体系的背景下,绿色金融是否真的能发挥碳减排的作用呢?传导路径是怎样的呢?学术界关于“绿色金融对碳排放的影响”的相关文献大多都肯定了绿色金融对于碳排放的抑制作用,但对于其中的传导路径尚不明确,同时忽视了绿色金融的空间溢出效应。为研究绿色金融对碳排放的影响,本文在理论分析方面得出绿色金融可能对碳排放具有直接影响、中介影响
学位
夏富古村地处世界自然遗产地——丹霞山风景名胜区核心区,村落与自然环境关系融洽,历史人文积淀深厚,尤其以村口的观音石、上天龙及姐妹峰等自然景观尤为精妙独特,是极富吸引力的旅游资源。然而,尽管近年来各级政府对夏富古村十分重视,投入了大量资金和精力,夏富村的发展情况却不尽人意,甚至受到建设性的破坏;因此,发展好夏富村、讲好夏富故事,是迫在眉睫的一步,也是本文研究的目的。诚然,旅游发展可以为传统村落带来经
学位
文化自信是新时代中国特色社会主义发展中的重要命题,对教育领域影响深远。文章从文化创造、文化自觉、文化认同角度解构文化自信的生成逻辑与时代特征,调研新时代高校服装设计专业教学现状:错位发展、多维联动的人才培养模式,方向明确、结构细分的师资养成模式,东西融合、多元互鉴的课程构筑模式。在新时代文化自信引领下,围绕国家文化发展战略、内涵式质量建设、高校智慧教学模式要求,服装设计教学呈现出改革的必然性、紧迫
期刊
身处于大数据时代中,图像描述生成算法研究对信息的检索筛选具有重要意义。图像描述生成系统是一个跨视觉域和语言域的多模态系统,是由视觉目标识别定位、视觉目标区域与语义之间的匹配和自然语言生成三个模块组成。具体流程为,首先通过卷积神经网络提取图像的视觉特征表示图,基于特征图的信息进行目标识别定位。然后将定位后的视觉区域与词典中的语义词之间进行一致性匹配,得到视觉-语义一致的语义词集合。最后利用记忆等序列
学位
行人检测任务在计算机视觉扮演着重要的角色,不仅可以作为单独的应用去实现价值,也可以作为基础去服务其他应用,如姿态估计,行为识别等。在本研究中,将针对遮挡场景设计多中心点预测分支特征提取模型规避遮挡带来的漏检,并辅以通道非极大值抑制策略去除多分支预测带来的冗余检测框,针对小尺寸行人设计触发器注意力机制加强特征图上的行人区域。针对遮挡场景下,本文提出了一种新的边界框编码方法来解决遮挡带来的漏检问题。本
学位
“十四五”是实现我国碳排放达峰的关键时期,也是构建现代能源体系的重要阶段。能源是实现经济发展必不可少的动力源泉,同时也是碳排放的重要来源领域,从而提高能源利用效率是推动我国碳达峰、碳中和的关键举措和内在要求。作为市场型环境政策工具发展至今的有力运用,碳排放权交易试点政策是节约能源利用、实现双碳目标的重点工具。因此,分析碳排放权交易这一市场化环境规制政策对能源利用效率的影响,目前来看在理论和现实两方
学位