基于希尔伯特空间构造独立性度量辨识基因网研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户：gaoxiaoyu123

【摘要】

：

生物信息学是一门关于生物学数据处理的学科，它将病理研究建立在精确的数据分析和模型构建的基础上，能够推动未来的疾病预测、预防、个性化、系统化等方面的发展，对生物医学产生

【作者】

：

金丽艳

【机构】

：

杭州电子科技大学

【出处】

：

杭州电子科技大学

【发表日期】

：

2014年期

【关键词】

：

生物信息学基因调控网络建模方法因果关系条件独立性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

生物信息学是一门关于生物学数据处理的学科，它将病理研究建立在精确的数据分析和模型构建的基础上，能够推动未来的疾病预测、预防、个性化、系统化等方面的发展，对生物医学产生深远的影响。基因调控网络是生物网络中的一种类型，也是后基因组信息学的主要研究内容之一，它是根据生物信息学的技术和方法以数据分析、建模和推断等方式所研究出的复杂的网络关系。传统的基因调控网络重构方法有布尔网络模型、互信息关联模型、微分方程模型、贝叶斯模型等，在对这几种常见方法的理解与掌握的基础上，本研究提出了一种新颖的基因调控网络重构方法——Hilbert-Schmidt独立性准则(Hilbert-SchmidtIndependence Criterion--HSIC)。HSIC方法通过在再生核希尔伯特空间上构造协方差算子，并以数学的方式推导出协方差算子与独立性、条件独立性的关系，然后以此来辨识基因间的结构关系。它不依赖生物先验知识，并且约束条件少，既不要求数据符合某种特定的分布也无需对数据做线性或者椭圆性等假设，是一种非参数的方法，这使得HSIC方法具有良好的推广性。由于计算手段的限制，统计学利用相关性来描述变量间的关联度，但基因调控网络的本质是基因间相互作用的因果关系，因此无法用相关性来真正辨识基因之间的结构关系。统计独立性比数据拟合度、相关性、模型简单性等指标更接近于对因果关系的描述，通过在再生核希尔伯特空间中定义一个统计量把对原空间统计特性描述的维数扩展到无穷维，这样可以更精确地描述变量间的独立性关系。充分降维方法是根据条件独立性理论提出的一种有监督的学习方法，该方法将寻找有效子空间的思想转化为一个优化问题，并推断出两种优化的度量方法，即行列式法和trace法。本研究通过仿真实验证明这两种度量方法在降维方面均具有良好的可行性与可靠性，说明该方法作为统计独立性的推广性应用能在实际生活中充分发挥作用。同时为了更全面地呈现HSIC方法的结构辨识能力，本研究将HSIC方法应用于DREAM项目中具有不同数据特点的三个挑战： DREAM2Challenge5、 DREAM4Challenge2和DREAM3Challenge4，其中DREAM2Challenge5作为稳态数据的代表，DREAM4Challenge2作为时间序列数据的代表，DREAM3Challenge4作为稳态与时间序列融合数据的代表，而选择DREAM项目作为研究对象是因为该项目的目的是通过研究细胞网络领域中实验结果与理论推断之间的关系来评价在生物学系统中所建立的模型的好坏。在各个挑战中HSIC方法分别与经典的基因调控网络建模方法进行比较，结果证明HSIC方法在辨识准确率以及计算效率上都有一定的优势，从而更完整地验证了HSIC具有良好的基因网络重构能力。

其他文献

基于FPGA的伺服系统力矩负载模拟系统设计

负载模拟系统是伺服驱动系统研制与测试过程中的重要设备,能够显著改善实验条件,加快研发进度,并且有助于降低研发成本。负载模拟系统可以准确、重复的再现伺服系统中的负载力矩,为各种控制算法和控制对象的研究提供实验平台。本文在深入研究负载模拟系统功能和结构的基础上提出了负载模拟系统的整体设计方案,然后以磁粉制动器为加载元件,以FPGA为控制核心设计了一套负载模拟系统。在理论计算和仿真的基础上完成了磁粉制动

学位

机械负载模拟加载磁粉制动器FPGA

基于和声搜索算法的主汽温控制系统的建模与优化

随着火电机组向高参数、大容量的方向发展，其对热工系统的控制要求越来越严格，而主汽温控制一直是热工控制领域的难点问题，关乎着机组的安全经济运行，显得格外重要。本文采用IMC-

学位

主汽温控制和声搜索算法系统辨识参数优化

自抗扰控制技术在超临界机组协调控制系统中的应用

超（超）临界机组是典型的非线性、大时滞与大惯性并存的多变量强耦合系统，这使得机组在大幅变工况下采用常规PID控制方法的协调控制品质变差，影响机组的负荷响应速度，同时易造成主

学位

超临界机组自抗扰控制协调控制

多制式宽带通信信号模拟系统软件设计与实现

为了能够模拟宽带通信系统中基带信号的产生,人们需要研究一种全新的模拟分析方法,从最开始的利用模拟器件来实现,到模拟器件逐渐向数字器件过渡,再发展到利用软件方式实现多

学位

宽带通信多制式信号调制信号模拟基带信号

基于半监督阶梯网络的故障分类研究及空调系统应用

得益于信息化智能化的发展趋势，更多的传感器被部署到工业过程中，这使得工业过程中采集到的过程数据变得更加丰富也更加复杂。因此，基于数据驱动的故障诊断技术在学术界和工业界

学位

空调系统故障分类半监督阶梯网络特征提取多模型融合

基于FPGA的多媒体平台设计

“多媒体”是一种信息传输媒介的综合体，包括音频、图像和文本等表现形式。随着人们对信息渴望程度的膨胀，多媒体电子产品的需求量和更新换代速度大幅上涨。基于市场需求和更新

学位

多媒体片上系统现场可编程逻辑门阵列微C操作系统

基于视觉的运动目标检测与跟踪技术研究

论文以复杂背景下的运动目标跟踪问题为研究对象，从基于目标特征的跟踪与基于目标模型的多摄像机协同跟踪两个方面展开研究。论文研究了基于特征点的目标检测技术与跟踪方法，在

学位

目标跟踪SURFKalman滤波多摄像机接力跟踪

具有储能单元的微电网建模及运行控制方式研究

为了克服电网大面积停电等大事故对电力系统的影响，保证电力系统基本服务的实现，世界多个国家开发了分布式发电技术。但是分布式发电会引起配电线路上较大的负荷潮流变化，增加配电网潮流的不确定性，为解决此类问题专家们提出了微电网的概念。微电网中分布式电源并网时对电网产生的冲击和扰动问题都可以通过微电网的控制解决，同时通过微电网控制还能有效提高分布式电源的工作效率，有利于电网节能降损。本文首先介绍了课题的研究

学位

微电网交直流双母线无缝切换PQ控制V/f控制

测向定位算法研究及测向定位系统软件设计

现有的方向角定位技术在测向算法的实现上有待提高,尽管一些高分辨力测向算法已经提出,但往往由于算法太过复杂而无法在硬件设备上实现。方向角定位的精度对测向误差非常敏感

学位

测向定位GIS地图软件设计

蓄热式加热炉炉温先进控制系统的研究与应用

加热炉是钢铁企业用于钢坯轧制前加热的重要设备,同时也是最主要的能耗设备。加热炉燃烧控制系统复杂,且炉温对象具有大滞后、大惯性等特点,因此,研究加热炉炉温先进控制策略

学位

加热炉广义预测控制串级控制燃烧控制小波神经网络预测控制

基于希尔伯特空间构造独立性度量辨识基因网研究

与本文相关的学术论文