生物学数据集成若干关键问题研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:snsjgl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组测序工作的蓬勃发展以及高通量技术如基因芯片技术、质谱(MS)技术、组合化学和生物化学技术的迅速发展和普及应用,生物数据呈指数级增长。 面对如此迅速增长的生物数据,如何有效管理、准确解读、充分使用这些信息,而不被这浩如烟海的数据所淹没,并从中找到明确的研究方向,已成为生物学发展亟须解决的问题。 然而,由于生物数据的分布性以及异构性等特点,使得从多个数据源获取所需要的信息变得非常困难。集成众多异构的生物信息资源,提供方便、高效地获取高质量的生物学数据的手段,支撑生物信息的分析和挖掘功能,是进行现代生物学研究的前提和关键。因此,生物数据集成系统的研究和开发具有重要的理论价值和实际意义。 本文总结了生物学数据集成研究的现状,对采用数据仓库方法进行的数据集成中的数据抽取和转化、语义相似性的度量、基于Gene Ontology的语义查询等问题进行了研究和探讨,最后给出了一个生物学数据集成系统——BioDW。主要研究成果如下: (1)提出了一种新的半结构化数据模式的表示和数据抽取的方法 在生物数据源中绝大多数数据都是半结构化的,这些数据的主要特点是数据格式多样化、数据元素之间存在着嵌套和局部无序的关系、数据存在缺失和结构的不断变化,这为生物信息的提取提出了严重的挑战。根据生物学数据的特点,提出了一种全新的半结构化数据模式表示方法。该方法将OEM数据模型和正则表达式有机地结合起来,不但能够非常灵活方便地表示各种数据结构,
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
知识产权对象是各种知识,知识产权客体则是知识产权法律制度所保障实现的知识功能,知识产权对象不同于知识产权客体。在知识产权法学领域中,对象、客体的区分有助于系统地界
在我县小麦的种植之中,氮肥一般分两次施用,第一次是在小麦播种时所施用的基肥,第二次则为春季3月到4月间拔节孕穗期时期的追肥。近几年,由于小麦栽培新技术的推广和应用,传
我国民法典侵权责任编(草案)(第二次审议稿)第1010条和第1011条规定了行为人造成生态环境损害的民事责任。然而,生态环境利益作为公益,如何与民法以私益保护为中心的法律体系
本论文主要研究随机2-D线性离散系统的Kalman滤波、白噪声估值器、集员估计与鲁棒随机镇定。 在随机2-D线性离散系统的Kalman滤波、白噪声估值器部分,将1-DKalman滤波推广
对于违反强制性法律规定的合同效力确定,应着重探寻强制性法律规定的规范目的和规范重心。如果强制法律规定针对的是民事法律行为的内容,则违反该规定的民事法律行为无效;如
园艺疗法是一门集园艺学、心理学、医学为一体的新兴边缘交叉型学科,是以植物为媒介的感觉体验与动作体验,集观赏性和调整功能于一体,通过植物以及园艺操作活动来提高人们的生活
本文介绍了生物医学工程(Bio-Medical Engineering,BME)的国内、外产业现状,并就如何加快发展我国生物医学工程产业的必要性和发展对策进行了探讨。
我院应用纳络酮治疗急性酒精中毒取得了满意的临床疗效,现报告如下:1资料与方法2000年~2003年来本院就诊的急性酒精中毒65例,男50例,女15例,年龄20~60岁.饮酒量200~800ml(38~60度
随着计算机、多媒体、信号压缩及高清晰度电视(HDTV: High Definition Television)技术的发展,图像的显示格式变得五花八门,种类繁多,并且各有其相应的标准。每个标准都定义了自