论文部分内容阅读
尊敬的读者,您好!新的一期“数据分析与计算专栏”在作者和编辑老师的共同努力下,终于和大家见面了!本期专栏推出两篇文章,分别关注“数据驱动”和“语义集成”在具体工作中的应用和发展,希望能为您的研究和工作提供帮助。
在《基于数据驱动的司法公开信息化监管系统》一文中,作者面向司法公开信息化监管的实际需求,以数据为核心要素,将司法公开数据资源分为两类:基础数据资源和社会性数据资源;同时,以数据在监管系统中的流动过程——数据采集、数据整理、数据分析、数据应用、数据安全等为主要逻辑,给出了构建监管系统的三类基础性架构:功能架构、技术架构和业务架构,相关架构均在文字论述的同时,辅以清晰可视的图片说明,数据驱动型处理技术贯穿信息化监管的全过程。本文给出的各类数据驱动型架构,对于构建大数据领域的信息系统,在理论指导和工程实践两个方面,均具有一定的实用价值。
在《基于抽取规则和本体映射的领域XML语义集成》一文中,作者针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法,对于挖掘油气井工程领域中存在的大量的XML文档,提高历史数据资源的有效利用率具有重要价值。与现有同类方法相比,本文提出的WeOWL本体构建方法首先根据抽取规则自动构建局部本体,然后再与领域全局本体进行语义映射,针对特定领域的XML文档WeXML,除了运用与相关工作类似的集成方法之外,还根据WeXML Schema和领域特点,加入了特定的抽取规则和映射方法。依据本文思想构建的WeXMLSemSys原型系统,读取了胜利油田某采油厂2015年的103个WeXML文档,产生了基于领域全局本体的WeDOWL的实例数据,能够有效支持面向语义的数据查询,提高数据的使用效率。
限于学术水平,以上文章定有可进一步完善之处,欢迎各位朋友不吝指正!
大数据时代已经来临,让我们共同为推进数据的分析与计算工作而努力奋斗!
主持人及“中心”简介刘滨,男,1975年生于河北省石家庄市,教授,博士,硕士生导师,河北省青联委员,河北科技大学大数据与社会计算研究中心主任,河北省大气污染防治技术研究推广中心大数据方向负责人、石家庄市电子商务协会专家顾问委员。当前主要研究领域:数据挖掘、数据可视化、网络信息获取等,在国内外重要期刊和国际会议上发表学术论文50余篇,主持国家自然科学基金面上项目1项、河北省自然科学基金2项。
河北科技大学大数据与社会计算研究中心(http://bigdatacn.org/)自2013年1月成立以来,受到了来自“产、学、研、用”各界朋友的关注和支持。中心教师团队共有20余人,其中,博士13名(博士后3名),硕士9名,专业横跨计算机、网络、数学、统计、管理、新闻、建筑、规划、心理、艺术等多个学科,形成了“立足河北作独到研究、面向全国作独立研究”的特色。当前,中心成员承担国家自然科学基金课题10余项,省级课题20余项,横向课题多项。
在《基于数据驱动的司法公开信息化监管系统》一文中,作者面向司法公开信息化监管的实际需求,以数据为核心要素,将司法公开数据资源分为两类:基础数据资源和社会性数据资源;同时,以数据在监管系统中的流动过程——数据采集、数据整理、数据分析、数据应用、数据安全等为主要逻辑,给出了构建监管系统的三类基础性架构:功能架构、技术架构和业务架构,相关架构均在文字论述的同时,辅以清晰可视的图片说明,数据驱动型处理技术贯穿信息化监管的全过程。本文给出的各类数据驱动型架构,对于构建大数据领域的信息系统,在理论指导和工程实践两个方面,均具有一定的实用价值。
在《基于抽取规则和本体映射的领域XML语义集成》一文中,作者针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法,对于挖掘油气井工程领域中存在的大量的XML文档,提高历史数据资源的有效利用率具有重要价值。与现有同类方法相比,本文提出的WeOWL本体构建方法首先根据抽取规则自动构建局部本体,然后再与领域全局本体进行语义映射,针对特定领域的XML文档WeXML,除了运用与相关工作类似的集成方法之外,还根据WeXML Schema和领域特点,加入了特定的抽取规则和映射方法。依据本文思想构建的WeXMLSemSys原型系统,读取了胜利油田某采油厂2015年的103个WeXML文档,产生了基于领域全局本体的WeDOWL的实例数据,能够有效支持面向语义的数据查询,提高数据的使用效率。
限于学术水平,以上文章定有可进一步完善之处,欢迎各位朋友不吝指正!
大数据时代已经来临,让我们共同为推进数据的分析与计算工作而努力奋斗!
主持人及“中心”简介刘滨,男,1975年生于河北省石家庄市,教授,博士,硕士生导师,河北省青联委员,河北科技大学大数据与社会计算研究中心主任,河北省大气污染防治技术研究推广中心大数据方向负责人、石家庄市电子商务协会专家顾问委员。当前主要研究领域:数据挖掘、数据可视化、网络信息获取等,在国内外重要期刊和国际会议上发表学术论文50余篇,主持国家自然科学基金面上项目1项、河北省自然科学基金2项。
河北科技大学大数据与社会计算研究中心(http://bigdatacn.org/)自2013年1月成立以来,受到了来自“产、学、研、用”各界朋友的关注和支持。中心教师团队共有20余人,其中,博士13名(博士后3名),硕士9名,专业横跨计算机、网络、数学、统计、管理、新闻、建筑、规划、心理、艺术等多个学科,形成了“立足河北作独到研究、面向全国作独立研究”的特色。当前,中心成员承担国家自然科学基金课题10余项,省级课题20余项,横向课题多项。