基于元数据和XML的信息抽取与集成技术研究

来源 :信息与控制 | 被引量 : 0次 | 上传用户:g10703107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了得到统一的数据形式以利于数据操作和处理,提出了采用基于元数据的模板定制技术以实现信息抽取的方法.该方法有效地实现对非结构化文本的信息提取,将抽取信息转换为统一的XML格式,然后将XML格式的信息集成到关系数据库中,本方法在某造船厂的企业信息化中得到成功应用,为解决企业的信息集成问题提供了一种面向Word文档的新方案。
其他文献
分析了变压器常规预防性试验存在的不足之处,介绍了广东台山发电厂一期工程变压器状态在线监测方案的设置内容,以及设置变压器在线监测手段的必要性、基本原理及应用经验.
针对水电机组故障多样性和复杂性,提出了一种结合小波包分解理论、BP神经网络和Matlab Web Server构建的水电机组远程监测诊断系统.
针对某些仿射非线性系统中各状态变量间呈微分关系的特点,本文提出仅取某些可测状态变量作为动态递归模糊神经网络(dynamic recurrent fuzzy neural network,DRFNN)的输入,而由
在分析了双目立体视觉中物点定位的最小二乘法和归一化的最小二乘法的原理和不足后,本文给出了公垂线中点法的一种简便的计算公式并给出了相应的快速算法.实验结果表明,与最小二乘法和归一化的最小二乘法相比,本文所提的快速算法不仅计算简单,而且具有更优良的抗噪性.
本文主要目的是寻找到Bagging的一种快速修剪方法,以缩小算法占用的存储空间、提高运算速度和实现提高分类精度的潜力;还提出一种直接计算基学习器差异度的新选择性集成思想.选
针对一类含状态时滞的线性不确定系统,研究具有二次型性能指标的最优滑动模态的设计问题.基于状态方程的标准型,将最优滑模设计问题转化成线性时滞系统的最优控制问题.针对由最优
设计了一种参数识别器和同步控制器,研究了不确定混沌系统的参数识别与异结构同步问题.根据稳定性原理,确定了参数识别器和同步控制器的结构,以不确定Lorenz混沌系统和Rossle
针对时移电视(time-shifted TV)。节目流行度变化剧烈的特点,提出一种改进的最小负载优先(SLF)放置算法.算法以放置更多副本为目标,修改了放置约束,并以双阈值动态调整作为辅助策略,降
以直接序列扩频(DSSS)通信系统为研究对象,在MATLAB/Simulink软件环境下分析了DSSS信号在多径瑞利衰落信道中传输时的抗多径衰落性能.采用Simulink软件构建DSSS通信系统的动态模型
针对冷连轧AGC系统存在较大的时间滞后以及对象模型参数时变的特点,提出了一种自适应Smith广义预测控制算法.该算法用Smith预估器来克服滞后的影响,利用激光测速仪间接测量AGC系统的滞后时间以修正Smith预估器的时滞部分模型,使用渐消记忆递推最小二乘算法在线辨识对象参数来修正Smith预估器的非时滞部分的模型,并根据辨识得到的对象参数设计自适应广义预测控制器代替传统Smith预估算法中的PI