一种基于未知结构网页抽取本体的方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:xiaxia28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Web上数据大多是结构化的,但事先并不熟知数据的结构,因此不能有效地查询感兴趣的数据。提出了一种独立于文本抽取本体的方法,其过程包括表的理解、数据集成和本体生成,其中表理解是搜寻定位兴趣表、识别及匹配属性和值,并形成记录;数据集成是匹配源记录和目标模式;本体卷积是将源记录的数据抽取到目标模式。结果表明这种方法可以通过已知的目标模式有效地抽取未知结构的数据。
其他文献
主要研究标准模型下基于证书的加密方案(certificate-bas edencryption,简称CBE)的通用构造,并给出了两个实现方案。首先,以IND-CCA2安全的公钥加密方案、IND-ID-CCA安全的基于身
基因芯片技术在给人类带来巨大机遇的同时也带来一些挑战。针对基因表达数据的海量性,以及基因类属的不确定性等问题,提出了一种基于伪F统计量(PFS)的模糊属性均值聚类FAMC(fuzzy
软件体系结构元信息组织和管理是利用反射机制实现软件体系结构重用的一个重要问题。提出了一种体系结构元信息模型,以有效地组织和管理支持体系结构重用的元信息。同时,基于XM
计算机系统参数的合理配置能有效提升应用程序的性能。以NFS网络存储系统为例,提出了一种基于统计分析的存储系统性能调优方法,该方法分为关键系统参数识别和关键参数性能优
在Web服务应用中,BPEL是一种基于流程的描述业务行为的语言。为了验证以BPEL构建的应用程序是否满足某些性质,提出了BVM模型来表达应用程序的语义,然后运用模型检测方法进行形式
操作系统等系统软件中的安全漏洞本质上是一种没有满足软件安全性的缺陷。对安全漏洞的检测过程进行深入研究能够使安全测试人员合理分配测试资源,更准确地评估软件的安全性。
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深
提出了一种基于邻域差值的非参数变换立体匹配方法。该非参数变换方法是在图像中选定一个点,然后再找到与这个点水平方向相隔一定距离的一点,以这两个点为中心各选取一个窗口,比较两个窗口中对应像素的灰度大小差异,以这个差异值取代原图像的像素灰度值,这样产生的一个新的图像就是本文方法变换后的图像。将左右图像经过这种变换后,求变换后左右图像上点的匹配来产生立体视差。实验表明,在同等条件下,尤其存在噪声时,该方法
WS-CDL以全局的视角描述了基于交互的各个服务之间的组合方式,定义了公共和互补的可观察行为,以及具有一致见解的顺序规则。但是WS-CDL没有形式化的模型,也没有定义执行过程。提
从入侵响应决策与安全管理的实际需求出发,提出了基于WOWA合成的模糊层次分析法(woWA_FAHP)和基于WOWA-FAHP的网络安全态势评估模型。WOWA-FAHP方法在继承模糊层次分析法优点的