Deep Web数据集成中的实体识别方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:loveway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
其他文献
从时域、频域两个角度对频率选择性衰落进行了分析,以频域分析为主,建立二径传输的基本模型并以次为基础进行多径传输的理论推倒,并得出了多径传输中的频率选择性衰落和频率与多
研究了一种采用ADI公司的ADF4153小数N分频PLL频率合成器芯片来实现小步进的频率合成器的方法。ADF4153可以实现无线通信系统接收机和发射机中本地振荡器,包括低噪声的数字鉴
ArcGIS Engine具有强大的GIS空间分析功能,利用ArcGIS Engine三维控件Globe开发的三维浏览器,不仅能够快速浏览三维场景而且还具备强大的空间分析功能。文章介绍ArcGIS Engine的关键特征,在Globe控件上开发实现三维浏览器,并实现坡度坡向分析,表面积体积量算,可视性分析等GIS三维分析功能。
由我国“城轨客车龙头老大”——中国北车长春轨道客车股份有限公司为深圳地铁一号线生产的A型地铁客车近期下线。
软件可靠性增长模型(SRGMs)是软件可靠性定量评估的重要手段.测试覆盖率与不完美排错则是两种可有效改进软件可靠性增长模型评估性能的重要因素.将两种不完美排错假设与Logis
频繁子树挖掘在生物信息、Web挖掘等很多领域都具有较高的应用价值.在频繁子树挖掘中引入投影分支的概念,并提出基于投影分支的快速频繁子树挖掘算法——FTPB.FTPB算法充分利用
网格服务是提供一组定义明确接口并遵守一定规范的Web服务.网格服务异常(exception)是指在服务请求、响应和执行过程中可能发生的问题.网格服务异常处理与网格服务运行状态、