基于同义实体识别的Web信息集成

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:zhyj747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识别算法FSE,并提出了一种基于同义实体识别的Web信息集成框架.在医院信息集成测试数据集上的实验结果表明,FSE算法效果优于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度计算的同义实体识别算法.
其他文献
为了满足面向访问验证保护级的要求,研发新一代高等级安全操作系统,我们采用微内核的架构设计和实现了面向访问验证保护级的安全操作系统原型系统(VSOS),并通过设计和实现新的访问
针对模糊聚类需要预知最佳聚类个数的问题,提出了一种新的基于隶属比的聚类有效性指标Vnew,首先根据经典有效性指标的设计思路,充分考虑数据集合的隶属度矩阵特征和几何空间
石油和天然气开发过程中的碳排放是自然过程碳排放量中的重要一部分,而构建基于空间信息系统的碳排放系统有助于实现碳排放数据的实时查询、更新、分析以及共享,该系统采用B/
云计算是一种可以弹性并按需提供资源的技术.在多租户共享数据存储模式下,如何实现数据的动态伸缩存储是云数据管理的关键.针对Saa S应用如何随着租户数量及请求规模的变化而
直流电机具有调速范围广、调速性能平稳光滑、启动转矩较大、易于起停车等优点,特别适合用在调速要求比较高的场合.传统PID直流调速控制在工况变化情况下需要调整参数,过程复
在分析目前航天产品研制面临形势和存在问题的基础上,引入了构建分布式协同设计环境的解决途径,同时针对产品协同设计过程中知识、任务、对象、人员和流程的统一描述问题,提
目标跟踪作为火控雷达的一种重要工作模式,同时是火控系统的首要任务.本文基于HLA构建了可扩展、可重用的火控雷达信号级目标跟踪仿真系统.依据火控雷达闭环、连续跟踪与自动
针对纸张平整度测量,研究和提出了基于四步相移法的面结构光三维测量方法.首先,DLP投射正弦条纹图像到待测纸张表面,光栅条纹以1/4周期为步长平移扫描.然后由相机采集经待测
伴随移动互联技术的迅猛发展,为了让广大客户享受快速优质的运输服务、建立高效的沟通方式、提升可视化体验,构建了物流企业的微信化运营模式,并据此设计和实现了一个微信下
现代高能物理研究需要使用高能量的粒子加速器,加速器束流动力学模拟软件具有重要的实用意义.介绍了一个3维基于MIC的异构直线加速器并行束流动力学模拟软件NEWBEAM-MIC的开