【摘 要】
:
分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-
【机 构】
:
东北大学信息科学与工程学院,东软集团有限公司商用软件事业部
论文部分内容阅读
分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性.
其他文献
以2-羟基-3-甲氧基苯甲醛为原料,通过烯丙基化反应制得3-甲氧基-2-(2-丙烯氧基)苯甲醛,然后经亚氯酸钠和氨基磺酸氧化得到3-甲氧基-2-(2-丙烯氧基)苯甲酸,再经过酯化、克莱森
<正> 马尾船政局(亦称福州船政局)是洋务运动时期创办的重要企业之一。这个造船厂从1866年创设到1907年停办,经营达四十年之久(后来又曾恢复生产)。无论从投资、规模和成效来
随着全球化的发展,认同危机日益显现,其核心表现为价值认同的困境。价值认同困境已经成为当今学校社会责任感教育不能回避的时代挑战。事实上,价值认同与社会责任感的养成具
本文从天津市北辰区地税局在教育系统内开展个人所得税稽查工作入手,查找行政事业单位中有关个人所得税代扣代缴过程中出现的问题,提出从加强税法宣传、完善存款实名制、完善
本文利用我国A股上市公司2009-2012年的数据,从应计项目盈余管理和真实活动盈余管理两个方面分析机构投资者持股对盈余管理的影响,并结合我国上市公司"一股独大"的实际情况,
地方社会治理不单纯是一个管理过程,也是一个服务供给过程。只有建立完善的基层公共服务体系,社会发展才能充满活力。因此,要着力打造适应扁平化公共服务需求的公共服务供给
介绍某离心压缩机叶轮超速试验台增速系统的设计。采用高速平带和齿轮增速实现两级增速,使得最高输出转速可达到60 000 r/min,并能驱动50 kg级模拟叶轮实现平稳的升速和降速
实施创业教育是大学素质教育的基本内容,也是适应知识经济和建设创新型国家的基本要求。美国大学开展创业教育已有几十年的历史,其成熟的机制和研究成果以及丰富的实践经验,
体育运动的唯一能量形式就是生物能量,其他能量只有转化为这种特殊的生物能量才能进行比赛。训练与竞赛就是运动员生物能量的积累和释放过程。从宏观角度考察,能量的积累和释
为了利用可见光波段和长波红外波段所蕴含的不同信息进行数据融合和实时彩色显示,设计了一种大视场的单通道双光谱R-C结构。双谱光学系统的具体结构为R-C系统加校正镜,采用主