基于关键词的深度万维网数据库选择

来源 :计算机学报 | 被引量 : 0次 | 上传用户:wuzx5858
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出一种基于关键词的深度万维网查询方法:用户用关键词的方式提交查询,该方法在线地选择能够反映查询意图并且提供高质量结果的万维网数据库.这种方法既避免了深度万维网数据抓取这一代价高、难度大的操作,又可支持多领域的数据库上的关键词查询,从而能够与现有的搜索引擎实现无缝集成.文中侧重于讨论基于关键词的数据库选择,从以下两个方面解决这一问题所涉及的挑战:(1)提出了一种度量关键词-领域属性关联的相关性模型,并设计了基于随机游动的算法从查询日志中发现潜在的关键词-属性关联;(2)给出了一种新的数据采样方法,并用于基于采样的数据库-查询的相关性模型中,最终解决深度万维网的数据库选择问题.在中文深度万维网真实数据集上的实验表明:提出的方法能够有效地选择与关键词查询相关的数据库,提供高质量的结果.
其他文献
<正> 我们研究恩格斯晚年关于历史唯物主义的通信,不难发现意识形态相对独立性问题是他特别着重论述的问题之一。一则是因为当时理论斗争实践的需要,二则是因为以往无论是马
本文将开发性金融引入广西北部湾经济区创业风险投资业发展视野,针对广西北部湾经济区创业风险投资业市场发展滞后的根源——市场主体缺失、市场机制不完善、市场制度缺乏,提
<正> 2000年,我们全县征订《秘书工作》212份,取得了历史性的突破,比1997年增加60%,比以往征订最多的1999年增加30%。我们征订中主要抓好了以下三个方面的工作。一、领导重视,
<正>当前,我国烟草行业的改革和发展进入了一个关键时期。如何自觉适应形势,进一步转变工作作风,改进工作方式,加大服务力度,提高服务质量,是对当前烟草商业企业办公室工作提
目的:研究三聚氰胺对NRK细胞的毒性作用及其作用机制,从而为三聚氰胺的肾毒性作用机理作一补充。方法:用37℃预热的DMEM培养基溶解三聚氰胺,经过稀释得到3mg/ml,2.5mg/ml,2mg/m
本文以城市化率和财政分权为主要考察变量,利用1998—2010年东中西部六省的面板数据对影响地方财政支出结构的因素进行了理论分析和实证检验。结果表明,财政分权使地方财政总
深度万维网(Deep Web)已成为万维网上十分重要的资源,是数据库领域的研究热点.目前已有的多数研究主要集中在深度万维网发现、查询接口集成以及查询结果处理等技术层面.然而
随着大学毕业生人数逐年增加,就业形势日趋严峻,如今迫切需要加强大学生核心就业能力的培养,该能力在大学生成功就业、维持就业和获得晋升中显得越来越重要。本文诠释了大学
天然气作为新能源,在中国一次能源消费中占比只有5%,远远低于全球平均水平的24%。一方面,在节能环保大趋势下,天然气作为重要的清洁能源,在中国发展空间非常巨大。但受制于天
<正> 凸角是实罐生产中出现在一端或二端底盖埋头内侧近卷边处的一种缺陷(见图1),产生于杀菌过程中,虽不造成罐头内容物的败坏,但至少影响外观,造成次品膨胀;有时在杀菌冷却