基于Zipf Estimator的Deep Web最佳查询词选择

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:jinsongyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Deep Web的查询中、关键词的选择是一个关键问题。文中针对查询Deep Web中的文本数据库,对查询词的选择作出一些研究。将Zipf Estinator应用于根据查询词的频率选择词条的方法中,提出了用部分文档中的查询词的排序来得出整个文档集中查询词的排序的方法。将Zipf Estimator运用于查询词的选择,减少查询词选择时的运算量,以较少的查询次数得到较多的查询结果。测试结果证明了Zipf Estimator运用于查询词的选择可有效提高查询Deep Web中的文本数据库的效率。
其他文献
旅游外宣翻译具有推动旅游经济发展和对外宣传的双重意义。从公共关系学的视角来看,境外游客的游览需求与兴趣,对旅游外宣翻译具有权威性,是翻译需要考虑的一个重要因素。对
本体作为知识表达的范例工具,依赖于语义来进行逻辑推理。但在本体搜索时依赖于语义进行搜索十分困难。针对当前本体搜索中存在的问题,提出了一种通过拆分概念来获取语义关键词
20世纪90年代,“媒介审判”这一概念传入中国,引发学者讨论。随着社会环境的变化,大众对于媒介审判问题的关注度进一步提升。在学界,部分学者认为“媒介审判”干扰了司法程序
为期5天的第二届联合国环境大会5月27日在内罗毕的联合国环境规划署总部闭幕。会议达成海洋环境治理、遏制野生动植物非法贸易等25个决议和行动计划,助推《巴黎协定》和2030年可持续发展议程落实。在海洋生态保护方面,会议决议指出,据环境署估算当前全球海洋中有5.2万亿块塑料漂浮物,威胁海洋环境和生物多样性,环境署将与各国评估海洋垃圾的治理策略,协助主要源头国和区域制订行动计划。本届大会还在化学废料、沙
编者按:通过摸索全面社会责任管理对一个企业发展的意义,国家电网公司形成了一整套思路、模式。国家电网公司积极探索“全员参与、全过程覆盖、全方位融合”的全面社会责任管理目标模式,在总部、省、市、县4级试点推行。本文从企业社会责任根植项目的角度,探讨企业社会责任管理落地的方式方法,对于电网企业以及希望深入推进社会责任管理的企业颇具参考价值。  开展社会责任管理的终极追求是推进社会责任全员参与、全过程覆盖
在分析C4.5算法原理的基础上,进一步讨论了C4.5算法在决策树的规模控制、属性选择、滤躁和去除不相关属性等方面的不足,讨论了决策树挖掘中对训练数据进行属性约简的必要性。从实
7月2日,环境保护部印发了《环境保护公众参与办法》,这是首个对环境保护公众参与做出专门规定的部门规章,支持和鼓励公众对环境保护公共事务进行舆论监督和社会监督,规定公民、法
播音主持创作是一项实践性很强的工作,主持人在传播中发挥着重要的引导作用。在当前媒介融合日益深化的环境下,本文立足广电改革发展的实践,对作为媒体形象呈现者的主持人需
企业社会责任管理内容是什么?  企业社会责任管理就是要把社会责任和可持续发展理念完全融入一个企业的运营过程之中,融入到每个管理职能中,融入到每个员工的日常工作中,直至融入到公司文化,公司使命和公司的核心价值观中,提升企业经营理念,转变企业经营管理方式,实现企业可持续发展,促进企业与社会的共同可持续发展。由此,我们初步可以考虑企业社会责任管理三方面的内容,如下图所示,包括企业社会责任理念管理、生产运
空间数据挖掘是数据挖掘的一个研究分支。空间聚类分析是空间数据挖掘的一个重要的研究领域。传统的K-均值方法用于聚类具有收敛速度快、算法实现简单等特点,但容易陷入局部最