基于属性高频字的深网数据库重叠率估计

来源 :计算机工程 | 被引量 : 0次 | 上传用户:LINGBAOLAOLI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在同一领域中,不同Web数据库之间有重叠部分,为估计重叠部分在Web数据库中所占比例,提出一种基于属性高频字的重叠率估计方法。以中文高频字作为起点,迭代诱导属性高频字。通过属性高频字的查询结果计算匡叠部分出现的条件概率,进而估计重叠率。实验证明,该方法的偏差度和波动度都小于5。
其他文献
以对氯甲基苯乙烯(CMS)、苯乙烯、2,2'-联吡啶(Bpy)和CuCl组成过渡金属催化原子转移自由基聚合制备支化聚苯乙烯(BPS)。研究了少量BPS的引入对丙烯腈-丁二烯-苯乙烯共聚物(ABS)熔体流动
目的探讨皮内针联合艾灸疗法对肿瘤化疗患者睡眠质量的影响。方法选取2018年1月~12月在我科进行化疗治疗的肿瘤患者69例作为研究对象,将其随机分为对照组34例和观察组35例,对
防火墙策略是一系列具体的规则集合,策略的制定对防火墙功能的发挥至关重要,不能存在异常情况。为此,研究基于惰性展开的Trie数据结构,利用LE-Trie结构存储规则表,提出一种防火墙
一、改进化学基础知识的输出方式在化学教学中,教师既要注重概念、规律的教学,也应注意概念、规律的形成过程以及化学思维方法的教学;既要注重新知识的讲解,也应注重对旧知识的回
针对非专用网格性能预测调度系统(GHS)中元任务调度算法负载不平衡问题,提出一种启发式动态任务调度策略(H-MM),结合Min-Min与Max-Min的优点,将H-MM植入GHS,结果表明H-MM在时间跨度与
主要结合当前国内城市综合地下管网 GIS对数据的要求 ,对城市地下管网数据的编码、分类、结构等内容进行分析探讨。
享有“天之骄子”、“未来建设者”美称的当代大学生,担负着国家发展与建设的重担,是国家与民族的希望与未来,是国家重要人力资源的组成部分。大学生的生存和生命质量在一定程度
中外教育家都很重视启发式教学.孔子是我国最早提出启发式教学的教育家.他提出了“不愤不启,不悱不发”的著名教学要求,这是启发一词的来源.后来,《学记》中又提出了“道而弗牵,强而
针对样品精密检测工作中影像数据复合处理不足的现状,提出以增加图像信息量为目的的多源影像融合分析方法。在分析电子探针微分析影像特性的基础上,结合新小波Bandelets变换在图像表示方面的自适应多尺度优点,给出利用Bandelets变换来完成EPMA图像快速融合的方法与实现过程,对融合结果进行比较与评价。仿真测试结果表明,该方法具有一定的实际参考价值。
化学是一门以实验为基础的自然科学,实验在教学中占有重要地位.化学实验课教学应遵循先基础后专业、先分散后综合的原则,并且在具体教学中要突出各自的特点,集中精力解决重点、难