【摘 要】
:
在大数据时代,绝大多数数据并非来自表面Web,多数需求数据是通过超链接互连的Web引擎。相反,宝贵的数据库通常存在于深层网络中,即隐藏的网络-在查询接口后端。自从众多应用
【基金项目】
:
安徽省教育厅高校优秀青年人才支持计划重点项目资助(编号gxyqZD2018131),省级重点自然科学研究项目资助(编号KJ2017A665,KJ2017A666),2019年度安徽高校人文社会科学研究重点项目(编号SK2019A0920)的研究成果之一
论文部分内容阅读
在大数据时代,绝大多数数据并非来自表面Web,多数需求数据是通过超链接互连的Web引擎。相反,宝贵的数据库通常存在于深层网络中,即隐藏的网络-在查询接口后端。自从众多应用程序,如垂直门户网站,需要深入的Web数据,各种爬行方法都是以最小(或接近最小)的成本收获深度Web数据源。在实践中,数据源通常返回前k个对应的值匹配。这使得详尽的数据收集难度增加:高排名的文件将被多次返回,而文件排名靠后的低排名文件出现可能性很小。文章将此问题分解为两个正交子问题,即基于查询和排序的偏差问题,并提出一个基于频率的爬行方法
其他文献
一、模型教学的优点 模型教学可使研究对象直观化、简约化。在新课程改革中模型教学不仅能够让学生在探索科学现象的乐趣中发现科学规律,同时还能帮助学生在领略科学知识的真谛时,更深入地掌握探究生物学知识所必需的思维方法和能力。 二、模型教学的现状 最近新课程教材研究所在部分高中进行的一项调查显示:从未组织学生进行过模型建构活动的教师占调查总数的50%,仅组织过一次的占21%。90%的教师认为模型建构
随着我国公路事业突飞猛进的发展,小间距隧道大量涌现,由于小间距隧道施工受地质条件及地下空间的综合影响,因此对安全施工提出许多技术难题.依托实体工程对水下小间距隧道工程问
随着社会主义市场经济的发展和居民收入水平的不断提高,大学生的消费观和消费结构也发生了极大的改变.文章以淮北师范大学学生为研究对象,采用问卷的形式对大学生的消费情况
以蒸馏水作为吸收介质吸收空气中的甲醛,在常温下进行吹扫捕集,并用气相色谱法进行测定.同时对甲醛的稳定剂甲醇的用量、吹扫捕集的吹扫气流速和吹扫时间进行了优化,并在优化的实
以宁波象山港公路大及桥接线工程中四脚岙隧道为工程背景,基于大型有限元分析软件建立隧道的三维计算模型,对隧道的开挖以及支护进行施工模拟计算,研究其应力场、位移场,并结合现
相比结构的频率,振型反应的信息更加丰富.振型曲率是对结构损伤十分敏感的一个指标;利用简支梁结构损伤前后的1阶振型曲率差对其进行损伤识别,对损伤位置有较好的识别效果,而利用
小学教育阶段是儿童成长最关键的时期,儿童在这个时期不仅长身体、长知识,最重要的是他们形成道德情操、心理品质和行为习惯的最佳时期,也是树立正确的人生观、世界观重要时期。但不可否认的是,由于当前家庭、学校、社会的德育目标还缺乏一体化,很难形成德育的合力,社会、家庭中客观存在的消极因素,潜移默化地影响着学生正确的价值定位和道德理想的完善。作为教师,无法改变孩子成长的社会环境,但可以结合当前品德教育存在的