云服务支持的基础教育网络资源挖掘策略的研究

来源 :中国信息技术教育 | 被引量 : 0次 | 上传用户：dlcad

【摘要】

：

【作者】

：

伍晓峰

【出处】

：

中国信息技术教育

【发表日期】

：

2015年7期

【关键词】

：

网络资源基础教育广州市资源搜索引擎网址

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：基础教育网络资源存在着资源分散建设与管理、使用率不高等问题。本文研究分析了云服务对基础教育网络资源的管理优势，依托云服务，提出基础教育网络资源挖掘策略，进而实现搜索引擎和缓存系统，有效地解决了广州市基础教育网络资源利用率低的问题。
　　关键词：网络资源;搜索引擎;缓存
　　中图分类号：G443 文献标识码：A 论文编号：1674-2117（2015）07-0073-04
　　● 引言
　　基础教育网络资源建设是实现基础教育信息化的重要环节，也是建设基础教育公共服务体系的重要内容。近年来，国家各级教育部门投入了大量人力、物力和财力开展基础教育网络资源的建设，在资源的种类、内容、数量和质量等方面均取得了显著的发展，形成了海量的网络资源。用户能否快速、准确查找到所需的资源，对资源的利用率有较大的影响。因此，资源提供者应该对挖掘策略进行探讨。
　　云计算具有超大规模的存储和计算能力，资源和结构具有动态伸缩性，并且通过虚拟化技术和庞大的资源池按需提供服务，这些特点非常适合在网络环境下存储和挖掘快速增长的网络资源。本研究在云服务支持的环境下，采用搜索引擎挖掘和缓存挖掘策略，实现对基础教育网络资源的挖掘，可以使用户从海量资源中快速获取所需的网络资源，从而提高资源的利用率。
　　● 问题的提出
　　广州市现有12个区，基础教育阶段中小学校超过2000所，在校学生近200万人，教职工约15万人。为满足广大师生学习和工作的需要，引领教育发展的方向，广州教育信息化建设始终走在全国的前沿。从2002年开始建设广州教育科研网，铺设光纤总长度约25000公里，接入单位近2000家，联网电脑数在30万台以上，覆盖城乡各级各类学校，成为目前国内规模最大的基础教育光纤城域网。在完善硬件建设的同时，广州注重教育网络资源的建设，从2004年启动“教育e时代”工程开始，市教育信息中心先后购买或建设了多种类型的教育资源。各区也结合自身的优势，探索建设具有区域特色的资源库。详见表1。
　　到目前为止，广州市、区两级教育部门积累的教育网络资源超过100T。形成了共建共享、内容丰富、形式多样的教育信息资源体系。随着资源总量的增大和类型的增多，随之产生了非结构化、异构等问题，导致资源的查找、索引比较困难，优质资源淹没在海量资源中，造成网络资源使用率低。如何利用挖掘技术有效地提高资源的获取速度，从而提高资源使用率呢？
　　● 云服务支持的基础教育网络资源挖掘策略
　　基础教育网络资源包括素材类教学资源，如文本、图形/图像、音视频等媒体素材，以及集成型教学资源，如课件、研究性学习专题、网络课程等。具有内容丰富、数量庞大、增长迅速、覆盖面广等特点。因格式和种类繁多，采用传统数据挖掘方法对此类资源进行挖掘的效果不佳。广州市基础教育网络资源挖掘策略是在云计算环境下，采用搜索引擎和Web缓存两种挖掘策略，来为广州市教育科研网内部用户查找教育资源提供服务。
　　1.广州市教育搜索引擎
　　广州市教育搜索引擎是在参考国内外其他学者研究的基础上，经过实践探索自主研发基于NUTCH实现的全网检索引擎。在教育网络资源挖掘检索方面，该引擎首次采用行业搜索引擎和“垂直”搜索引擎技术，依据自主用途排位的排序算法，通过爬虫和分词关键技术实现对网络资源的挖掘，并对中文分词做个性化处理。其机理图如图1所示。
　　2.缓存挖掘策略
　　缓存技术具有减少网络带宽消耗、降低服务器压力、减少网络延迟等特点。在广州教育科研网出口网关处部署代理缓存服务器，可以充分利用教科网内带宽充足、运行稳定的优势，针对基础教育网络资源采取缓存挖掘策略，以实现对资源的监控、重定向和缓存。缓存技术策略不仅作为教科网内部用户与网内资源服务器之间的桥梁，也是用户与外网资源服务器之间的桥梁。其部署结构图如图2所示。
　　● 云服务支持的基础教育网络资源挖掘的实现
　　1.教育网络资源搜索引擎挖掘策略的实现
　　研究采用云服务下的搜索引擎为工具，以广州市、佛山市、中山市的网络学习资源为研究对象，依据以下八部分关键技术来实现，其实现过程分析如下。
　　（1）教育网络资源网络地址集合分析
　　广州市基础教育网络资源的地址集合由广州市年度教育信息化调查获取的网络地址、广佛同城化教育信息化专项建设时佛山市提交的网络资源地址、中山市教育网络资源地址三部分组成。搜集整理的网络地址集合如表2所示。搜索引擎机器人以搜集的这三部分网络资源网址为入口，理论上，通过超链接的方式，能链接到绝大部分网页。
　　（2）集合地址内容及状态更新操作
　　利用搜索引擎inject操作，调用搜索引擎的核心包crawl对上述教育网络资源地址集合库进行网络地址状态的检查、更新和分析，其主要的操作有：①对每个网址进行格式化和过滤，消除非法的网络地址，设定每个网址的状态，按照一定的方法进行初始化分值;②合并消除重复的网址;③将网址的状态、分值存入crawldb数据库，与原数据重复部分需更新。通过本步骤的操作，将上述教育网络资源网址整理出如表3所示。
　　（3）创建抓取列表并生成对应目录
　　本步骤实现创建抓取网址的列表，并以时间为名存放在segments目录下。其操作实现分为：①从上述crawldb数据库中取出网址并进行过滤;②对网址进行排序，通过网址、链接数和hash宣发综合进行降序排序;③将排列列表写入segments目录中。至此，教育搜索引擎基本完成了网址内容抓取的所有准备工作。
　　（4）页面内容抓取
　　页面内容抓取功能是将网址打开后的具体内容抓取出来，存放在对应的segment目录下。其过程分为：①按照segments目录下的抓取列表执行抓取动作;②抓取过程中页面中的其他网址可能改变，此时更新crawldb数据库中的网址;③为提高抓取速度，抓取程序启动多线程;④抓取操作过程中调用解析程序解释抓回来的数据。通过网络资源库网址页面的内容抓取，至此将所有目标资源库的内容已经抓取到广州市基础教育网络资源搜索引擎库中。

其他文献

四类人吃豆腐要控制

很多人喜欢吃豆腐，但是身体出现以下问题的人，要严格控制豆腐摄入。　　有与肾代谢相关疾病的患者对慢性肾炎、肾衰竭或因肾功能下降出现的肌酐、尿素氮、尿蛋白过高情况患者，需要严格控制。　　高尿酸血症或痛风患者如果尿酸水平高，痛风情况十分严重，需要控制豆腐等较高嘌呤食物的摄入。　　高钾血症、高钙血症患者高钾血症和高钙血症患者，都需严格控制食用豆腐等食物。　　严重泌尿系統结石患者肾结石、尿道结石、膀

期刊

患者血症结石豆腐泌尿系食物

点按阳池穴暖手脚

很多人一到冬季就会手脚冰凉。中医认为，手脚冰凉是三方面因素导致的：第一，陽气不足;第二，血虚;第三，天寒。冬季“阳气内守，不达四末”，容易出现手足冰凉。阳池穴就像身体的“小太阳”，是支配全身血液循环及激素分泌的重要穴位，天冷时多刺激该穴，能畅通气血，温暖手脚。　　取穴：五指伸开，手腕腕背横纹凹陷处即为该穴，前对中指、无名指指缝。　　具体方法：用中指点阳池穴，缓缓向下用力。刺激阳池要慢慢进行，时间要

期刊

手脚冰凉冬季血虚就会就像

胆囊有结晶及时防结石

随着人们生活水平的提高，临床检查发现胆囊胆固醇结晶的发病率有上升的趋势，然而，不少患者对胆固醇结晶不是很了解。　　与早期胆结石的病因类似，胆固醇结晶的发生也与饮食等因素密切相关。不健康的饮食及生活方式造成胆固醇代谢异常、过度沉积，胆囊没有及时将其排尽，其就会沉积在胆囊壁上，形成胆固醇结晶。　　在B超下胆固醇结晶表现为粟米样颗粒，称为“彗尾症”。大部分胆固醇结晶是多发性的，一般在2～3毫米大小，会逐

期刊

胆固醇结晶胆囊结石彗尾症状

有氧运动首选快走

快走是最安全的有氧代谢运动，更是老年人的明智选择。当然，慢跑也不错，只是与快走相比，慢跑更易造成关节和韧带损伤。　　快走也称“耐力行走”，可以使人们获得理想的耐力，不会产生过多有害自由基，也没有损伤骨骼和肌肉的风险。　　但快走也有讲究，走慢了不管用，必须达到“有效心率范围”。20岁的人快走时脉搏应达到120～140次/分，30岁的人应达到115～130次/分，40岁的人应达到110～125次/分，

期刊

快走人应水分耐力损伤的人

行动不便应及时配备辅具

行动不便的老年人应及时配备手杖或助步器，准备应用辅助工具前应咨询专业康复人员，根据承受身体重量的多少、使用原因等情况选择合适的助行设备。比如手杖可以承受身体25%的重量，而助步器可以承受身體50%以上的重量。有轻度平衡问题者可以选择手杖，而有中重度平衡和步态问题者需要选择助步器。　　摘自《健康报》

期刊

手杖重量身体步态健康报辅助工具

揉搓头皮延缓老视

老视是多数老年人必经的生理变化。不过，早期坚持正确的按摩、锻炼，可以起到缓解视疲劳、改善视力的作用。头部分布着很多穴位和神经，经常揉搓头皮，能很好地延缓老花。　　每天早起或洗头以后，用双手手指肚交替着从前往后梳头，用手指肚轻轻按揉头皮，轻敲头部或用木梳轻轻拍打頭部。找出自己觉得最适合的角度和力度，坚持做5分钟以上，每天早起和睡前各1次。　　为了更好地刺激眼部，应以头顶及其下方部位为重点进行按摩，用

期刊

眼部老年人头皮疲劳血液循环视力

何谓脊髓拴系综合征？

我孙子的屁股上长了一个“小尾巴”。带孩子到医院检查后被告知，孩子患有脊髓拴系综合征。请问，何谓脊髓拴系综合征？应该如何治疗？　　浙江温州吴秀芬　　脊髓拴系综合征是一种神经系统疾病，脊髓拴系为先天或后天因素导致异常组织牵拉脊髓，使其活动受限，造成脊髓张力异常增加，由此引发的一系列临床症状和体征，主要包括排尿、排便功能障碍，双下肢运动、感觉障碍，躯体畸形和疼痛。　　脊髓拴系综合征多由神经管发育异常

期刊

脊髓综合征孩子异常小尾巴儿童医院

信息技术与课程整合：回想２００７

2007年，信息技术与课堂整合似乎看不见任何的波澜，曾经的涌动似乎趋于平静，但在平淡之中也映射出了一些理论与实践的转轨。所以，梳理2007年的信息技术与课程整合，我们认为，信息技术与课程整合在实践中逐渐深化，在质疑之中得到升华，在躁动后趋于理性。　　　　一、2007年整合热点：魔灯旋风　　　　盘点2007年的整合热点，不能不提及魔灯（Moodle）的推广与应用，我们可以称之为“魔灯旋风”。魔灯（

期刊

信息技术课程魔灯教师理论计算机

老茧过厚要去除吗？

我因为长期穿高跟鞋，脚趾和足底多处长有老茧，现在老茧越长越厚。请问，是否需要把它们去除呢？　　河南新郑范灿灿　　老茧的学名叫胼胝，是局限性角质增生引起的斑块，好发部位主要是容易受挤压和摩擦的部位，如掌指部位，还有掌指关节的屈侧以及足趾伸侧。表现为黄色或蜡黄色的增厚斑块，扁平或稍微隆起，质地坚实，边界不清楚，表面光滑且有皮纹，局部汗液分泌减少。患者多无不适，严重者可以有疼痛、局部感觉迟钝。　　治

期刊

胼胝老茧角质摩擦部位新郑

眼睛“出血”怎么办？

我早上起床后准备洗漱时，对着镜子一看，吓了一大跳，我的左眼眼白处红了一大片。请问，这是眼睛出血吗？　　四川双流苏建民　　当眼睛血管出现破裂时，表现为眼睛出血，不同的出血部位造成的眼部损伤不一样。若患者照镜子的时候看到眼睛红了一片，多为眼睛表面的浅表血管破裂出血，不会影响眼睛的視功能。早期可冷敷，让出血停止，慢慢改用热敷，促进出血吸收，即可完全恢复。少数血管破裂为眼底出血，指的是眼底部分的血管发

期刊

眼睛血管视网膜眼部红了眼底

云服务支持的基础教育网络资源挖掘策略的研究

与本文相关的学术论文