信息化教育领域的Web信息抽取技术研究

来源 :天津师范大学 | 被引量 : 3次 | 上传用户:wuxiaoxin888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术和互联网(Internet)的迅猛发展,使Web发展成为一个全球的、巨大的、分布和共享的信息空间,Web作为一个庞大的资源库,给人们的学习、生活和工作带来了巨大的便利。然而面对Web上的海量信息,人们却陷入了“数据丰富,知识贫乏”的尴尬境地。由于目前的Web数据大多以HTML的形式出现,使得应用程序无法直接获取Web上的信息。Web信息抽取技术正是在这一背景下应运而生。本文分析了一些典型的信息抽取系统技术特点,并探讨了在信息化教育中,从学习者的需求出发,抽取个性化的服务信息。本文实现了一个基于文档结构树的个性化信息抽取系统。本系统主要分为两个部分,抽取规则的定义以及抽取规则的执行。在抽取规则的定义阶段,首先将获取的HTML结构的网页进行规范化处理,转换为格式规范、语义清晰的XML文件,生成对应文档的DOM树,然后由用户指定待抽取信息的位置以及对应的目的表的模式,最后根据这些信息生成抽取规则。在抽取规则执行阶段,系统根据用户定义的抽取规则抽取Web数据并将其加载到指定位置的目的表中。
其他文献
目的:以D-半乳糖致衰老小鼠为实验动物,游泳运动为干预因素,观察不同形式游泳运动下D-半乳糖致衰老小鼠骨骼肌线粒体复合体活性的变化情况,探讨不同形式运动对衰老小鼠线粒体
研究生的网络非正式学习在研究生的整个学习生活中占有很大的比重,同时是对研究生正式学习的一个有力的补充和提高,对于研究生的专业发展以及个人知识积累都发挥着非常重要的作
随着知识经济时代的到来,知识越来越成为社会发展的决定性力量。如何管理好知识,使知识的效用最大化日益受到人们的关注。知识共享正是在这个背景下,成为研究领域的热点问题之一
21世纪是信息爆炸的时代,人们的生活节奏越来越快,时间成为人们的奢侈品,新的时代催生了新的学习方式—微学习。其碎片化的内容呈现、以学生为中心、重视学生的体验的特点,与高校
目的运用访谈法和问卷调查法测量乡镇卫生院卫生工作人员的压力水平和应对方式,比较不同群体卫生工作者压力和应对方式的差别,探讨乡镇卫生院卫生工作者压力现状,工作、生活