论文部分内容阅读
随着信息技术的发展与普及,教育信息化成为教育现代化的重要内容和主要标志,它不仅有利于培养学生的创新精神和综合能力、提高教育教学效果,而且为学生的全面发展提供了条件和保障。教育信息资源的开发和利用是教育信息化的核心,它是关系到教育信息化建设成败的关键,对建构主义学习环境的创建起着非常重要的作用,要设计建构主义学习环境,就要为学习者提供丰富的、与问题解决有关的信息资源。Internet的迅速发展及信息化程度的日渐提高,导致Web中网页的数目呈几何级数爆炸性增长,在这些数目日益增多的网页中包含了大量的多媒体资源,如图像、音频、视频和动画等,并且这些多媒体资源日渐丰富。多媒体资源作为信息资源的重要组成部分,具有形象、生动、直观的优点,在建构主义学习环境中起着非常重要的作用,可以有效的应用于建构主义学习环境的创建。但在浩如烟海并且越来越庞大的Web中快速准确的定位查找自己所需要的多媒体信息资源日渐困难,构建Web多媒体资源库,并使之应用于教育领域,以帮助教师和学习者能快速准确的查找自己所需要的多媒体资源,是教育技术工作者亟待解决的问题。Web中多媒体资源一般嵌入在网页中,要准确查找并定位这些资源,就需要具有描述这些多媒体资源的信息,形成多媒体资源索引库。但如果采用人工方式对多媒体信息进行标注,效率非常低下,操作也相当繁琐。从多媒体资源所在的网页中自动提取用于描述多媒体资源的文本信息,对Web多媒体资源检索、构建Web多媒体索引库具有积极意义。对大量包含多媒体资源的网页进行分析,并对各种类型的多媒体资源在网页中的存在形式进行总结,利用Web多媒体网页搜集器广泛搜集包含多媒体资源的网页。在上述工作基础上,本文设计开发了一个Web多媒体资源分析与文本信息提取系统,利用一套启发式规则对网页中的多媒体资源进行区域定位,然后对多媒体资源进行相关文本提取,并对提取的相关文本进行拼音及英文的翻译转换、中文分词、分词结果的消重过滤以及关键词提取等一系列预处理工作,进而形成对网络中多媒体资源的标注索引。实验结果表明,该系统提取Web多媒体资源的文本信息准确率较高,这对提高多媒体信息检索系统的查全率与查准率具有积极意义。将上述方法应用到教育领域,对于建构主义学习环境的创建,帮助学生更有效准确的查找到自己所需要的多媒体资源,提高教育教学效果具有重要意义。