Web中多媒体资源分析与文本信息提取研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:tiantianle_a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展与普及,教育信息化成为教育现代化的重要内容和主要标志,它不仅有利于培养学生的创新精神和综合能力、提高教育教学效果,而且为学生的全面发展提供了条件和保障。教育信息资源的开发和利用是教育信息化的核心,它是关系到教育信息化建设成败的关键,对建构主义学习环境的创建起着非常重要的作用,要设计建构主义学习环境,就要为学习者提供丰富的、与问题解决有关的信息资源。Internet的迅速发展及信息化程度的日渐提高,导致Web中网页的数目呈几何级数爆炸性增长,在这些数目日益增多的网页中包含了大量的多媒体资源,如图像、音频、视频和动画等,并且这些多媒体资源日渐丰富。多媒体资源作为信息资源的重要组成部分,具有形象、生动、直观的优点,在建构主义学习环境中起着非常重要的作用,可以有效的应用于建构主义学习环境的创建。但在浩如烟海并且越来越庞大的Web中快速准确的定位查找自己所需要的多媒体信息资源日渐困难,构建Web多媒体资源库,并使之应用于教育领域,以帮助教师和学习者能快速准确的查找自己所需要的多媒体资源,是教育技术工作者亟待解决的问题。Web中多媒体资源一般嵌入在网页中,要准确查找并定位这些资源,就需要具有描述这些多媒体资源的信息,形成多媒体资源索引库。但如果采用人工方式对多媒体信息进行标注,效率非常低下,操作也相当繁琐。从多媒体资源所在的网页中自动提取用于描述多媒体资源的文本信息,对Web多媒体资源检索、构建Web多媒体索引库具有积极意义。对大量包含多媒体资源的网页进行分析,并对各种类型的多媒体资源在网页中的存在形式进行总结,利用Web多媒体网页搜集器广泛搜集包含多媒体资源的网页。在上述工作基础上,本文设计开发了一个Web多媒体资源分析与文本信息提取系统,利用一套启发式规则对网页中的多媒体资源进行区域定位,然后对多媒体资源进行相关文本提取,并对提取的相关文本进行拼音及英文的翻译转换、中文分词、分词结果的消重过滤以及关键词提取等一系列预处理工作,进而形成对网络中多媒体资源的标注索引。实验结果表明,该系统提取Web多媒体资源的文本信息准确率较高,这对提高多媒体信息检索系统的查全率与查准率具有积极意义。将上述方法应用到教育领域,对于建构主义学习环境的创建,帮助学生更有效准确的查找到自己所需要的多媒体资源,提高教育教学效果具有重要意义。
其他文献
试验研究了沼液浸种、沼液喷施和沼液追肥对甜玉米幼苗素质、产量及品质的影响.结果表明,沼液浸种能增强甜玉米的幼苗素质,根鲜重和干重分别比干播增加13.92%和15.71%,全株鲜
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
在全球化、知识经济和信息化的时代背景下,为培养具有创新能力的高素质人才,提高国际竞争力,2001年,教育部印发了《基础教育课程改革纲要(试行)》的通知,掀起了新一轮课程改
近年来,情绪认知及其脑机制的研究,特别是情绪与认知的关系及其潜在神经基础,逐渐成为认知神经科学的热点研究领域。过往文献中,中性情绪(亦称非情绪事件)的出现往往是作为对照组来
教学的模式有两种,以“教”为主的教学模式和以“学”为主的教学模式,这两种教学模式各有特点。从目前我国的教育模式看,传统的以“教”为主的模式仍然占主导地位,随着现代科
人口移动包括人口的迁移和流动。2013年,我国的流动人口有2.45亿人,人口移动的规模较大。随着人口移动的加剧,农村存在大量的留守老人,在日常生活各方面都面临一定的挑战。《
变电站避雷器的放电计数器按规程要求每年应测试一次并使指示复零,但此前河南省许昌县电业公司一直没有专业的仪器进行此项工作.经过数次试验尝试,我们终于以兆欧表为主成功
公务员考试录用制度是公务员制度的重要组成部分。现阶段的公务员录用考试主要包括笔试和面试两部分。结构化面试作为公务员考录过程中的一种重要形式,得到了广泛的应用。基于
课堂教学活动作为学校教育的重要组成部分,是学校教育的重要环节,它承担着传承民族文化、培养人格道德、传授知识技能、陶冶人情秉性等的教学任务,需要遵循教育目的及课程标
现代通讯技术和网络技术的飞速发展为网络社会提供了新的发展空间。自从Web2.0这一词问世以后,很多人愿意把现在的网络时代称为Web2.0时代。 据统计75%-80%的学习是发生在非