网络多媒体教育资源主题搜索算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:anlyok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络多媒体教育资源是指存在于Internet中的多媒体教学资源。随着网络与多媒体技术的发展,Web中的多媒体教学资源,尤其是音频、视频和动画,也日益丰富,成为教育领域的重要组成部分。如何快速、准确地找到特定主题的多媒体教学资源,使其在信息化教育中充分发挥作用,是教育技术工作者亟待解决的问题,也使得传统的搜索引擎面临着巨大的挑战,各类多媒体搜索引擎也随之应运而生并受到广泛的关注。主题搜索器的搜索算法,是搜索引擎的核心,它决定了搜索引擎的搜索效率和质量。本文从主题网页和包含多媒体的网页在Web中分布的特点出发,围绕提高多媒体主题搜索效率的问题,提出一种基于URL链接规则的多媒体主题搜索算法。本文首先介绍了在HTML文档中,与多媒体资源有关的文本信息和HTML标签,深入分析了主题页面和包含多媒体资源的网页在Web上的分布特征。在分析和比较现有的主题搜索算法的优缺点的基础上,归纳了提高搜索效率的几个关键因素。本文对主题搜索领域中传统的主题搜索算法进行了详细的分析,在深入分析主题页面在Web上的分布特征与主题相关性判别算法的基础上,对PageRank、Shark-Search两种典型的主题搜索算法进行相关参数的改进,同时将网页内容相似度和网页链接相似度加入到算法的计算过程中,并将改进后的Topic-PageRank算法、Shark-Search算法应用于多媒体主题搜索领域。针对传统的主题搜索算法不能简单的应用于多媒体主题搜索领域的问题,本文基于包含多媒体的网页往往呈现出“资源相邻性”的特点,提出了一种基于URL链接规则的多媒体主题搜索算法,即从种子网站列表中自动学习出代表“多媒体资源区域”的URL正则表达式,并用这些正则表达式来指导主题搜索器对网页的抓取。在详细介绍URL数据结构、URL距离的度量以及URL正则表达式的学习和指导过程的基础上,对PageRank算法进行改进,实现基于URL链接规则算法在链接方面的相似度计算。为了验证基于URL链接规则多媒体主题搜索算法的高效性,本文采用统一的系统体系结构和软、硬件平台,对Topic-PageRank算法、改进的Shark-Search算法和基于URL链接规则的算法输入相同的种子页面集、限定同一搜索深度进行实验测试。文章从查全率和查准率两个角度,对三种算法进行比较。实验结果表明本文的工作是相当有效的,尤其是提出的基于URL链接规则的多媒体主题搜索算法,具有相当的创新性和实际应用价值。
其他文献
支盘桩是近年来发展起来的一种新型桩基,它具有较好的力学性能和技术经济指标,兼有较好的环保效益。本文对支盘桩技术做了简要介绍,并结合支盘桩工程实例,介绍了支盘桩的特点
CDIO是“做中学”和基于项目教育和学习的集中概括和抽象表达,我校计算机专业群形成了区域化的SECI-CDIO人才培养模式。电子商务专业依托校企利益共同体的平台,融合CDIO工程
高职院校校内生产性实践基地具有生产性和教学性的双重身份,如何构建合理的运营模式使其二者完美结合是当前各高职院校面临的问题,本文将以网络经济为背景,以电子商务为平台
大学生良好的生活方式是保证自身健康的重要基础,而科学合理的体育人力资本投资在一定程度上有助于大学生形成良好的生活方式,为大学生的终身体育理念打下坚实的基础。目前对
长期以来的计划经济体制使得我国实行了上大学不交费的免费制度。1994年以来,国家逐步加大了高等院校收费制度改革,到1997年高等院校收费改革基本完成,形成了以政府拨款为主,多渠
期刊
学位
高校体育是高等教育中的重要教育环节,它在培养身体与心理健康的有用人才、发展体能、提高技能、学会科学养生保健本领、娱乐身心、培养锻炼习惯、创造良好个性、提高体育意
学位
以民机机身组装壁板为基准,设计了等重量的整体壁板结构,并分别建立了两种壁板的有限元模型.通过组装壁板轴压试验结果与非线性、大变形的有限元计算结果比较,对有限元模型进
白马人是生活在“川陇”两省交界处的一支独特的少数民族,自从20世纪70年代后期,著名社会学家费孝通先生在政协全国委员会民族组会议上将“白马人”作为民族识别工作遗留问题