论文部分内容阅读
不断向前发展的社会对教育提出的要求越来越高。作为一种现代化的教学手段,多媒体教学有效地促进了教育的信息化,积极地推动了教育的改革和发展。多媒体教学的开展离不开多媒体教育资源,目前,网络已成为全球最大的多媒体教育资源库。搜索引擎是人们从网上获取信息的亲密助手,但通用的搜索引擎多采用基于关键词的检索,利用它们从网上检索教学和学习所需的多种媒体资源的效率往往不高。本文在研究基于内容的多媒体检索的基础上,完善了一个面向基础教育的网络多媒体数据库检索系统,以期为中小学教师和学生等相关用户提供高效的、专业的网络多媒体资源检索服务。本文以中小学教材为依据组织基础教育多媒体主题词,从网上搜索、下载与主题词相关的多媒体教育资源。然后分析、提取多媒体的相关属性,建立多媒体教育资源属性索引数据库。对基于内容的图像、动画(Flash)、视频和音频数据库检索进行了研究,以ASP技术为支持实现了一个网络多媒体教育资源数据库检索系统。检索系统是本篇论文的主要内容,检索一开始,系统要对用户提交的多媒体内容和颜色这两项查询文本进行处理。论文提出了一种新的中文分词算法——快速双向分词算法,并根据该算法开发了一个分词模块,用于对内容描述查询文本进行中文分词。将中文分词所得结果中没有实际意义的词语和系统设定的缺省词语过滤掉,即可得到描述目标多媒体内容的关键信息。系统将根据该信息计算目标多媒体和数据库多媒体的内容描述相似度。另一方面,系统还需将颜色查询文本中的颜色名转换成HSI颜色模式值,以便于计算目标多媒体和数据库多媒体的颜色相似度。图像、动画、视频和音频四种多媒体类型各有其特征和属性,检索系统根据它们的主要属性设置检索条件,这些检索条件是和数据库多媒体表中的主要字段对应的。论文用相似度来衡量目标媒体和库中媒体之间的差距,系统通过比较用户根据检索条件提供的查询信息与数据库表中记录的相应字段值,计算目标媒体和库中媒体的相似度。不同的多媒体检索条件的相似度计算方法不同:对于格式和大小等简单的检索条件,系统采用布尔检索计算其相似度,即只有当用户提供的和库中存储的严格匹配时相似度才为1,否则为0。而对于内容和颜色等相对较复杂的检索条件,系统采用模糊检索计算其相似度,不同的检索条件的模糊算法不同。比如,系统比较处理后的内容描述查询文本与数据库表中记录的内容描述字段值,把它们的同义词比率定义为目标媒体和库中媒体的内容相似度。多媒体总相似度等于多媒体各相似度之积。为了提高检索效率,系统为多媒体数据库各表中的内容描述字段建立了索引,索引的使用加快了检索系统在多媒体内容描述检索条件上的检索速度。在为用户输出结果之前,检索系统将结果记录集放入了缓存,缓存的使用缩短了用户在输出页面进行翻页的时间。另外,本文还研究了如何提高ASP的执行效率,对检索系统的程序代码进行了改善。用户登录网络多媒体教育资源数据库检索系统后描述目标媒体,发出检索请求,然后由系统自动处理查询信息,计算各数据库媒体与目标媒体的相似度,把满足条件的记录资源的预览图和相似度等相关信息返回给用户。初步实验结果表明,对于多媒体数据库表中属性信息标注准确、详实的记录,系统检索结果的准确率较高,索引和缓存等的使用使系统检索的速度明显提高。