韵河(LibSonar):基于音频内容检索的中华历史文化听书馆

来源 :浙江大学 | 被引量 : 0次 | 上传用户:mitsuaki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的发展,人们越来越依赖于从互联网络获得知识和信息,这些信息包括文本、音频、视频等丰富的多媒体形式。其中,音频资源作为一种容易被用户接受的信息载体,在互联网络上越来越重要和普遍。音频资源已经成为数字图书馆的重要组成,文本和音频相结合的“听书馆”成为一种新兴的网络服务。但这些组织形式对音频资源的检索是基于文件名或者标签的,而非深入到音频的内容。在这些组织形式中,资源之间是独立的,无法关联阅读。并且他们对用户封闭,普通用户无法方便地提交资源和对内容的反馈。用户在检索某方面知识时,希望能同时获得该主题下的文本、图片和语音资源,并且能对检索结果进行反馈和扩充。 本课题在研究和比较该领域现有的软件平台的前提下,融和实验室在语音关键词识别领域的成果和数字图书馆相关技术,研制一个新的基于音频检索的多元素开放式听书馆系统,该系统能有效检索文本和音频信息,支持信息之间的关联检索,并且该系统对用户是开放的,用户可以修订检索结果,添加资源和索引。本课题针对中国历史文化信息领域实现了LibSonar系统,提供了查询中华历史相关信息和音频资源的服务。 本论文的主要工作在于: 第一、提出了一个新型听书馆系统的构架并描述了它的运作机制。 第二、语音关键词识别技术在听书馆系统中的应用。 第三、将倒排索引技术运用于关联索引和音频关键词索引。 第四、实现了一个针对中华五千年历史信息检索的演示系统。
其他文献
随着信息技术的迅速发展,网络信息不断膨胀。如何让网络信息更好地为人类服务,已成为未来几年的一个研究热点。一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是网
计算机作为互联网的一种重要信息终端,是目前人们获取网络信息的主要工具。然而,由于传统的上网方式限制了上网人数,互联网的访问模式逐渐从单一访问方式向多种用户终端发展。近
在本文中,我们将考虑如下三个在网络设计中抽象出来的优化问题,一是内点带权最小生成树问题,二是多商品设备选址问题,三是多层次设备选址问题。本文中考虑的这三个问题的若干版本
在网络数据交换日益增多的今天,XML作为一种半结构化数据以其简单易标记和跨平台等优点被越来越广泛的应用到数据存储和数据传输领域。XML数据库是一项在最近几年发展起来的新
随着数据库技术的发展和信息时代的来临各行各业都积累了大量的数据,数据库中存储的数据量急剧增加。因此,为了提高工作效率和生活质量,人们必须获取蕴藏在其中的有价值的信息。
90年代,随着PC、工作站的成熟和广泛应用,面向科学计算的问题求解环境也进入了迅速发展时期。1991年Stratis Gallopoulos在其报告“FutureResearch Directions in Problem Solv
近年来,随着多媒体技术和数字网络通讯的飞速发展,信息的发布和传输实现了“数字化”和“网络化”。然而,数字媒体信息极易被仿制、处理、公开和传播。这样就引发出数字信息
随着计算机网络的不断完善扩大和多媒体信息处理技术的迅速发展,我们能够方便的创作、存储、编辑、传播数字多媒体信息。然而,技术发展的同时也带来了如何保证信息安全的问题
网格计算属于分布式计算的一种,但是由于网格资源在广域上分布、本质上异构、归属不同的人和组织拥有、相异的存取和花费模式、负载和可用性动态变化,因此网格计算环境远比传统
随着计算机技术的高速发展,嵌入式系统已经进入了我们生活的方方面面,从手机、MP3等手持设备到电视、电话等家用电器都有嵌入式系统的影子。特别是很多大公司相继推出自己的微