【摘 要】
:
大量多媒体信息的产生将对信息检索技术产生重大变革.由于图象、视频等多媒体数据具有丰富的信息,难以用精确的语言来表示它的特征,传统的数据库以字符匹配的查询方法已不能满足要求,基于内容检索的多媒体数据库技术成为发展趋势.本文研究了基于内容的图象检索系统和技术的若干有关问题.首先叙述了基于内容的图象检索的系统模型和特点,接着针对颜色、纹理和形状进行了概率特征提取、相似度量等进一步的具体分析讨论.本文展示
【机 构】
:
华南理工大学电子与通信工程系(广州)
论文部分内容阅读
大量多媒体信息的产生将对信息检索技术产生重大变革.由于图象、视频等多媒体数据具有丰富的信息,难以用精确的语言来表示它的特征,传统的数据库以字符匹配的查询方法已不能满足要求,基于内容检索的多媒体数据库技术成为发展趋势.本文研究了基于内容的图象检索系统和技术的若干有关问题.首先叙述了基于内容的图象检索的系统模型和特点,接着针对颜色、纹理和形状进行了概率特征提取、相似度量等进一步的具体分析讨论.本文展示了基于以上理论知识的一些实际工作,介绍了基于颜色和纹理检索的改进实验结果.
其他文献
虚拟实景空间就是利用IBR技术构造的具有三维操纵能力的虚拟环境.本文主要介绍了采用Java Applet实现基于WEB的虚拟实景空间浏览器的关键技术,如全景图像分块异步加载,反投影,全景图像漫游等.该浏览器已在航空航天数字博物馆项目中得到了很好的应用.
本文介绍了如何运用新的三维图形技术X3D,并结合VRML及JAVA技术进行基于WEB的交互式三维场景的创建.文中首先给出了虚拟飞行和导弹发射系统实现的模型,分析了人机交互行为的特点,并结合虚拟飞行与导弹发射的工程实例,研究了JAVA对VRML对象控制及如何在三维图形创建中利用X3D技术.
为在建筑造型领域实现三维造型的快速便利的建模,突破现有的一般视觉求解算法的诸多限制条件,论文分析了建筑场景的几何特征,提出了基于近景图像的三维建筑造型的改进算法和优化的系统结构设计,研究了开发专业化三维造型系统的实用性要求.该项研究的试验系统以建筑场景的数字化图像为输入,在保持三维几何计算的速度与计算结果精度的 前提下,尽量减少所需求解参数约束条件,重建具有照片感的三维建筑造型,实现了基于数字图像
本文介绍了船舶模拟训练系统的结构、功能,给出了硬件解决方案.并且分析了要达到身临其境的训练的效果,系统对视景的要求,针对各项要求提出了技术实现方法并给出了相应的实验结果.
压缩视频数据的预处理技术是MPEG域中基于内容视频检索的关键技术之一.本文详细讨论了目前MPEG压缩视频数据预处理中主要的两类算法——镜头检测算法和视频分割算法,分析了它们的性能.
本文提出了一种在CBIR系统中建立低层视觉特征到高层语义特征映射的方法,映射建立后能自动由图像的低层视觉特征提取高层语义特征.
当用户查找包含特定物体的图像时,这些特定的物体或可以由相互间具有一定的逻辑关系几何图形来描述,或具有一定的特征(形状、颜色、纹理).在这些特性基础上进行检索,可以避免传统的QBE方法中不相关的图像区域所带来的对特征匹配的影响,也 可以检索出包含任意方向和大小的特定物体的图像.
本文介绍了一种自动音频分类和分段方法.算法分成两个步骤:首先,使用音频分析的方法将新闻节目的音频分类成静音、语音和音乐,切分不同的新闻段;其次,对语音部分进行说话人辨识和平滑处理.本文对音频分类和分段技术中所涉及的关键技术进行了研究和探讨,并且提出了音频分类和分段系统的结构,并给出了评估方法和实验结果.
本文介绍了采用关系数据库平台组建视频数据库的设计思想与实现方法,镜头分割综合了压缩域DC图像检测和全图像颜色直方图检测等多种方法,自动检索系统则采用图像检索与字段标注相结合的方法,提高了检索的效率.
提出了一种基于DCT的图像自适应公开水印算法,算法在充分考虑人类视觉系统(HVS)屏蔽特性的基础上,通过调整各8×8DCT块内两个相邻中频系数间 的大小关系,以自适应嵌入水印信号,水印提取无需原图像参加.实验结果表明,使用该算法嵌入的水印具有较好的不可见性,同时对常见图像处理操作和一些几何扭曲是鲁棒的,特别是对信号增强处理操作其鲁棒性尤其可观.