基于多特征的相片聚类算法研究与实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:yxzxyzxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码技术的快速发展和数码相机的广泛使用,用户将不断收集大量的个人数码相片,如何帮助用户组织和管理这些相片是一个重要的问题。聚类技术是解决这个问题的主要方法之一,传统的相片聚类算法主要使用时间和内容信息来对相片集进行聚类,但它们一般都是尝试使用单个特征来聚类,或使用多个特征进行聚类时总要基于预先设定的阈值。这样做法存在不足之处:1)单个特征不能处理复杂的相片集;2)预先设定的阈值不能自适应满足用户多样化的相片集。 本文在对现有相片聚类算法进行调研后,将这些相片聚类算法进行分类总结,并讨论和分析它们的不足。考虑到现有相片聚类算法使用单个特征来聚类只能满足用户单方面需求的情况,本文提出了一个通用的相片聚类框架,该框架可以将现有流行的相片聚类算法集成进来,并根据用户具体需求来联合调用多个相片聚类算法来执行,以达到满足用户多样化需求的目的。考虑到现有相片聚类算法不能满足画册制作所需要小粒度相片聚类的要求,本文提出了一种基于多特征的相片聚类算法,该算法联合使用时间、内容和亮度三个特征来对相片集进行聚类,通过自适应给各个特征分配适当权重来计算出相片之间的相似度,再使用递归图划分的方法将相片集划分成小粒度聚类,以达到满足画册制作的要求。 本文的主要贡献如下:1)针对当前单个特征不能满足用户多样化需求,设计一个通用的相片聚类框架;2)在结合时间和相片内容信息的基础上,引进光学信息来提高相片聚类效果;3)提出一种多特征自适应权值的图划分相片聚类算法,有效地解决了自动画册制作所需要的小粒度聚类问题。
其他文献
网页浏览和搜索引擎的关键字检索是人们从Internet上获取信息的传统方法,其局限性主要表现在:网页浏览方式很难在Internet上定何特定的知识;搜索引擎则很容易将所需知识淹没在大
随着计算机计算能力的迅速提高,计算机的普及以及Internet的迅速发展,个人信息的安全性变得越来越脆弱,传统的数据加密技术可以部分地克服信息的随意散布,但随着破译技术的迅
随着互联网技术的快速发展,计算机辅助设计系统呈现网络化的趋势。基于互联网的计算机辅助设计系统能够充分利用异地资源,实现计算机支持的协同工作,从而有效地缩短产品的开发周
随着BBS,聊天室,即时通讯软件,手机短信等这些短文本在Internet信息流中日益突出的地位,人们迫切需要一些自动化工具帮助进行短文本海量信息处理。短文本命名实体识别是短文
学位
近年来,随着我国经济社会不断发展,劳动争议案件也呈上升趋势,特别是劳动合同法和劳动争议调解仲裁法颁布实施后,劳动者维权意识不断加强,使得劳动争议仲裁案件明显增多。与
图像分割主要是把特定的感兴趣的区域提取出来的技术,它是图像识别、图像检测和图像匹配中的关键步骤,从图像处理到图像分析起到了枢纽的作用,在图像工程中占着极为重要的位置。
随着虚拟现实技术和仿真技术的兴起,快速、健壮的碰撞检测检测算法在虚拟现实、计算机游戏、计算机辅助设计等领域扮演着重要角色。在刚体对象的碰撞处理中,由于模型不会发生
图像分类是计算机视觉和人工智能领域最近几年的研究热点。支持向量机是基于结构风险最小化原理的高效分类器,其核心技术之一是核函数。塔形匹配核(Pyramid Matching Kernel,PMK
数字水印是一种信息隐藏技术,通过将具有确定性和保密性的信息(水印)直接嵌入到数字化媒体中,使之作为原始数据的一部分保留在其中,即使在解密之后仍可以对数据的复制和传输
学位
词聚类就是对一些纷繁的个别词应用某种方法进行分组形成语义相近或相关的词类(或词聚簇)。它在智能检索、文本分类、词义排歧、机器翻译等领域都有广泛的应用,是语言学和自
学位