【摘 要】
:
近年来,随着互联网和多媒体共享社区的发展,尤其是Flickr、YouTube等新兴社区的快速发展,多媒体内容的规模正成爆炸式增长。如何有效、准确的对这些内容进行管理、检索变得尤
论文部分内容阅读
近年来,随着互联网和多媒体共享社区的发展,尤其是Flickr、YouTube等新兴社区的快速发展,多媒体内容的规模正成爆炸式增长。如何有效、准确的对这些内容进行管理、检索变得尤为重要。而这些应用的基础,就是对图像内容语义合理的表达方式。这篇文章以互联网社区图像语义表达及管理组织方式为研究背景,以图像标注为主要应用目标,旨在分析和研究互联网图像语义表达的统计规律和主题发现策略,并提出互联网社区图像语义精确表达和主题发掘的理论和应用框架,并通过大规模数据集上的实验,对理论框架和算法进行了验证。文章首先分析了互联网社区图像标注及描述的统计规律,对比于传统的自然语言处理和文本信息检索领域的统计规律,得到了三条指导理论和应用研究的统计假设,分别是“稀疏分布假设”,“局部收敛性假设”和“全局收敛性推论”。以这三个假设为出发点,研究了主题和关键词的可选择性,并提出关键词的完备集理论。完备集理论通过对异质数据分布的分析,建立最小化能量误差准则,定性的对主题和关键词的可选择性进行了分析和评价。在此研究基础之上,建立视觉主题模型,通过无监督的机器学习方法和视觉差异性最大化准则,发掘大规模数据集下视觉主题的分布,并将其应用于互联网社区图像的关键词选择以及图像标注应用之上。实验结果对本文提出的理论及框架的正确性和有效性提供了有力的证据。在文章的最后,对现有工作做了总结并对未来工作做了合理展望。整个研究以对大量数据的统计分析为出发点,理论研究为依据,提出了解决互联网图像语义表达和主题发现理论和应用框架,并应用于图像标注,对后续研究提供了有价值的参考。
其他文献
Mobile Ad hoc networks are collections of wireless mobile hosts forming a temporary, self-organized network without any existing wire line infrastructure. In su
随着我国空间信息技术的进步,遥感光学卫星在空间分标率、光谱成像、辐射分辨率等各个方面都取得了长足的进步。随着我国对高分辨率卫星、微纳卫星、皮纳卫星的研发,“蜂群模式”、“星座组网”等遥感模型算法的逐渐完善,如何在提高成像质量和追求卫星遥感器的最佳占空比和轻小型化一直是相关研究人员们钻研的课题。然而受现实情况的影响,单纯为了相应研究进行卫星发射和数据传输在研究成本和效率上都是不可取的。那么利用实验室
目前针对特定领域进行领域建模已成为一种趋势,相关建模方法、建模语言以及建模工具的快速定制成为研究的重点和难点。本文基于对传统多视图建模方法分析研究的基础上,给出了
随着计算机图形学和计算机视觉的快速发展,三维重建及相关的深度图获取技术越来越受到重视,近些年来不仅在科研而且在应用层面中都有巨大进步。本文针对目前深度获取领域的现
立体视觉作为计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一。立体匹配是立体视觉中的一个难题,是当前制约立体视觉发展的瓶颈问题。由于外极线约束是立
近年来,我国旅游业发展迅速,旅游已成为国民经济发展中的一个重要因素,特别是对于像贵州省这类旅游资源丰富、少数民族聚居的地域。随着旅游资源不断丰富,人们对于旅游服务和旅游
联盟环境是由不同的相互信任的域共同构成的资源共享平台。在联盟环境中,每个域都设置有认证服务器,一方面对本域资源的安全访问进行管理,另一方面为用户提供认证服务。由于
生物医学研究是二十一世纪最受关注的研究领域之一,尤其随着生物医学研究在分子层面的展开,人类基因组计划的实施完成,产生了海量的生物医学数据,并形成了数以百计的生物医学
计算机技术和网络技术的飞速发展,一方面促进了数字作品传播;另一方面给版权保护带来了挑战。作为一种特殊的数字作品,数字地图正遭受非法侵权问题的困扰。数字水印作为有效的
随着经济的发展,大量的人们热衷于股票、债券、基金等金融领域的投资,如何及时准确获取有关金融领域的信息便成了投资者们十分关心的一个话题。随着计算机网络的发展,论坛作为In