Web视频资源的智能发现关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fl908720
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的迅猛发展,特别是Web 2.0普及后用户参与度的大幅度提高,用户不仅可以在线欣赏视频,还可以成为网络视频资源的提供者,所以Internet的视频资源急剧增加,Web视频资源的搜索与监控成为一个亟待解决的问题。本文围绕着如何在实际网络环境中快、准、全的搜索出视频资源的需求,在深入研究爬虫的工作原理的基础上,提出基于动态Web视频资源特征库的视频资源疑似度评估模型,设计在线增量学习算法以动态调整和丰富视频资源特征知识库。然后经过不断进行优化和改进,从而较大幅度地提升系统的运行效率,最终达到可实际运用的性能。本文的主要成果可以归纳为以下几个方面:(1)对实际网络视频资源特征与分布进行深入调研,通过分析已知的Web视频节目特征,提取其中可以用于评估一个页面视频节目疑似度的特征线索,并设计这种特征的表示模型,最终形成一个Web视频特征知识基础库。(2)在对爬虫技术深入研究的基础上,借鉴了主题爬虫设计思路,结合在Web上发现视频资源的静态爬行模型,提出了基于在线增量学习的视频资源发现模型,并进一步设计了具备更高性能的Web视频发现改进模型,并基于该模型,提出了一种基于增量学习的视频资源发现算法。(3)通过对实际性能的考察和调优,针对提出的视频资源发现模型,设计了大量可以控制的配置参数,并通过调研、实验对比,给出了实际操作中可以使用的参数范围。(4)基于上述的理论研究成果,设计了具体的视频资源发现系统的体系结构和各个模块的具体流程,形成一个高性能Web视频只能发现系统的详细设计,并最终实现成为可实际运用的系统。
其他文献
在可用网络服务盛行的今天,网络服务标榜在组织内和组织间使用公共服务描述语言进行注册,基于用户功能性和非功能性需求的服务质量(QoS)必须被推广。然而,最常见的注册和服务描述
随着信息技术的发展,人们对软件的需求越来越大,质量要求越来越高,因此缩短软件生产周期和提高软件正确性已经成为了软件开发者迫切需要解决的问题。为了寻求软件开发方法上的突
1969年,美国数字设备公司研制出第一台可编程逻辑控制器(ProgrammableLogic Controller,PLC)[1]。发展至今,PLC在国内外已广泛应用于开关量逻辑控制、工业过程控制、运动控制
在传感器、无线通讯、分布式信息处理等技术不断发展的大背景下,无线传感器网络实际应用范畴越来越广泛。为此越来越受到人们的关注。其必需的路由协议研究工作已成为热点。
早在1996年IEFT(Internet Engineering Task Force)就提出了移动Internet讨论稿,即Mobile IP协议RFC2002,该协议旨在解决当移动节点从一个无线子移动到另外一个无线子网时,保
形式化方法主要包括两个方面:一是形式规约,二是设计验证,其本质是基于数学的方法来描述软件系统及其属性的一种技术,为软件的正确性与可靠性提供了前提条件,目前已经成为软
随着计算机和宽带技术的迅速发展,基于互联网的多媒体通信技术已经成为当前多媒体通信领域研究的热点。作为当前通信领域两个重要协议之一的SIP信令协议以其简洁、灵活、扩展
HTML是Web中的信息表达方式,但它仅能定义数据的外观和表现形式。XML相关技术不仅定义数据的外观和表现形式,而且定义了数据的结构。相对HTML,XML具有灵活简单、易读、良好的
语义网是未来互联网技术发展的一个方向,它将有效地整合互联网上巨大的信息资源,为人们提供丰富的信息共享途径。本体具有概念化、明确、形式化、共享等特点,很适合作为互联
数据备份与恢复系统是当前计算机应用领域的一个热点。传统数据备份与恢复系统主要运用定时备份策略,备份点相对离散,使得两个相邻备份点间的变化数据无法恢复。而运用数据持