【摘 要】
:
提出了一种基于高阶张量表示的视频语义分析与理解框架.在此框架中,视频镜头首先被表示成由视频中所包含的文本、视觉和听觉等多模态数据构成的三阶张量;其次,基于此三阶张量表达
【机 构】
:
浙江大学计算机科学与技术学院数字媒体计算与设计实验室
【基金项目】
:
Supponed by the National Natural Science Foundation of China under Grant Nos.60603096,60533090(国家自然科学基金);the National High-Tech Research and Development Plan of China under Grant No.2006AA010107(国家高
论文部分内容阅读
提出了一种基于高阶张量表示的视频语义分析与理解框架.在此框架中,视频镜头首先被表示成由视频中所包含的文本、视觉和听觉等多模态数据构成的三阶张量;其次,基于此三阶张量表达及视频的时序关联共生特性设计了一种子空间嵌入降维方法,称为张量镜头;由于直推式学习从已知样本出发能对特定的未知样本进行学习和识别壕:后在这个框架中提出了一种基于张量镜头的直推式支持张量机算法,它不仅保持了张量镜头所在的流形空间的本征结构,而且能够将训练集合外数据直接映射到流形子空间,同时充分利用未标记样本改善分类器的学习性能.实验结果表明,
其他文献
运用文献资料法、访谈法、问卷调查法、逻辑分析法等方法,对山西省农村中小学体育教师的现状及影响因素进行调查与分析。结果显示,农村中小学体育教师队伍的现状不容乐观,表
简述了在电解制氢过程中用电的削峰填谷方案,讨论了方案中关键因素间的关系和控制,确定了较合理的运行方案,介绍了6年的生产实践经验和取得的节能效果,6年间节约电费360余万
<正>"咚咚喹"是土家族最流行且独具特色的一种古老的簧管气鸣乐器,可以吹出清脆明快的旋律,从模拟鸟语的虫鸣,风泉之声而形成写意性的音乐语汇和他固定的音乐曲牌,有词有曲,
目的通过对云南省3所医院抗病毒治疗HIV/AIDS患者心理状态与应对方式的调查,了解其心理状态及采取应对方式的情况。探讨HIV/AIDS患者的心理状态和应对方式的影响因素,为相关
文章认为,在中国传统法律文化中,礼与法的关系是一个核心内容,其实质是为政是以“德”为本,还是以“法”为本。从历朝统治者治国理政的实践来看,我国古代社会经历了西周的为
构建农村公共文化服务体系的主要目的是满足农村居民的基本文化需求,然而农村公共文化服务实践中的供需矛盾表明,公共文化服务需求的满足。不仅有赖于完善的服务没施、丰富的服
<正> 15.什么叫水制?应注意哪些问题? 答:水制是利用清水与其它辅料,除去药物附着的不洁物,或使药物软化便于切片,或减低药物的毒性,或制取药物细粉的一类方法。应视药物的性
目的探讨葛根芩连汤联合脂肪间充质干细胞(ADSCs)移植对糖尿病大鼠肾功能的改善作用。方法 75只Wistar大鼠随机选15只不做任何处理作为正常对照组,余60只连续5 d腹腔注射40 m
随着知识经济的发展和全球化市场竞争的形成,企业与企业之间不仅仅局限于产品与产品之间的竞争,更重要的是供应链与供应链之间的竞争,供应商管理已成为供应链管理的关键任务之一
有不少逻辑学教材和参考书引用了“在愚人节里”的故事来说明联言判断的真假值原理,但这些书的推理和说明既违背了充分条件的假言推理规则,又违背了普通逻辑的基本规律。用这个