论文部分内容阅读
近日,Forrester发布了2019-2020年VideoAI技术预测,确定了影响未来2年的主要动态——AI将从战略抱负转向务实的应用落地,智能影像技术将在娱乐与传媒行业遍地开花。
2018年,文娱产业领导者将目光投向了数字化转型和智能体验(AX)等大型计划。
虽然,许多行业领导者面临严峻的现实考验,即使这些战略是艰难的,代价高昂的,并且挑战领导者经营业务的方式。但变化的步伐并没有放缓,市场也没有变得更加宽容-消费者挑战公司为他们的生活带来价值。如此同时,人工智能或许是最近选择之一。
“技术的速度和多样性,从人工智能的承诺到技术债务的现实,挑战优先顺序和预算,”Forrester首席研究官Carrie Johnson在一篇博文中表示。
这就是为什么在2019-2020年,文娱行业领导者会将注意力转向务实的产业数字化应用。
对于视频技术从业者,Forrester预测:
①人工智能为影像分析技术带来变革。人工智能在影像行业的综合应用,特别是通过对动态视觉内容的理解和重构,是计算机视觉技术及计算机动画技术的交叉和融合,给智能影像产业带来了充满想象力的广阔舞台和空间。
②智能影像技术为产业变革带来强劲动力。过去几年文娱产业经历了快速的发展,以内容制作方、视频平台方为代表行业参与者正面临着诸多的挑战,各方仍在行业变局中摸索前行,期望不断通过运用新兴技术和应用的创新提升自身的核心竞争力。智能影像技术在行业的应用日渐深入,成为新一轮行业变革的核心驱动力。
③智能影像技术应用将在多场景、多维度上产生财务业绩。智能影像技术不仅成为文娱产业商业价值变现的核心引擎,也将在视频内容原创、视频广告营销、视频结构化商用、视频大数据领域、机器人流程化等领域产生财务绩效,通过自动化影像加工、生产技术为产业升级提供动力。
④深耕行业场景,聚焦价值创造,拓展行业生态。智能影像技术企业需要聚焦行业实践、商业价值闭环,以及开放性平台技术,推动智能影像生态的协同发展和进一步繁荣。
智能影像技术在文娱产业的应用场景
至2021年,全球娱乐业将超过2.6万亿美元,视频人工智能技术在全球娱乐市场的普及率将从不到十分之一上升到十分之六。“通过综合利用人工智能技术与计算机视觉技术进行影像的智能化、批量化生产,潜在的巨大价值已经得到展现,将形成万亿规模的市场,”某国际知名人工智能科技公司副总裁表示。
对于预先落地的智能视频技术应用场景,Forrester预测:
1 内容创意与智能影像制作
根据Forrester预测,视频智能技术解决了大规模视频内容制作和特效制作成本高的问题。使用智能视频技术平台,可提高视频内容的实现率和生产效率,降低人工成本60%以上。通过智能影像技术在制作过程自动对影片中的瑕疵进行修正,大量应用在皮克斯出品的《海底总动员2》和《汽车总动员3》的影片制作中。从业务侧,从创作、设计、拍摄与制作到后期特效这几大流程中,人工智能和深度学习都在对其进行改变与重塑。
对此,某国际知名投资总监表示,“2017年全球电影票房高达406亿美元,VideoAI正在影响文娱行业,逐步改变影视内容的制作流程,视频内容智能自动化时代将来临”。
2 基于内容智能的视频结构化应用
随着AI对内容理解正确率提升,它可以对视频进行数字化描述,为后期个性化视频推荐最坚实的基础。通过视频结构化技术对视频帧拆分,然后对帧分类,进而给视频和帧打上标签,理解这个视频究竟是属于哪个分类。在此基数上,可实现海量视频分类、审查、再生产、智能检索以及个性化推荐等应用。
视频识别及分析将被率先规模应用,通过对视频的理解,自动甄选出最佳的关键帧或片段作为视频封面,更加突出视频核心内容,从而吸引用户转化观看。
视频结构化有助于视频内容审核得到实质性飞跃,以解决长期困扰视频运营方或渠道方的视频内容审核难题,未来两天将通过API接口或是工作流自动触发来自动完成。
视频结构化将在版权业发挥更多作用。除在分发消费环节发挥,基于视频指纹(根据视频多模态特征的唯一标识)构建的智能媒资搜索引擎,不会随媒体文件格式转换、剪辑、压缩旋转而产生变化的关键作用而被广泛应用于视频版权保护。
3 智能推荐提升消费者数字化体验
通过对影像内容的识别与处理基础上的智能编目,再根据用户观影行为和内容偏好,可以实现更加智能的推荐,提升客户的观影体验。
4 智能视频编辑和导播
以1个小时的视频处理为例,传统的视频编辑需要专业人员数个小时才能完成,而通过智能影像技术可摆脱专业设备、专业编辑软件及专业人员的高门槛高成本,实现成本百余倍的降低。例如,针对综艺节目的大量精彩镜头,利用智能影像技术对人物、姿态、动作,运动轨迹进行多维度的全景分析,并自动剪辑和合成,最快只需十到几十秒,将生产效率提升超过10倍。还可通过多模态内容理解技术,自动在单路/多路视频中叠加人物、物品的信息,并对集锦内容进行实时、准确的智能生产,并实现了多场景、多地协同的智能导播。
5 智能营销将被颠覆
基于智能影像技术的原生视频广告作为一种新的内容营销的方式被广泛使用。捕捉热门内容同時,伴随自动生新视频场景。利用智能影像技术为下游任务提供大量数字化资源,用于原生视频内容营销、游戏生产、虚拟在线交易商店,建立包括明星及文学作品等在内的智能IP运营监控模型、价值预测及精准推广。
接受Forrester调查的知名在线移动公司CTO亦如表示,“AI在视频领域的应用很直接,特别是通过自动化技术替代简单重复的人工,营销领域将直接跨域至智能时代”。 智能影像技术提供者分析:影谱科技为超过70%的中国应用者提供VideoAI技术及服务
实验和商业化应用是人工智能技术蓬勃发展的关键。
中国领先的智能影像技术解决方案提供商-影谱科技(Moviebook),通过整合视频类渠道,正在覆盖各硬件终端与计算机芯片、贯穿可视化场景,以实现智能影像变现闭环。其智能影像生产技术具有批量自动化处理、子像素级分析、智能叠加和无痕展示等特征。
在人工智能业务领域,影谱科技通过VedioAI内容生产引擎,发布能快速实现影像内容生产的“从视频中捕获动作” Motion Capture from Video System(MCVS)框架及产品。MCVS无需预先进行动作捕捉合成的高度结构化数据,就可以让机器直接模仿大量已存视频片段来学习高难度技能,允许数据为驱动的模仿以生成无监督学习视频内容。例如从视频中自动捕获动作进行学习,从而实现机器自动重生一段“全新”视频。
原生视频营销是影谱科技智能影像生产技术的典型商业应用:通过提取视频中的商业化场景,匹配合理的品牌元素进行无需更改片源的内容增加与替换,这样的方式有利于深度挖掘视频红利,实现多方共赢。
事实上,包括迪士尼、NETFLIX、HBO、TRONC等娱乐传媒巨头均在尝试人工智能代替标准内容制作的可能。Forrester访谈发现,影谱科技影像自动化生产技术在文娱行业已大规模商用:能够直接提高影像内容变现率,提高生产作业效率,降低人力成本约30%。
由湖南卫视推出的国内首档音乐创演秀《幻乐之城》,由影谱科技提供的智能影像生产技术应用表现不俗:
通过视频神经网络进行视频扫描分析,根据视频码流,帧率,镜头的景深,光照,色调,场景,转场关键帧等要素对视频做规格化数据处理和标记,批量发掘视频广告增量市场。
通过大数据深度学习算法,基于视频内容、用户行为、广告属性等维度和分类,自动匹配最合适的场景及广告位策略,同时通过智能优选实现对目标人群的精准投放。并智能优化投放效果,使植入广告与位置周围区域色彩形状结合视频解析度进行帧的边缘处理,达到原生植入的效果。
Forrester认为:“AI+”模式已经成为了各行业数字化转型与商业创新方面的重要支持力量。其中VideoAI技术在文娱产业得到了大规模的应用,随着这一技术的不断发展和成熟,必将会进入更多的行业应用场景,为产业升级赋能。
国内外医疗影像技术差距大,AI医疗能否帮我们逆袭?
首先,我们先介绍一下什么是医疗影像。
医疗影像属于医学影像学的范畴,是研究借助某种介质与人体的相互作用,把人体内部组织器官结构、密度以影像的方式表现出来,供诊断医生进行判断的一门医学科学。像我们平时所常见的X片就是其中之一。而AI医疗影像是指借助时下最为热点的人工智能技术,进行医疗影像的分析、判断的一种人工智能+医疗前沿科技。
像人工智能一样,AI医疗影像在全世界范围内掀起了一股热潮。在国外像科技巨头IBM已经在医疗智能领域深耕多年,而近年来也涌现了一批新的医疗影像明星公司,像Enlitic(全球首家将人工智能深度学习运用到医疗的AI公司),Butterfly Network(世界首款AR远程医疗技术),VoxelCloud(体素科技)等等,都拥有着世界级的开创新科技成果。
而在国内,近年来也出现一批医疗影像领域的新创高科技公司。
Deepcare(北京羽医甘蓝):成立于2016年,致力于人工智能应用于医疗图像的识别和早期筛查的医疗科技公司,目前主要专注于研发病理图像的检测、识别和分析技术,通过融合机器视觉、深度学习以及大数据挖掘技术,致力于为广大医疗机构和医疗器械厂商提供优质的产品和服务,目前在宫颈癌,肺癌,糖尿病等疾病的初期诊断中有较好的效果。
推想科技:北京推想科技是一家国际领先的人工智能影像高科技公司,致力于应用深度学习技术为医疗影像辅助筛查提供解决方案,其职能CT辅助筛查产品在早期肺癌筛查应用中,以高性能的运算能力,有效提升预测敏感性、准确性。
图玛深维:由两位前高通公司深度学习和计算机视觉学专家于美国创立,公司将人工智能与深度学习技术引入到智能医学诊断和医学数据分析领域,目前与北京上海等多家三甲医院达成了科研合作协议,拥有中国与美国顶级专家团队,研发实力强大,公司一期产品在美国癌症协会上取得了98.5%的可靠性,遥遥领先于市场上同类产品。目标是世界最领先的AI智能医疗公司。
汇医慧影:一家成立于2015年的国家级大数据AI分析平台,应用云计算、大数据,机器学习等多种方法,提供医学影像、临床数据分析,实现了影像大数据的智能化分析与管理。在肿瘤、心血管疾病领域有很好的落地,目前已与包括多家三甲医院在内的700多家医院合作。
除了这些后起之秀以外,中国传统的互联网巨头如腾讯,阿里等也均涉足人工智能医疗影像领域,甚至一些地产、保险金融行业也在跨领域进军医疗影像市场。但是虽然如此,虽然医疗影像这块蛋糕足够大,但是我国的行业研发能力与世界发达国家相比还有不小的距离。
目前我国的医疗影像设备市场仍然被极少数的国际巨头所垄断着,仅仅西门子、通用电气、飞利浦三家就占据着75%的市场份额,而在高端领域,这一比例甚至超过80%之多。由此我们不禁感慨,医疗影像资源在中国是多么的短缺。
我们的差距不仅仅体现在设备上,影像的阅读往往需要医生长时间的经验积累才能完成,所以相关医生的培养周期也比較长,而AI人工智能影像医疗的出现,恰好能够弥补这一缺点,在准确率和效率上有很大优势。智能软件的加入可以快速处理影像信息,不仅速度比人类更快,准确度也会更高。哈佛大学参与的智能诊断临床试验显示,人工智能辅助医生诊断乳腺癌的误诊率可以从4%降低到0.5%。
那么最终我们的新老科技公司能否挑战跨国巨头们,成功突围成功逆袭呢?也许不要太过同质化竞争才是更好的突围之道。
2018年,文娱产业领导者将目光投向了数字化转型和智能体验(AX)等大型计划。
虽然,许多行业领导者面临严峻的现实考验,即使这些战略是艰难的,代价高昂的,并且挑战领导者经营业务的方式。但变化的步伐并没有放缓,市场也没有变得更加宽容-消费者挑战公司为他们的生活带来价值。如此同时,人工智能或许是最近选择之一。
“技术的速度和多样性,从人工智能的承诺到技术债务的现实,挑战优先顺序和预算,”Forrester首席研究官Carrie Johnson在一篇博文中表示。
这就是为什么在2019-2020年,文娱行业领导者会将注意力转向务实的产业数字化应用。
对于视频技术从业者,Forrester预测:
①人工智能为影像分析技术带来变革。人工智能在影像行业的综合应用,特别是通过对动态视觉内容的理解和重构,是计算机视觉技术及计算机动画技术的交叉和融合,给智能影像产业带来了充满想象力的广阔舞台和空间。
②智能影像技术为产业变革带来强劲动力。过去几年文娱产业经历了快速的发展,以内容制作方、视频平台方为代表行业参与者正面临着诸多的挑战,各方仍在行业变局中摸索前行,期望不断通过运用新兴技术和应用的创新提升自身的核心竞争力。智能影像技术在行业的应用日渐深入,成为新一轮行业变革的核心驱动力。
③智能影像技术应用将在多场景、多维度上产生财务业绩。智能影像技术不仅成为文娱产业商业价值变现的核心引擎,也将在视频内容原创、视频广告营销、视频结构化商用、视频大数据领域、机器人流程化等领域产生财务绩效,通过自动化影像加工、生产技术为产业升级提供动力。
④深耕行业场景,聚焦价值创造,拓展行业生态。智能影像技术企业需要聚焦行业实践、商业价值闭环,以及开放性平台技术,推动智能影像生态的协同发展和进一步繁荣。
智能影像技术在文娱产业的应用场景
至2021年,全球娱乐业将超过2.6万亿美元,视频人工智能技术在全球娱乐市场的普及率将从不到十分之一上升到十分之六。“通过综合利用人工智能技术与计算机视觉技术进行影像的智能化、批量化生产,潜在的巨大价值已经得到展现,将形成万亿规模的市场,”某国际知名人工智能科技公司副总裁表示。
对于预先落地的智能视频技术应用场景,Forrester预测:
1 内容创意与智能影像制作
根据Forrester预测,视频智能技术解决了大规模视频内容制作和特效制作成本高的问题。使用智能视频技术平台,可提高视频内容的实现率和生产效率,降低人工成本60%以上。通过智能影像技术在制作过程自动对影片中的瑕疵进行修正,大量应用在皮克斯出品的《海底总动员2》和《汽车总动员3》的影片制作中。从业务侧,从创作、设计、拍摄与制作到后期特效这几大流程中,人工智能和深度学习都在对其进行改变与重塑。
对此,某国际知名投资总监表示,“2017年全球电影票房高达406亿美元,VideoAI正在影响文娱行业,逐步改变影视内容的制作流程,视频内容智能自动化时代将来临”。
2 基于内容智能的视频结构化应用
随着AI对内容理解正确率提升,它可以对视频进行数字化描述,为后期个性化视频推荐最坚实的基础。通过视频结构化技术对视频帧拆分,然后对帧分类,进而给视频和帧打上标签,理解这个视频究竟是属于哪个分类。在此基数上,可实现海量视频分类、审查、再生产、智能检索以及个性化推荐等应用。
视频识别及分析将被率先规模应用,通过对视频的理解,自动甄选出最佳的关键帧或片段作为视频封面,更加突出视频核心内容,从而吸引用户转化观看。
视频结构化有助于视频内容审核得到实质性飞跃,以解决长期困扰视频运营方或渠道方的视频内容审核难题,未来两天将通过API接口或是工作流自动触发来自动完成。
视频结构化将在版权业发挥更多作用。除在分发消费环节发挥,基于视频指纹(根据视频多模态特征的唯一标识)构建的智能媒资搜索引擎,不会随媒体文件格式转换、剪辑、压缩旋转而产生变化的关键作用而被广泛应用于视频版权保护。
3 智能推荐提升消费者数字化体验
通过对影像内容的识别与处理基础上的智能编目,再根据用户观影行为和内容偏好,可以实现更加智能的推荐,提升客户的观影体验。
4 智能视频编辑和导播
以1个小时的视频处理为例,传统的视频编辑需要专业人员数个小时才能完成,而通过智能影像技术可摆脱专业设备、专业编辑软件及专业人员的高门槛高成本,实现成本百余倍的降低。例如,针对综艺节目的大量精彩镜头,利用智能影像技术对人物、姿态、动作,运动轨迹进行多维度的全景分析,并自动剪辑和合成,最快只需十到几十秒,将生产效率提升超过10倍。还可通过多模态内容理解技术,自动在单路/多路视频中叠加人物、物品的信息,并对集锦内容进行实时、准确的智能生产,并实现了多场景、多地协同的智能导播。
5 智能营销将被颠覆
基于智能影像技术的原生视频广告作为一种新的内容营销的方式被广泛使用。捕捉热门内容同時,伴随自动生新视频场景。利用智能影像技术为下游任务提供大量数字化资源,用于原生视频内容营销、游戏生产、虚拟在线交易商店,建立包括明星及文学作品等在内的智能IP运营监控模型、价值预测及精准推广。
接受Forrester调查的知名在线移动公司CTO亦如表示,“AI在视频领域的应用很直接,特别是通过自动化技术替代简单重复的人工,营销领域将直接跨域至智能时代”。 智能影像技术提供者分析:影谱科技为超过70%的中国应用者提供VideoAI技术及服务
实验和商业化应用是人工智能技术蓬勃发展的关键。
中国领先的智能影像技术解决方案提供商-影谱科技(Moviebook),通过整合视频类渠道,正在覆盖各硬件终端与计算机芯片、贯穿可视化场景,以实现智能影像变现闭环。其智能影像生产技术具有批量自动化处理、子像素级分析、智能叠加和无痕展示等特征。
在人工智能业务领域,影谱科技通过VedioAI内容生产引擎,发布能快速实现影像内容生产的“从视频中捕获动作” Motion Capture from Video System(MCVS)框架及产品。MCVS无需预先进行动作捕捉合成的高度结构化数据,就可以让机器直接模仿大量已存视频片段来学习高难度技能,允许数据为驱动的模仿以生成无监督学习视频内容。例如从视频中自动捕获动作进行学习,从而实现机器自动重生一段“全新”视频。
原生视频营销是影谱科技智能影像生产技术的典型商业应用:通过提取视频中的商业化场景,匹配合理的品牌元素进行无需更改片源的内容增加与替换,这样的方式有利于深度挖掘视频红利,实现多方共赢。
事实上,包括迪士尼、NETFLIX、HBO、TRONC等娱乐传媒巨头均在尝试人工智能代替标准内容制作的可能。Forrester访谈发现,影谱科技影像自动化生产技术在文娱行业已大规模商用:能够直接提高影像内容变现率,提高生产作业效率,降低人力成本约30%。
由湖南卫视推出的国内首档音乐创演秀《幻乐之城》,由影谱科技提供的智能影像生产技术应用表现不俗:
通过视频神经网络进行视频扫描分析,根据视频码流,帧率,镜头的景深,光照,色调,场景,转场关键帧等要素对视频做规格化数据处理和标记,批量发掘视频广告增量市场。
通过大数据深度学习算法,基于视频内容、用户行为、广告属性等维度和分类,自动匹配最合适的场景及广告位策略,同时通过智能优选实现对目标人群的精准投放。并智能优化投放效果,使植入广告与位置周围区域色彩形状结合视频解析度进行帧的边缘处理,达到原生植入的效果。
Forrester认为:“AI+”模式已经成为了各行业数字化转型与商业创新方面的重要支持力量。其中VideoAI技术在文娱产业得到了大规模的应用,随着这一技术的不断发展和成熟,必将会进入更多的行业应用场景,为产业升级赋能。
国内外医疗影像技术差距大,AI医疗能否帮我们逆袭?
首先,我们先介绍一下什么是医疗影像。
医疗影像属于医学影像学的范畴,是研究借助某种介质与人体的相互作用,把人体内部组织器官结构、密度以影像的方式表现出来,供诊断医生进行判断的一门医学科学。像我们平时所常见的X片就是其中之一。而AI医疗影像是指借助时下最为热点的人工智能技术,进行医疗影像的分析、判断的一种人工智能+医疗前沿科技。
像人工智能一样,AI医疗影像在全世界范围内掀起了一股热潮。在国外像科技巨头IBM已经在医疗智能领域深耕多年,而近年来也涌现了一批新的医疗影像明星公司,像Enlitic(全球首家将人工智能深度学习运用到医疗的AI公司),Butterfly Network(世界首款AR远程医疗技术),VoxelCloud(体素科技)等等,都拥有着世界级的开创新科技成果。
而在国内,近年来也出现一批医疗影像领域的新创高科技公司。
Deepcare(北京羽医甘蓝):成立于2016年,致力于人工智能应用于医疗图像的识别和早期筛查的医疗科技公司,目前主要专注于研发病理图像的检测、识别和分析技术,通过融合机器视觉、深度学习以及大数据挖掘技术,致力于为广大医疗机构和医疗器械厂商提供优质的产品和服务,目前在宫颈癌,肺癌,糖尿病等疾病的初期诊断中有较好的效果。
推想科技:北京推想科技是一家国际领先的人工智能影像高科技公司,致力于应用深度学习技术为医疗影像辅助筛查提供解决方案,其职能CT辅助筛查产品在早期肺癌筛查应用中,以高性能的运算能力,有效提升预测敏感性、准确性。
图玛深维:由两位前高通公司深度学习和计算机视觉学专家于美国创立,公司将人工智能与深度学习技术引入到智能医学诊断和医学数据分析领域,目前与北京上海等多家三甲医院达成了科研合作协议,拥有中国与美国顶级专家团队,研发实力强大,公司一期产品在美国癌症协会上取得了98.5%的可靠性,遥遥领先于市场上同类产品。目标是世界最领先的AI智能医疗公司。
汇医慧影:一家成立于2015年的国家级大数据AI分析平台,应用云计算、大数据,机器学习等多种方法,提供医学影像、临床数据分析,实现了影像大数据的智能化分析与管理。在肿瘤、心血管疾病领域有很好的落地,目前已与包括多家三甲医院在内的700多家医院合作。
除了这些后起之秀以外,中国传统的互联网巨头如腾讯,阿里等也均涉足人工智能医疗影像领域,甚至一些地产、保险金融行业也在跨领域进军医疗影像市场。但是虽然如此,虽然医疗影像这块蛋糕足够大,但是我国的行业研发能力与世界发达国家相比还有不小的距离。
目前我国的医疗影像设备市场仍然被极少数的国际巨头所垄断着,仅仅西门子、通用电气、飞利浦三家就占据着75%的市场份额,而在高端领域,这一比例甚至超过80%之多。由此我们不禁感慨,医疗影像资源在中国是多么的短缺。
我们的差距不仅仅体现在设备上,影像的阅读往往需要医生长时间的经验积累才能完成,所以相关医生的培养周期也比較长,而AI人工智能影像医疗的出现,恰好能够弥补这一缺点,在准确率和效率上有很大优势。智能软件的加入可以快速处理影像信息,不仅速度比人类更快,准确度也会更高。哈佛大学参与的智能诊断临床试验显示,人工智能辅助医生诊断乳腺癌的误诊率可以从4%降低到0.5%。
那么最终我们的新老科技公司能否挑战跨国巨头们,成功突围成功逆袭呢?也许不要太过同质化竞争才是更好的突围之道。