论文部分内容阅读
李德仁,摄影测量与遥感学家,1939年生,祖籍江苏镇江丹徒,中国科学院院士,中国工程院院士,国际欧亚科学院院士,武汉大学学术委员会主任、测绘遥感信息工程国家重点学术委员会主任。1963年毕业于武汉测绘学院,1981年获该校硕士学位,1985年获联邦德国斯图加特大学博士学位,2008年被苏黎世理工大学授予名誉博士学位,2012年获国际摄影测量与遥感学会名誉会员,1988年获国家级有突出贡献中青年专家。历任武汉测绘科技大学校长,测绘遥感信息TN国家重点实验室主任,全国政协委员,国务院学科评议组组长。已发表论文650余篇,出版专著11部。李德仁教授提出地球空间信息科学的概念和理论体系,长期从事以遥感(RS)、全球卫星定位系统(GPS)和地理信息系统(GlS)为代表的空间信息科学与技术的科研、教学与产业化发展工作,推进数字城市与数字中国、智慧城市与智慧中国的建设。
智慧城市是在数字城市基础之上,通过物联网等技术将现实城市与数字城市进行有效融合,自动和实时地感知现实世界中人和物的各种状态和变化。感知的东西要做处理,谁来处理?由云计算中心来处理其中海量和复杂的计算与控制,为城市管理和公众提供各种智能化的服务。如果用一个公式来描述智慧城市,那么智慧城市一数字城市+物联网+云计算。
物联网是无所不在的,有预测,到2017年,全世界将有7万亿个无线传感装置,而世界人口是70亿,那么人均将有1000个传感器为其服务。城市中的智能感知技术,可以应用于各行各业,从环保、医疗、社会安全、电子政务、智慧城管、智能交通,到智慧景区、智慧教育、智慧社区,甚至智慧安防、平安城市等等。
智能视频技术面临三问题
我国现已建成世界最大的视频监控网,目前已经在约600个城市建设了平安城市,监控设备超过2000万个,投资超过3200亿元。国家的多级联网监控工程今年将基本完成。这些监控设备被安装在城市的每个角落,你可以想像不论走到哪里,都有这么多的眼睛在看着你,但是就在这张监控网之下,每年社会违法案件的数量依然只增不减,统计显示,违法案件发案数量从2004年的536万件增加到2011年的1220万件。问题出在哪里呢?
第一,海量的视频数据能否存储?
以天津为例,“十二五”末,天津将安装60万个高清摄像头,每个摄像头每小时产生3.6GB的数据量,按照存储要求,存3个月后再删除,这些数据也需要4665PB的存储容量。光存储这一项就要投入583个亿,相当于西藏2012年的GDP总值。
摆在我们视频科学工作者面前的一个问题就是,随着平安社会的建设,大量的高清摄像头投入城市以后,这些海量的数据信息能不能有效地存储起来,这是一个巨大的挑战。
第二,存储的数据能否随时查询?
长春发生的盗车杀婴案件,盗车地点距婴儿被埋地点不到40公里,也就一个多小时的路程,却历经近40个小时的“全民搜索”。网友质疑,长春市耗资1亿多元建设的“火眼金睛”视频监控天网工程,在此次破案过程中成了“睁眼瞎”,未能为搜救提供有价值的数据线索,莫非又是一宗“豆腐渣”工程?天网的失效,值得反思。
第三,安防监控是否真的防得住?
在周克华案件中,他长时间在很多敏感位置做了多次踩点,提前一个月在南京多次踩点被摄像头拍到,但却抓不住他,因为没有把不同时间的有效信息做一个时空关联和智能分析。
这是当前智慧城市中的视频分析与评测所面临的三个问题,也是摆在我们面前急需完成的任务。安防目前已经进入了大数据时代,按照现在的情况,每个城市都已经存储了PB级的数据量。
关于视频分析与评测发展的思考
视频图像能提供重要的建筑和城市核心设备的直观状态情况和环境信息,是最主要的信息获取手段,能记录城市中人和物的现场移动和它们的规律。在智慧城市大数据量和公安部门高要求的情况下,作为视频研究人员,应该挖掘视频的最大潜力,把视频的最大作用发挥出来,真正让城市平安,让交通通畅。但是首先我们要解决压缩编码、视频增强、视频识别、视频检测等一系列问题,认清发展的方向。
视频压缩编码。压缩的必要性不言而喻,存不下,就要压缩。视频编码技术可对采集的视频图像进行压缩,为高效的传输和存储提供了保障。压缩图像有各种标准,它有一个基本框架,但是现在的编码没有考虑到感知的问题。感知编码是应用人的视觉的生理、心理特性结合视频图像的各种特征,去除视频图像中的多余部分。
另一种是网络适应性编码,我们通过有线网到无线网,要考虑在无线网络通道的情况下,通过动态调整编码方式的浓缩机制来提高无线环境下视频服务质量。适应性编码主要应用于移动视频。移动视频当前的问题是存储率不够高、误码率比较高。我们把适应性编码应用于移动视频,它的功能主要是用在手机电视、移动电视、移动视频会议、手机视频监控等方面,显著提高了效率,降低了成本,增加了用户移动观赏的体验。
视频增强。这是公安部门经常碰见的问题,往往视频图像采样效果很差,可辨识度较低,不利于佐证办案。视频要做增强,才能提高视频数据的质量,提升视觉效果、服务效果。我们通过用数学的系数表达、压缩感知、矩阵填充等等办法降低视频的噪声,提高它的分辨率。也就是说,把原始的视频通过超分辨率的重建之后,可以使公安人员看得清楚,听得清楚。这个方法已经在湖北省武汉市应用,算得上是视频增强的一个进步。
视频识别。我们不满足于数据存储,也不满足于提取信息,我们希望挖掘规律性的知识,所以我们要做智能的视频分析与识别。以人脸识别安防控制为例,里面包括人脸的获取,面部数据提取和表达等等。通过这些方法,能够把人脸的表情识别得更清楚。这些相关技术可以应用到人体交互、安全、机器人制造、医疗、通信和汽车等领域。
除此之外还有人体行为识别,主要是针对视频中人的日常行为进行识别研究。就是把测试序列与预先标定好的具有代表性行为的序列进行匹配,并进行分类,就可以得到相应的应用方式。我们希望通过视频数据分析,了解视频中的情况,某人在跑动,某群人在聚集,某人在翻墙等等,常规的活动应该从里面剔除,保留那些可疑的行为,这就是具有视频侦查的功能。
另外还有车辆识别和分类的应用,希望能够把车辆进行识别与分类,以便于电子警察、流量检测、交通时间监控、车辆分类等交通行为监管,这也是智能交通提出的更高要求。
视频检测。视频的识别技术对视频的内容进行智能的分析和理解,有助于日常行为的检测和和别,视频检测技术对视频数据进行快速的准确查找,从而对事后取证提供数据的支撑。从现在的发展趋势来看还有移动检索,主要是提取压缩的特征,通过无线网络提交到服务器,然后再返回搜索结果。这个可以帮助我们实现手机购物,把要购买的物品通过手机上传,然后在网上找到你需要的货物,经过检测后,就能实现购买。
关于位置检索,可以通过GPS的位置信息,找到你所在的位置。可以用于智慧旅游,通过上网搜索,找到旅游地的详细信息和描述,可以提高我们的旅游享受与体验感。当然它最主要还是用于安防,把小区、轻轨、校园、交通、城市工地等的监控视频传导到信息中心,可以从信息中心把所有的信息提取,对当前的情况进行方向检测、目标分离、色彩检测等分析,实现公共安全的监控。
智慧城市是通过新一代信息化技术,提升城市管理者对城市方方面面信息的感知能力、信息的分析和处理能力,从而能提高针对性的智能化的全社会的服务模式。城市中大量的监控传感器,以及海量的视频影像和信息,需要我们从重点区域、重点人群中实时监控,对可疑情况进行实时预警。除了上述需要我们思考和解决的问题之外,我们还需要认真拿捏好数据挖据与隐私保护之间的平衡点,做到真正的“防”和“安”。
智慧城市是在数字城市基础之上,通过物联网等技术将现实城市与数字城市进行有效融合,自动和实时地感知现实世界中人和物的各种状态和变化。感知的东西要做处理,谁来处理?由云计算中心来处理其中海量和复杂的计算与控制,为城市管理和公众提供各种智能化的服务。如果用一个公式来描述智慧城市,那么智慧城市一数字城市+物联网+云计算。
物联网是无所不在的,有预测,到2017年,全世界将有7万亿个无线传感装置,而世界人口是70亿,那么人均将有1000个传感器为其服务。城市中的智能感知技术,可以应用于各行各业,从环保、医疗、社会安全、电子政务、智慧城管、智能交通,到智慧景区、智慧教育、智慧社区,甚至智慧安防、平安城市等等。
智能视频技术面临三问题
我国现已建成世界最大的视频监控网,目前已经在约600个城市建设了平安城市,监控设备超过2000万个,投资超过3200亿元。国家的多级联网监控工程今年将基本完成。这些监控设备被安装在城市的每个角落,你可以想像不论走到哪里,都有这么多的眼睛在看着你,但是就在这张监控网之下,每年社会违法案件的数量依然只增不减,统计显示,违法案件发案数量从2004年的536万件增加到2011年的1220万件。问题出在哪里呢?
第一,海量的视频数据能否存储?
以天津为例,“十二五”末,天津将安装60万个高清摄像头,每个摄像头每小时产生3.6GB的数据量,按照存储要求,存3个月后再删除,这些数据也需要4665PB的存储容量。光存储这一项就要投入583个亿,相当于西藏2012年的GDP总值。
摆在我们视频科学工作者面前的一个问题就是,随着平安社会的建设,大量的高清摄像头投入城市以后,这些海量的数据信息能不能有效地存储起来,这是一个巨大的挑战。
第二,存储的数据能否随时查询?
长春发生的盗车杀婴案件,盗车地点距婴儿被埋地点不到40公里,也就一个多小时的路程,却历经近40个小时的“全民搜索”。网友质疑,长春市耗资1亿多元建设的“火眼金睛”视频监控天网工程,在此次破案过程中成了“睁眼瞎”,未能为搜救提供有价值的数据线索,莫非又是一宗“豆腐渣”工程?天网的失效,值得反思。
第三,安防监控是否真的防得住?
在周克华案件中,他长时间在很多敏感位置做了多次踩点,提前一个月在南京多次踩点被摄像头拍到,但却抓不住他,因为没有把不同时间的有效信息做一个时空关联和智能分析。
这是当前智慧城市中的视频分析与评测所面临的三个问题,也是摆在我们面前急需完成的任务。安防目前已经进入了大数据时代,按照现在的情况,每个城市都已经存储了PB级的数据量。
关于视频分析与评测发展的思考
视频图像能提供重要的建筑和城市核心设备的直观状态情况和环境信息,是最主要的信息获取手段,能记录城市中人和物的现场移动和它们的规律。在智慧城市大数据量和公安部门高要求的情况下,作为视频研究人员,应该挖掘视频的最大潜力,把视频的最大作用发挥出来,真正让城市平安,让交通通畅。但是首先我们要解决压缩编码、视频增强、视频识别、视频检测等一系列问题,认清发展的方向。
视频压缩编码。压缩的必要性不言而喻,存不下,就要压缩。视频编码技术可对采集的视频图像进行压缩,为高效的传输和存储提供了保障。压缩图像有各种标准,它有一个基本框架,但是现在的编码没有考虑到感知的问题。感知编码是应用人的视觉的生理、心理特性结合视频图像的各种特征,去除视频图像中的多余部分。
另一种是网络适应性编码,我们通过有线网到无线网,要考虑在无线网络通道的情况下,通过动态调整编码方式的浓缩机制来提高无线环境下视频服务质量。适应性编码主要应用于移动视频。移动视频当前的问题是存储率不够高、误码率比较高。我们把适应性编码应用于移动视频,它的功能主要是用在手机电视、移动电视、移动视频会议、手机视频监控等方面,显著提高了效率,降低了成本,增加了用户移动观赏的体验。
视频增强。这是公安部门经常碰见的问题,往往视频图像采样效果很差,可辨识度较低,不利于佐证办案。视频要做增强,才能提高视频数据的质量,提升视觉效果、服务效果。我们通过用数学的系数表达、压缩感知、矩阵填充等等办法降低视频的噪声,提高它的分辨率。也就是说,把原始的视频通过超分辨率的重建之后,可以使公安人员看得清楚,听得清楚。这个方法已经在湖北省武汉市应用,算得上是视频增强的一个进步。
视频识别。我们不满足于数据存储,也不满足于提取信息,我们希望挖掘规律性的知识,所以我们要做智能的视频分析与识别。以人脸识别安防控制为例,里面包括人脸的获取,面部数据提取和表达等等。通过这些方法,能够把人脸的表情识别得更清楚。这些相关技术可以应用到人体交互、安全、机器人制造、医疗、通信和汽车等领域。
除此之外还有人体行为识别,主要是针对视频中人的日常行为进行识别研究。就是把测试序列与预先标定好的具有代表性行为的序列进行匹配,并进行分类,就可以得到相应的应用方式。我们希望通过视频数据分析,了解视频中的情况,某人在跑动,某群人在聚集,某人在翻墙等等,常规的活动应该从里面剔除,保留那些可疑的行为,这就是具有视频侦查的功能。
另外还有车辆识别和分类的应用,希望能够把车辆进行识别与分类,以便于电子警察、流量检测、交通时间监控、车辆分类等交通行为监管,这也是智能交通提出的更高要求。
视频检测。视频的识别技术对视频的内容进行智能的分析和理解,有助于日常行为的检测和和别,视频检测技术对视频数据进行快速的准确查找,从而对事后取证提供数据的支撑。从现在的发展趋势来看还有移动检索,主要是提取压缩的特征,通过无线网络提交到服务器,然后再返回搜索结果。这个可以帮助我们实现手机购物,把要购买的物品通过手机上传,然后在网上找到你需要的货物,经过检测后,就能实现购买。
关于位置检索,可以通过GPS的位置信息,找到你所在的位置。可以用于智慧旅游,通过上网搜索,找到旅游地的详细信息和描述,可以提高我们的旅游享受与体验感。当然它最主要还是用于安防,把小区、轻轨、校园、交通、城市工地等的监控视频传导到信息中心,可以从信息中心把所有的信息提取,对当前的情况进行方向检测、目标分离、色彩检测等分析,实现公共安全的监控。
智慧城市是通过新一代信息化技术,提升城市管理者对城市方方面面信息的感知能力、信息的分析和处理能力,从而能提高针对性的智能化的全社会的服务模式。城市中大量的监控传感器,以及海量的视频影像和信息,需要我们从重点区域、重点人群中实时监控,对可疑情况进行实时预警。除了上述需要我们思考和解决的问题之外,我们还需要认真拿捏好数据挖据与隐私保护之间的平衡点,做到真正的“防”和“安”。