疫情中的大数据技术短板

来源 :检察风云 | 被引量 : 0次 | 上传用户:szlsh88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

  2020年开年之际,新型冠状病毒带来的肺炎疫情汹涌而至。疫情突发性高、传染性强、扩散性广、风险性大,防控工作任务艰巨、时间紧迫、形势严峻。在这场疫情阻击战中,大数据、云计算、人工智能等快速发展的新一代信息通信技术加速与交通、医疗、教育等领域深度融合,让疫情防控的组织和执行更加高效,成为战“疫”的强有力武器。可以看出,随着疫情发展,数据驱动的疫情防控在迅速展开,各企业的疫情防控应用场景不断涌现,应用范围持续拓展。
  虽然大数据和智能技术在疫情防控过程中可以发挥重大作用,但从此次疫情应对情况来看,特别是基于互联网企业在数据驱动的疫情防控过程中发挥的作用来看,仍有很大空间值得挖掘和提升。

数据来源有限,采集手段落后


  从各互联网企业的案例中不难看出,大部分企业在疫情防控中的数据基本来源于政府公开数据,而目前政府公开的数据维度不够丰富,难以满足公众需求。
  在大数据时代,公众的信息需求发生了变化,面对疫情,公众关注的重点不仅仅是防控工作动态、自我防护知识、相关政策文件等信息,同时更加关注一些具体的、量化的疫情相关数据。
  例如,公众既希望获知一个地方总体概况的统计数据(各个省市或区县每天累计有多少疑似、确诊、危重、出院或死亡病例?每天又新增或减少了多少?疑似病例中有多少人被排除了?密切接触者中又有多少人被解除了观察?),也希望获知相关病人个体的数据(这些病人分别从哪里来?去过哪里?哪天发病?在哪家医院就诊?有什么病症?目前情况如何?)。根据目前政府公开的信息和企业案例中提供的数据,绝大部分地区都还难以满足这些需求。
  此外,一些政府部门和基层组织在采集疫情相关数据时仍然采用手工作坊式的人海战术,通常采用手工填表、電话问询等方式,这既给基层工作人员增加负担,也无法保证数据的真实性。例如,在采集患者个人信息时,由于没有区分所留手机号是病患的还是病患家属的,可能导致运营商系统核验存在大量身份号与手机号不一致的结果,给后续数据分析的准确性和真实性造成困难。

数据缺乏治理,数据质量堪忧


  从疫情分析的数据来看,目前公开渠道获取的数据不规范,数据口径、数据统计时间等维度不统一,为分析带来很大困难。数据源混杂重复、数据质量不高的情况十分普遍,数据可信性有待提升。
  疫情防控分析过程中,每时每刻都在产生大量的数据。一个疏忽错登的身份号、一条记录不详的家庭住址、一次出行信息的瞒报、一例本人未知的密切接触,都可能成为触发新疫情的导火索。对大数据的预处理阶段的不重视,数据处理的不规范,很可能导致真实数据获取难度的增加。从现有数据上报形式和数据上报的质量来看,数据上报过程中还存在很多不规范、不合理的情况。
  以上种种原因,导致数据的可用性差、质量差、不准确。防控分析大数据的意义不仅仅是要收集规模庞大的数据信息,还要对收集到的数据进行很好地预处理,让数据分析和数据挖掘人员从可用性高的大数据中提取有价值的信息,这才是最终目标。

隐私保护不足,存在合规风险


  随着新冠肺炎疫情防控形势不断升级,各地纷纷采取多样的宣传预防方式,其中,排查上报重点地区返乡人员和确诊患者信息,是一项十分重要的举措,能够帮助卫生监督机构及时掌握情况,迅速切断传播。虽然有关部门第一时间制作了隐去个人隐私信息的确诊患者相同行程查询工具,但在原始数据上报过程中,数据还是遭到不同程度的泄露。不久前有许多载有个人信息的文件,突然间在微信、微博等社交平台上疯狂转发,内容包括相关人员的姓名、照片、工作单位、就读学校、家庭住址、手机号码及身份号等,给返乡人员及确诊患者的生活带来极大困扰,不少人接到骚扰电话和谩骂短信,暴露出个人数据保护的不足。
  《中华人民共和国民法总则》第一百一十条、第一百一十一条规定:公民享有隐私权,个人信息受法律保护,任何组织和个人不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息。《中华人民共和国传染病防治法》第十二条也有相关规定,疾病预防控制机构、医疗机构不得泄露涉及个人隐私的有关信息、资料。
  在疫情防控的特殊时期,公众知情权、公共安全与公民隐私权需要兼顾平衡。基于疫情防控这一公共利益的切实需要,可以对特殊人群的特定信息进行披露,但应当遵循合规原则,公开内容应确实必要,符合疫情防控目的,公开手段应合理适当,尽可能将负面影响降到最低。
  为做好新冠肺炎疫情联防联控中的个人信息保护,积极利用包括个人信息在内的大数据支撑联防联控工作,中央网络安全和信息化委员会办公室在2020年2月4日发布《关于做好个人信息保护利用大数据支撑联防联控工作的通知》,明确为疫情防控、疾病防治收集的个人信息,不得用于其他用途。任何单位和个人未经被收集者同意,不得公开姓名、年龄、身份号码等个人信息。
  通知要求,各地区各部门要高度重视个人信息保护工作,除国务院卫生健康部门依据《中华人民共和国网络安全法》《中华人民共和国传染病防治法》《突发公共卫生事件应急条例》授权的机构外,其他任何单位和个人不得以疫情防控、疾病防治为由,未经被收集者同意收集使用个人信息。法律、行政法规另有规定的,按其规定执行。
  通知还要求,收集必需的个人信息应参照国家标准的个人信息安全规范,坚持最小范围原则,收集对象原则上限于确诊者、疑似者、密切接触者等重点人群,一般不针对特定地区的所有人群,防止形成对特定地域人群的事实上歧视。
  通知明确,为疫情防控、疾病防治收集的个人信息,不得用于其他用途。任何单位和个人未经被收集者同意,不得公开姓名、年龄、身份号码、电话号码、家庭住址等个人信息,因联防联控工作需要,且经过脱敏处理的除外。

数据流通不足,数据孤岛严重


  大数据的核心在于互联互通。只有融会了多源数据,才能体现大数据的价值。在疫情防控中我们也看到数据分散割裂、聚而不通、通而不用的问题。这很大程度上是因为数据源与数据开发能力不匹配所导致的,即掌握数据的一方缺少足够的数据开发利用能力,而拥有数据开发能力的一方没有足够的数据,致使数据无法流通并发挥最大作用。
  同时,不同企业和政府部门的数据呈现“孤岛”形态,数据亟需高效整合。全国各级地方政府部门、各大互联网企业利用大数据防疫的挑战之一就是数据的碎片化。从多个互联网企业案例来看,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同部门的数据技术也有可能不一样,这导致地区内部、企业内部自己的数据都没法打通。如果不打通这些数据,大数据的价值将非常难挖掘。大数据需要不同数据的关联和整合才能更好地发挥优势。如何将数据打通,并且实现技术和工具共享,是更好地体现大数据在防疫中的价值的关键。
  编辑:张程
其他文献
凭借着一档综艺节目,湖南广电旗下的芒果超媒一路乘风破浪,“逆袭”背靠BAT(百度、阿里巴巴、腾讯缩写)的爱奇艺、优酷和腾讯视频,成为国内在线视频类领域市值最高的公司。截至9月7日,芒果超媒的市值已经超过1300亿元。  一家不具有互联网基因的公司,短短数年时间,在一个互联网领域中能够做到与行业巨头分庭抗礼,这种案例并不多见。芒果超媒的成功堪称国有企业向互联网转型的典范。  那么这样一家体制内的公司
东汉初年,苦于国库不丰的汉明帝得到一笔“意外之财”,于是马上遍赏群臣。没想到,有一位官员竟然“拒受”,令皇帝和满朝文武颇为尴尬。  事情的起因是交趾太守张恢因犯贪赃千金之罪,被召回京伏法。其所贪之金银珠宝“簿入大司农”。汉明帝下诏将这些金银珠宝遍赏群臣。交趾是产珠玑之地,贪赃者自是近水楼台,贪得珠玑不可胜数。碰到这样的“好事”,文武官员皆喜不自胜,无不叩头跪拜。但在尚书钟离意的眼中,这些不是珠玑珍
选题来源:上海市静安区人民检察院  案件类型:诈骗罪  3月的一天,家住徐汇区的张先生在网站上看到了上海申通地铁集团有限公司招工信息,信息称上海地铁正在大量招聘,月薪均在4500元至6000元,甚至还能包吃包住。由于受到疫情影响,夫妻俩正双双待业在家,看到这样一则待遇还不错的招聘信息张先生感到十分心动,还把招聘信息转发给了妻子。经过考虑,夫妻俩决定一起投递简历,分别去竞聘安检员和票务员。  对方“
以信息技术为代表的全球新一轮科技与产业革命方兴未艾。数字化、网络化与智能化正推动经济社会的全面发展,不断改善人类的生活品质,并带给我们新的机遇和挑战。  过去20年,中国互联网产业从无到有,迅速壮大,成长为数万亿元规模的重要产业。如今,中国移动互联网的普及率远远超过欧美,移动支付交易额更是欧美国家的十倍以上。中国公司不但开始跻身全球市值最大的十家科技公司之列,而且中美两国已经成为全球独角兽企业最多
印度女性集会要求享有财产继承权最新判例化解争议  8月11日,印度最高法院针对《印度继承法》中的争议部分作出了判决,对女性的家庭财产继承权给出了明确的说明,以便实施更有效的保护。印度各界人士表示,这是一次“具有划时代意义的判决”,也是印度女性争取财产权所取得的新成果。  早在1956年,印度就颁布实施了《印度继承法》。在这部当时被称赞“非常先进”的法律中,印度女性竟然不能享有家庭财产的继承权,只能
如果你站在阿姆斯特丹法学院门口,一定想不到,这古色古香的罗马式廊柱旁约200米处,就是悬挂着魅惑彩灯的红灯区。这个城市有着出人意料的宽容与多样化。在这里,被许多国家明令禁止的赌博、吸毒和嫖娼都是合法的。然而,这个城市也并非总是充斥着狂野与放纵。这里有伊拉斯谟、斯宾诺莎和格劳修斯的哲思,有伦勃朗、凡·高的光影、线条与色彩,有东印度公司的“海上马车夫”荣光,还有郁金香泡沫带来的疯狂与毁灭,更有无数犹太
《校塔枪击案(Tower)》  官方网站|www.towerdocumentary.com  语言|英语  首播|2016-03-13  1966年8月1日,美国德克萨斯州首府奥斯汀市发生了一起骇人听闻的枪击案。24岁的白人青年查尔斯·惠德曼在家中杀死母亲与妻子后,携带枪支走上奥斯汀市的制高点——德州大学的塔楼,从塔楼28层的观光台向下开枪,无差别射击路人。这起惨案最终造成16人死亡,30多人受伤
纠纷源起:参赛摄影作品被编入年鉴  刘琪是江苏淮安市一名摄影爱好者,于2015年成功创作了“森林公园”“夕映里运河”等摄影作品,并获得相关作品登记证书。  2015年9月30日,江苏省淮安市生态新城管委会及淮安市摄影家协会共同举办2015淮安生态新城摄影大赛征稿活动。《2015淮安生态新城摄影大赛征稿启事》第三条第一款中载明“对于参赛作品不退稿”;第三条第三款载明“主办单位对所有入选作品,有权在相
5月10日是一年一度的阿里日,每年的这一天,阿里的员工都可以带孩子上班,穿睡衣上班。总之,怎么舒服怎么做。这一天,阿里还有两个传统项目:开放公司为“亲友日”;举行阿里巴巴员工集体婚礼。在历来的员工集体婚礼上,马云的证婚词也是一大亮点。  今年的員工集体婚礼上,证婚人马云再次爆出金句:“婚姻最好的算法是算了吧。”瞬间成为网红语句。马云还说,“今年是第14个阿里日,也是第13场集体婚礼,所以今年又叫1
汉高祖刘邦出身布衣,路人皆知。据《史记·高祖本纪》记载:高祖,沛丰邑中阳里人,姓刘氏,字季。父曰太公,母曰刘媪。“太公”“媪”在中国古代,是老翁、老婆婆的惯用称谓,平常无奇。  但当刘邦坐上了龙墩、成了皇帝,昔日的布衣身世竟罩上了奇异的光环。《史记·高祖本纪》紧接着写道:“其先刘媪尝息大泽之陂,梦与神遇。是时雷电晦冥,太公往视,则见蛟龙于其上。已而有身,遂产高祖。”看!由这里刘邦一下子成了龙种。