论文部分内容阅读
提到反腐,听惯了打老虎、拍苍蝇,总还有些事出乎意料——
欠款200万元的“老赖”,是当年的三八红旗手;江西某公司3年来在沈阳投标337次,中标率却为0;辽宁沈阳市有4000余人在吃“死人低保”,1627家单位有1821个小金库……而发现这些问题的,是一个大数据平台。
“正风肃纪大数据监督平台”由沈阳市纪委监委与中科院计算所联手打造,数据总量有25.1亿条,覆盖了全市1130家职能单位,涉及民政、医保、科技、人防、债务、招投标等十几个领域。“大数据监督的范围更广更深,可以发现信访和巡查发现不了的点对点的问题。”中科院计算技术研究所的研究员方金云说。
常被提及的一组数字是——按照传统的工作方式,沈阳市纪委监委一年能发现31800多个问题。而大数据系统建立后,仅民生领域,一天就发现了81641笔问题资金,涉及9608人,经民政部门自查自纠,挽回损失5000万元。“监督也是生产力。”方金云补充。
为了用数学模型刻画权力运行的轨迹,方金云成了懂政府管理流程的科学家;沈阳市纪委监委纪检监察—室副主任查岩,也成了懂大数据的纪检干部。
“跨界”,不约而同,是这两人口中的高频词汇。
纪委来了群科学家
“政府的管理体系和决策流程有一整套规范,顺着去捋,很难发现问题;建立数学模型,逆向看,就可能找到症结。”方金云一边说,一边用右手食指在左手掌写着“逆向”。
他说话不快,眼神认真,手会习惯性比画,似乎一定要为每句话的重点留痕。上楼梯,在空气中写;饭桌前,在桌子上画;坐到办公桌前终于能拿起笔,文字、方框、箭头,纸上很快搭起了框图。
科学研究要把社会问题抽象成普遍模型,再去求解,这是活在数字系统中的方金云擅长的。
以城市低保发放为例,针对开着宝马领低保、当着干部领低保,甚至人己去世但低保照发的情况,可以反向查找违规操作。表现在数学模型上,就是用车辆信息、干部名单和死亡登记的集合来与低保名单的集合求交集,若结果不是空集,那就是疑似问题的线索。
“不从社会管理角度出发,跨到纪检的业务领域,建立的模型就无法涵盖所有问题;同样,纪检人员也要瞳些大数据知识。”方金云说,跨界学习是必须。
刘晓东在计算所读书时研究软件架构,博士毕业留所工作,现在是团队骨干之一。他擅长打比方,数据库是盛数据的水池,“我就是造池子的,先做高做大,接着扩容,数据量继续增加,就得考虑换方案了。”
在给纪委监委的同事们讲架构时,他会打最易懂的比方——用平台和餐厅作比,数据就像菜篮子,纪委监委业务人员、工程师是负责不同部分的厨师,智能分析平台就是锅碗等厨房用具,数据备案平台则是食材保鲜冷库。要做好饭菜,哪个都少不了。
他们从监察对象和党员名单的区分,讨论到怎么解决死亡数据表标示不统一……很多政务知识刘晓东都是第一次接触,“真正参与项目才发现,比单纯搞研究复杂很多,但真的做出了东西,又觉得很有意思。”
“用上大数据,多做‘健康体检’,就可以少做‘大病治疗’,也不会‘病入膏肓’。”方金云认为,及早发现问题,填补政策或管理漏洞,才是大有裨益的监督。
“技术手段发现苍蝇”
让方金云和查岩费了最多脑筋的,是最重要的监督要素模型一一应覆盖哪些因素,才能普适于任一部门,完成全链条监督?
最终设计的5+N系统,从两个维度考量,框定了五大标准数据库和业务库:前者包含资金、项目、物资、决策、权力这五类,后者则是具体经手的各业务。“闭着眼睛想一下,除了这些,一个单位就没别的了。”方金云眯着眼,反复念叨了几遍。
标准乍一看似有交叉,但背后的概念范畴他们反复推敲、明确界定,就像数学概念里作为一般思维形式的判断与推理一样。
资金包含了补贴、救助等多项公共资金明细;项目建设包含完整审批流程,达到必要的深度广度;物资指向公有资产,存量有哪些,新增的如何采购、怎么发放;决策针对部门权限;权力则具体到个人。
大数据仓库从全市97个市直部门、13个区县采集了资金和项目数据,还自行收集了政府项目补贴资金、党员和六类监察对象名单等数据,能查出小金库、加油卡,也可以揪出冒领低保的村支书、贪污百万元的镇长。
在中科院计算所所长孙凝晖眼中,反腐工作“过去主要靠人力,现在技术手段可以发现很多苍蝇,人的手段就能去打老虎,打大案要案,如此就能有所分工”。
自2019年初起,针对大数据监督平台的讲解报告,在沈阳纪委大楼进行了174场,正风肃纪宣传片被一遍遍播放。截至5月底,沈阳市已有4326名基层领导来参观学习过。
有来参观过的官员,几天后开车回来交代问题,后备厢里是码得整整齐齐的现金。
沈阳市开展正风肃纪监督以来,共13707人主动交代存在虚报冒领各类补贴、私车公养、小金库等问题,主动上缴2.28亿元。
方金云被允许旁听过对留置人员的谈话。查岩几个问题抛出去,包间里的官员们就会事无巨细地讲出自己的经历。
对收的第一笔钱记忆犹新,这是共同点之一:何时,何地,谁给的,数额多少,涉案百万千万的贪官,也还记得那一瞬的犹豫。
手一旦伸出去,想缩回来就很难。看着那些颓唐的脸,方金云觉得难受,“培养一个成熟的干部很不容易,每个人背后都还有一大家子,早提醒、早收手就不至于如此”。
方金云很认同沈阳市纪委书记王冬石的观点——“纪委监委要保护干部安全,要做有温度的监督,既要暴风骤雨,也要和风细雨、春风化雨。”
鞍钢纪委班子也来沈阳取经,这个被称为“40里钢城”的大型国企,每年仅采购资金就以百亿计,存在新购原料设备掺假、资产流失的现象,监督责任重大,來者一直追问企业监督体系如何搭建。 具体分管此项工作的纪委常委、监委委员张中人坦言:“公开是原则。”
查办沈阳水务集团原董事长陈阳5000万贪腐案之后,水务集团的所有项目、物资、资金植入了大数据系统,2016年至今的三公支出、项目建设皆可查询。这就是一个典型的企业公示平台。
而公示本身,就像是单枪匹马在挑战多年形成的官僚体系。“宁听骂声,不听哭声。”张中人半开玩笑地说。
“要数据就是动奶酪”
以往,纪委的工作总跟在信访举报和巡查后面,而大数据监督,是打提前战。
2017年12月8日,习近平总书记在中共中央政治局集体学习时提出要“运用大数据提升国家治理现代化水平”。今年1月11日,中共中央政治局常委、中央纪律检查委员会书记赵乐际在代表中央纪律检查委员会常务委员会向第十九届中央纪律检查委员会第三次全体会议作工作报告时也指出,搭建互联网、大数据监督平台,积极畅通渠道,拓宽线索来源。
然而,“要数据就是动奶酪,这是很敏感的。”查岩打了个比方,“每间办公室就像一个政府系统,关上门就是舒适空间,如果门外的人有钥匙,也有权进门,那房内的人岂不是随时如坐针毡?”
他们首先选择了最贴近百姓生活的民生问题。方金云曾与湖南怀化纪委合作,搭建“互联网+监督”系统。湖南是扶贫大省,监督重点是扶贫资金,包含低保、补偿金、危房改造款、种地免息贷款等107项。主要数据在民政局和农业农村局两个部门,方金云团队通过比对人员信息库和民生资金信息库,很快就发现了上万条疑似问题线索。
采用类似方式为沈阳民政数据建模后,8万笔异常资金仅用1天就发现,相关负责人半夜赶来纪委监委检讨。
沈阳从民生领域打开了口子,但各部门间信息孤岛存在己久,还是有单位捂着盖着。以工程项目为例,从立项、勘察、设计、施工、监理、采购到验收,牵涉众多部门,自建系统规则不一,公示信息深浅不同,别说互相沟通业务,即使同一家单位,不同处室也可能如隔天堑。
为了数据,纪检工作人员们一次次去大数据局、建设局、财政局、人社局、交通局等部门备份,再由技术团队将零散破碎的政务数据汇集成原生数据池,经过清洗筛选加工,形成大数据仓库。
由于不同部门的信息化发展程度和规模不同,在收集数据时他们制定了最低标准,设计了所有部门都能填满的表格。
“我们需要最新最准的信息,可以从六七个维度刻画出一个人。”刘晓东博士指着后台繁复的信息采集表说,这些表固定了他们经过“烧脑”列出的项目,个人和单位会按周期自行提交数据。
敬畏数据,敬畏边界
全国有29万个叫王伟的人,在这个公开的大数据平台,普通人可以查到沈阳市的“王伟”有9234条资金记录和7条项目记录,既有5元的电价补贴,也有千元的公益性岗位补贴,还有河道维修和主题街区改造工程。
这些与“王伟”有关的记录,任何人发现问题都能一键投诉举报。
类似大数据采集,总是绕不开隐私之問。
“我们的数据不涉及公民隐私,都是干干净净的政务数据,除非已经被定罪的人才会纳入执纪系统。”方金云始终坚持将数据监督与执纪区分。
执纪是查案,凡是使用过身份证的地方都有记录,可以画出嫌疑人的生活轨迹;纪委监委主责是监督,统计廉政档案,是在为好人画像。
方金云几乎可以背下监督执纪工作规则,也自学了相关的法律法规,“大数据监督一定要有边界,不能突破。要对大数据心存敬畏,对边界心存敬畏,就像孙建军副书记说的,我们不能做数据的法西斯。”
自我监督是世界性难题,大数据监督就是破题的秘密武器。
大数据平台初见成效,他们坚信自己走在正确的路上,“推进数据备案监督条例出台是我们一直在努力的”。
查岩认为,网络实名制购票刚面世时阻力不小,现在早已成了人们的习惯,数据监督也会成为权力运行相伴的习惯。
全流程数据采集之后,“烧账本、砸电脑都没用了,上下游齐全,就能恢复缺失部分,这就是数字的力量。”方金云说。
而方金云只给现在的工作打了30分,因为“目前的数据还不够深,不够广,离目标还差很远”。2.0平台的建设,会通过机器更深度的学习,进一步发挥预警作用。方金云希望这个走在世界前列的监督系统,还可能为全球治理指路。
“大数据监督技术实验室”挂牌那天,沈阳市纪委监委的工作人员韩冰感慨:“不要问人工智能和基因改造哪个先杀死人类,要问人类能用这些做到什么,就如同当年的火、铁器、蒸汽机。”
查岩的微信名是“小李飞刀”,他解释这叫“例无虚发”。方金云笑着补充:“出手必封喉,一招制敌,办案如此,做大数据监督也一样。”(资料来源:《解放日报》)
欠款200万元的“老赖”,是当年的三八红旗手;江西某公司3年来在沈阳投标337次,中标率却为0;辽宁沈阳市有4000余人在吃“死人低保”,1627家单位有1821个小金库……而发现这些问题的,是一个大数据平台。
“正风肃纪大数据监督平台”由沈阳市纪委监委与中科院计算所联手打造,数据总量有25.1亿条,覆盖了全市1130家职能单位,涉及民政、医保、科技、人防、债务、招投标等十几个领域。“大数据监督的范围更广更深,可以发现信访和巡查发现不了的点对点的问题。”中科院计算技术研究所的研究员方金云说。
常被提及的一组数字是——按照传统的工作方式,沈阳市纪委监委一年能发现31800多个问题。而大数据系统建立后,仅民生领域,一天就发现了81641笔问题资金,涉及9608人,经民政部门自查自纠,挽回损失5000万元。“监督也是生产力。”方金云补充。
为了用数学模型刻画权力运行的轨迹,方金云成了懂政府管理流程的科学家;沈阳市纪委监委纪检监察—室副主任查岩,也成了懂大数据的纪检干部。
“跨界”,不约而同,是这两人口中的高频词汇。
纪委来了群科学家
“政府的管理体系和决策流程有一整套规范,顺着去捋,很难发现问题;建立数学模型,逆向看,就可能找到症结。”方金云一边说,一边用右手食指在左手掌写着“逆向”。
他说话不快,眼神认真,手会习惯性比画,似乎一定要为每句话的重点留痕。上楼梯,在空气中写;饭桌前,在桌子上画;坐到办公桌前终于能拿起笔,文字、方框、箭头,纸上很快搭起了框图。
科学研究要把社会问题抽象成普遍模型,再去求解,这是活在数字系统中的方金云擅长的。
以城市低保发放为例,针对开着宝马领低保、当着干部领低保,甚至人己去世但低保照发的情况,可以反向查找违规操作。表现在数学模型上,就是用车辆信息、干部名单和死亡登记的集合来与低保名单的集合求交集,若结果不是空集,那就是疑似问题的线索。
“不从社会管理角度出发,跨到纪检的业务领域,建立的模型就无法涵盖所有问题;同样,纪检人员也要瞳些大数据知识。”方金云说,跨界学习是必须。
刘晓东在计算所读书时研究软件架构,博士毕业留所工作,现在是团队骨干之一。他擅长打比方,数据库是盛数据的水池,“我就是造池子的,先做高做大,接着扩容,数据量继续增加,就得考虑换方案了。”
在给纪委监委的同事们讲架构时,他会打最易懂的比方——用平台和餐厅作比,数据就像菜篮子,纪委监委业务人员、工程师是负责不同部分的厨师,智能分析平台就是锅碗等厨房用具,数据备案平台则是食材保鲜冷库。要做好饭菜,哪个都少不了。
他们从监察对象和党员名单的区分,讨论到怎么解决死亡数据表标示不统一……很多政务知识刘晓东都是第一次接触,“真正参与项目才发现,比单纯搞研究复杂很多,但真的做出了东西,又觉得很有意思。”
“用上大数据,多做‘健康体检’,就可以少做‘大病治疗’,也不会‘病入膏肓’。”方金云认为,及早发现问题,填补政策或管理漏洞,才是大有裨益的监督。
“技术手段发现苍蝇”
让方金云和查岩费了最多脑筋的,是最重要的监督要素模型一一应覆盖哪些因素,才能普适于任一部门,完成全链条监督?
最终设计的5+N系统,从两个维度考量,框定了五大标准数据库和业务库:前者包含资金、项目、物资、决策、权力这五类,后者则是具体经手的各业务。“闭着眼睛想一下,除了这些,一个单位就没别的了。”方金云眯着眼,反复念叨了几遍。
标准乍一看似有交叉,但背后的概念范畴他们反复推敲、明确界定,就像数学概念里作为一般思维形式的判断与推理一样。
资金包含了补贴、救助等多项公共资金明细;项目建设包含完整审批流程,达到必要的深度广度;物资指向公有资产,存量有哪些,新增的如何采购、怎么发放;决策针对部门权限;权力则具体到个人。
大数据仓库从全市97个市直部门、13个区县采集了资金和项目数据,还自行收集了政府项目补贴资金、党员和六类监察对象名单等数据,能查出小金库、加油卡,也可以揪出冒领低保的村支书、贪污百万元的镇长。
在中科院计算所所长孙凝晖眼中,反腐工作“过去主要靠人力,现在技术手段可以发现很多苍蝇,人的手段就能去打老虎,打大案要案,如此就能有所分工”。
自2019年初起,针对大数据监督平台的讲解报告,在沈阳纪委大楼进行了174场,正风肃纪宣传片被一遍遍播放。截至5月底,沈阳市已有4326名基层领导来参观学习过。
有来参观过的官员,几天后开车回来交代问题,后备厢里是码得整整齐齐的现金。
沈阳市开展正风肃纪监督以来,共13707人主动交代存在虚报冒领各类补贴、私车公养、小金库等问题,主动上缴2.28亿元。
方金云被允许旁听过对留置人员的谈话。查岩几个问题抛出去,包间里的官员们就会事无巨细地讲出自己的经历。
对收的第一笔钱记忆犹新,这是共同点之一:何时,何地,谁给的,数额多少,涉案百万千万的贪官,也还记得那一瞬的犹豫。
手一旦伸出去,想缩回来就很难。看着那些颓唐的脸,方金云觉得难受,“培养一个成熟的干部很不容易,每个人背后都还有一大家子,早提醒、早收手就不至于如此”。
方金云很认同沈阳市纪委书记王冬石的观点——“纪委监委要保护干部安全,要做有温度的监督,既要暴风骤雨,也要和风细雨、春风化雨。”
鞍钢纪委班子也来沈阳取经,这个被称为“40里钢城”的大型国企,每年仅采购资金就以百亿计,存在新购原料设备掺假、资产流失的现象,监督责任重大,來者一直追问企业监督体系如何搭建。 具体分管此项工作的纪委常委、监委委员张中人坦言:“公开是原则。”
查办沈阳水务集团原董事长陈阳5000万贪腐案之后,水务集团的所有项目、物资、资金植入了大数据系统,2016年至今的三公支出、项目建设皆可查询。这就是一个典型的企业公示平台。
而公示本身,就像是单枪匹马在挑战多年形成的官僚体系。“宁听骂声,不听哭声。”张中人半开玩笑地说。
“要数据就是动奶酪”
以往,纪委的工作总跟在信访举报和巡查后面,而大数据监督,是打提前战。
2017年12月8日,习近平总书记在中共中央政治局集体学习时提出要“运用大数据提升国家治理现代化水平”。今年1月11日,中共中央政治局常委、中央纪律检查委员会书记赵乐际在代表中央纪律检查委员会常务委员会向第十九届中央纪律检查委员会第三次全体会议作工作报告时也指出,搭建互联网、大数据监督平台,积极畅通渠道,拓宽线索来源。
然而,“要数据就是动奶酪,这是很敏感的。”查岩打了个比方,“每间办公室就像一个政府系统,关上门就是舒适空间,如果门外的人有钥匙,也有权进门,那房内的人岂不是随时如坐针毡?”
他们首先选择了最贴近百姓生活的民生问题。方金云曾与湖南怀化纪委合作,搭建“互联网+监督”系统。湖南是扶贫大省,监督重点是扶贫资金,包含低保、补偿金、危房改造款、种地免息贷款等107项。主要数据在民政局和农业农村局两个部门,方金云团队通过比对人员信息库和民生资金信息库,很快就发现了上万条疑似问题线索。
采用类似方式为沈阳民政数据建模后,8万笔异常资金仅用1天就发现,相关负责人半夜赶来纪委监委检讨。
沈阳从民生领域打开了口子,但各部门间信息孤岛存在己久,还是有单位捂着盖着。以工程项目为例,从立项、勘察、设计、施工、监理、采购到验收,牵涉众多部门,自建系统规则不一,公示信息深浅不同,别说互相沟通业务,即使同一家单位,不同处室也可能如隔天堑。
为了数据,纪检工作人员们一次次去大数据局、建设局、财政局、人社局、交通局等部门备份,再由技术团队将零散破碎的政务数据汇集成原生数据池,经过清洗筛选加工,形成大数据仓库。
由于不同部门的信息化发展程度和规模不同,在收集数据时他们制定了最低标准,设计了所有部门都能填满的表格。
“我们需要最新最准的信息,可以从六七个维度刻画出一个人。”刘晓东博士指着后台繁复的信息采集表说,这些表固定了他们经过“烧脑”列出的项目,个人和单位会按周期自行提交数据。
敬畏数据,敬畏边界
全国有29万个叫王伟的人,在这个公开的大数据平台,普通人可以查到沈阳市的“王伟”有9234条资金记录和7条项目记录,既有5元的电价补贴,也有千元的公益性岗位补贴,还有河道维修和主题街区改造工程。
这些与“王伟”有关的记录,任何人发现问题都能一键投诉举报。
类似大数据采集,总是绕不开隐私之問。
“我们的数据不涉及公民隐私,都是干干净净的政务数据,除非已经被定罪的人才会纳入执纪系统。”方金云始终坚持将数据监督与执纪区分。
执纪是查案,凡是使用过身份证的地方都有记录,可以画出嫌疑人的生活轨迹;纪委监委主责是监督,统计廉政档案,是在为好人画像。
方金云几乎可以背下监督执纪工作规则,也自学了相关的法律法规,“大数据监督一定要有边界,不能突破。要对大数据心存敬畏,对边界心存敬畏,就像孙建军副书记说的,我们不能做数据的法西斯。”
自我监督是世界性难题,大数据监督就是破题的秘密武器。
大数据平台初见成效,他们坚信自己走在正确的路上,“推进数据备案监督条例出台是我们一直在努力的”。
查岩认为,网络实名制购票刚面世时阻力不小,现在早已成了人们的习惯,数据监督也会成为权力运行相伴的习惯。
全流程数据采集之后,“烧账本、砸电脑都没用了,上下游齐全,就能恢复缺失部分,这就是数字的力量。”方金云说。
而方金云只给现在的工作打了30分,因为“目前的数据还不够深,不够广,离目标还差很远”。2.0平台的建设,会通过机器更深度的学习,进一步发挥预警作用。方金云希望这个走在世界前列的监督系统,还可能为全球治理指路。
“大数据监督技术实验室”挂牌那天,沈阳市纪委监委的工作人员韩冰感慨:“不要问人工智能和基因改造哪个先杀死人类,要问人类能用这些做到什么,就如同当年的火、铁器、蒸汽机。”
查岩的微信名是“小李飞刀”,他解释这叫“例无虚发”。方金云笑着补充:“出手必封喉,一招制敌,办案如此,做大数据监督也一样。”(资料来源:《解放日报》)