数据存储量不够、数据共享度不高、数据分析力不强、数据传播能力薄弱等问题,正在制约着大数据应用于社会治理 文/《瞭望》新闻周刊记者 周琳 叶健 如果你读过《三体》,一定知道二向箔:三体人用一张二向箔,轻易地就将三维的太阳系二维化了,消灭了全人类。 如果你是电影迷,可能看过《美国队长2》。电影里一个计算机程序对所有人的所有兴趣爱好、价值取向、日常选择进行综合分析,最后得出这个人是否对自己的计划有威胁并实现定点打击。 这些当然是科幻环节,但却并非没有理论基础。在《瞭望》新闻周刊记者采访的不少大数据专家看来,“大数据”的分析处理就如同在一个多维的空间内去处理信息:假设有一只蚂蚁在一张白纸上爬行,当它靠近边缘可能掉下去时,处于三维空间的人可以随时把它救回来。当数据积累足够、分析模型强大,“大数据”就能实现上面的科幻情节:它不仅知道已经发生了什么,还能预测未来将会发生什么。 那么,海量数据能够给我们的城市公共安全带来什么? 预警未知风险 1月26日开始,纽约等美国东北部地区遭遇一场罕见的暴风雪,导致纽约州、新泽西州、康涅狄格州、罗得岛州、马萨诸塞州等多个州宣布进入紧急状态,近万架次航班取消,联合国总部取消“国际大屠杀纪念日”相关活动。 虽然最终对于纽约等部分地区而言,大雪并未肆虐太久,但提前预防也有必要。美国国家气象局长路易斯·乌切利尼也公开表示,此次暴风雪中交通事故数量和死亡人数均少于此前类似事件,做好最坏的打算是“正确的决定”。 而此次能让纽约提前反应的就是其大数据预测系统。美国海洋大气管理局拥有的全球气象预报系统(GFS)模型是全世界最广泛应用的气象预报工具之一。网易评论专栏作者胡雁冰撰文表示,得益于领先的气象设备和卫星技术,美国国家气象局能够利用遍布全球各地的观测点和气象卫星进行数据计算,提供全球未来8天的精确预测和16天的趋势预测。 大数据对于“天灾”救援也有用武之地。上海交通大学大数据工程技术研究中心研究发现,一旦发生自然灾害,通过大数据技术建立海量遥感数据获取、存储与分析体系,将为“理性救灾”指明道路。也就是说,在地震发生后的第一时间,依靠卫星或航空遥感技术,远程获取灾区现场数据,评估和预测灾区受损情况,明确物资需求,规划救援道路,从而有助于制定合理的救援计划,最大程度减小灾害影响。 对于特大型城市而言,大数据也能针对人流量超载发出预警,避免踩踏事件发生。 上海交通大学大数据工程技术研究中心研究发现,基于随机矩阵理论的大数据分析方法可进行建模,数据模型可判断出实时人流状态,并可同时预测未来5~10分钟该区域内人群密度的变化趋势,第一时间提供相关部门决策支持。一旦人流密集度超出预警标准,系统将立即发出报警,并根据事态成因、人群行为分析和周边通道状况建立应急疏散模型,从中优化选择最佳方案,供指挥中心发出客流疏导指令。 大数据技术用于公共安全管理体系事先预警是可行的。同济大学建筑与城市规划学院一项课题显示,手机就是当下最普及的移动定位设备之一。数据显示,2013年末上海市手机普及率132.5%,总用户3200.65万。用手机定位数据研究居民在城市空间的活动,可以对城市人流平均密度进行分级,甚至实现预警。 “富矿”尚未开启 “我国人口众多,重大文体活动、节假日集会等活动中,容易出现因人群过度拥挤而引发的危险乃至事故”。百度研究院大数据实验室专家表示,通过大数据对人流量的定位数据、搜索数据进行深度挖掘发现,根据地图上相关地点搜索的请求量,可能提前几十分钟预测出人流量峰值,提前采取措施进行预防。但政府部门对突发的公共安全事件中大数据的分析能力还有待提高,大数据这一“富矿”还未真正开启。 数据存储量不够、数据共享度不高、数据分析力不强、数据传播能力薄弱等问题,正在制约着大数据应用于社会治理。 首先,数据存储量不够。上海交通信息中心主任何承告诉本刊记者,尽管上海交通信息中心掌握的交通方面信息并不少,但是很多数据还是很缺乏。例如,由于公交车乘客下车不用刷卡,所以从技术上就很难知道公交站点实时人流量;对于像公园、景区等人流量较大的区域,可供市民行走的面积也不清楚,因为还要剔除景观、绿化带的面积。 其次,数据共享度不高。记者采访发现,目前各个部门拥“数”自重的情况还很严重。一位内部人士表示,这些数据对于部门不仅涉及到安全,甚至与利益直接挂钩。例如公交公司此前就不乐意共享客流数据,因为客流数据能反映企业真实的经营情况,这可能会影响政府相关补贴的增减。 “数据割裂的状况下是无法完成大数据治理的。”中关村大数据产业联盟秘书长赵国栋说,以外滩踩踏为例,交通部门及运营商能掌握人流聚集情况,而百度、腾讯等公司能通过用户搜索知道聚集原因,综合这些信息才能对人群走向及规模做出完整的判断。 英特尔中国研究院院长吴甘沙认为,目前很多地方官员还没有意识到数据开放能带来的巨大价值,同时经信委、统计局等机构又缺乏打破部门壁垒、全面搜集数据的能力。 第三,数据分析力不强。何承说,大数据可以提出预警,但是预警值还需要专业部门提出。在世博会期间人群聚集达30万人是正常的,而在外滩聚集30万人可能就是危险的,而这个“预警阈值”还需要靠专业人士给出,光靠技术人员是无法提供的。 例如在一些公共景区的管理中,规定室外空间超过0.75平方米/人时,就要采取限流措施,但“0.75”这个值的判断需要进行系统的评估和研究。 “就算我们拿到了大量的数据,也不一定知道怎么使用。”上海交通大学大数据工程技术研究中心副主任金之俭说,我们的模型还不够强大、处理手段还比较单一,多维数据传递了很多信息,而我们只能不断过滤,最终只会让预测的风险出现更多误差。“这就好比三维空间的人无法理解四维空间的信息一样,到了阈值再做预警就晚了。” 第四,数据传播手段单一。比如美国有一整套“紧急预警系统”:采用专网、广播、商业通信、社交网络等工具发布预警信息,“立体化”地对公众进行信息播报,确保灾害、避难等有效信息能及时传达。 据介绍,这一系统将在可能发生洪水、飓风、沙尘暴和暴风雪时通过一些兼容的智能手机发送警告信息,不过它对发送的地区、手机型号、字符数量都有一定的限制,但常用的手机型号都是可以兼容的。对于无法立刻观看电视或收听广播的人而言,这种信息渠道显得至关重要。而这种数据传播的系统,我们也非常缺乏。 提高大数据治理能力 专家认为,应利用手机或移动终端,建立“大数据”模型分析并预测风险,发挥其对公共安全危机的重要预警作用,避免大数据成为闲置的“大量数据”。基于数据资源体系的公共安全数据资源管理平台,对城市运行中有关公共安全的数据进行采集、整合、加工,通过一些特定的交通、人流、气象等信息,梳理城市运行体征,为城市运行安全监测、综合分析、预警预测、辅助决策等提供服务,最终提高城市公共安全管理水平。 首先,政府需要搭建开放平台,这是大数据治理的基础。赵国栋认为,无论是数据汇集还是数据挖掘,光靠政府是无法充分体现价值的,因此政府应当抱有开放的心态。我们在和一些地方政府接触时,它们更强调企业的地域属性,这显然不利于发展。而像贵阳市即将在全城布点无线WiFi,并且将WiFi里产生的数据无偿向社会开放,这就是政府开放的积极探索。 其次,政府利用购买服务等方式整合多方数据,共同挖掘数据价值。百度研究院大数据实验室专家表示,百度作为互联网企业,掌握了大量搜索、地图等实时信息,但是这些数据如何用于社会治理,还需政府主动作为、提出需求。例如某地区有50人或5万人搜索“PX”,背后的含义就完全不同。 吴甘沙介绍,通信运营商手中掌握了大量有价值的数据,但这些数据远没有被充分利用。如果运营商数据利用得当,不仅可以预测人流量,预警公共事件,而且可以辅助城市规划、确定公交线路等,这也将提升城市治理水平。
此外,大数据治理还需完善相关法律法规。专家告诉本刊记者,百度虽然掌握了大量数据,但是其中也涉及用户的个人隐私,怎样使用才算合法现在还不明确。如果要与政府展开合作,也需要在合法合规的前提下,因此期待相关法律进一步明确。 |