5月11日,TeaTalk· Online开源论道系列活动第3期——“洞察大数据,观政务风云”线上直播成功举办。本次直播从“大数据应用市场诉求”、“大数据应用能力创新”、“大数据应用创新实践”这三个方面,让大家知道了大数据的强大包容性,也期望帮助更多客户从不同角度窥见业务新价值。
以下为中国移动云能力中心,大数据行业应用产品经理 魏立力老师演讲实录。说到面向政府客户的大数据服务,不知道大家第一个念头是什么?或者第一个联想到的场景是什么?可能是疫情期间的行程码,可能是社保统计报告,除了这些跟民生息息相关的场景,其实还有很多我们作为个体可能感知不到的,往往都是政府站在我们背后为我们默默服务。这对我们数据服务提供商来说,恰恰也是一大挑战,因为政务服务之广、数据要求之高,比仅仅只是服务特定场景要难得多。先来说说政府近些年来的改变。大家可能都听过数字政府这个概念,政府跟随社会信息化的脚步对管理工作进行了一系列数字化改革,大家才能享受线上办理业务,甚至异地办理,这样福利于民生的服务。与此同时,政府受到数据驱动理念的影响,重视起大数据的价值,不再是笼统的一杆子信息化,而是讲究科学性、精准化,让数据带动绩效。比如在做交通规划或空间规划时,会考虑当前区域内人群流动的数据和人群的特征,像出行高峰、出行方式、人群年龄分布等等,以此评估规划的合理性。现在一些地方政府把大数据作为基础战略资源,尝试用数据说话、用数据决策、用数据管理、用数据创新。政府治理思维发生了转变,我们作为数据提供商更要走在客户的前头,想客户所想,可我们发现这很不容易。首先,不同类别的政府机构能够管理的内容有所不同,比如前面说的交通规划,那么一般覆盖全市道路,而文旅局则可能只关心全市的所有景点,交通规划看的是全部人群,而文旅管理则关注游客动态,政府机构的需求差异性是很大的。其次,从政府机构结构来看,从国家到地方再到街道,不同级别的政府机构所管辖范围不同,高级别的有很明显的行政区概念,而街道或者网格却可能没什么规律可循,数据覆盖面大至全国、小至一个小区或一条步行街。最重要的是数据合规性,这两年《数据安全法》、《个人信息保护法》陆续施行,似乎这跟大量级的统计数据无关,不,并没有那么简单。政府需求差异大、数据覆盖面又不同、对合规性还有高要求,可我们不可能把每个需求都看做独立的项目,一一定制化。站在产品角度来看,面向同质化市场或者说足够多的同类客户层,生产一定标准化的产品,才能够降本增效,拉动市场需求,触发规模化效应。接下来聊聊我们是如何实现大数据应用能力标准化并发挥能力优势的。首先,是构建位置大数据能力底座,汇总各省位置数据:一方面,汇总范围能够覆盖上层应用需求,另一方面,汇总后的解析存储可以兼顾服务对象场景中的共性逻辑。目前底座不仅能够服务于政务客户,还可以服务于商业、旅游两大行业。政务方面则更侧重面向政府部门,提供非特定人群的全域统计服务,例如提供辖区内人群热力分布、常驻人口画像分析等等。说到这,大家可能会好奇,共性逻辑如何抽离?毕竟人群流动具有不可预测性,流动方向呈不规律的发散,而且还要支持不同人群、不同区域、甚至不同时段的分层分析。这时就要亮出我们的法宝了。1、“时间”包括:时刻和时段两种概念。例如,我们描述10点05分,感觉已经很短了;描述工作日的一天,感觉已经很长了。但是10点05分这一分钟又是由60秒组成的;一个工作日由是一个工作周的一个典型单位。因此,我们在描述时刻和时段时,需区分“时间粒度”和“时间跨度”问题。如果我们把“时间跨度”作为一个“游标”,那么这个“游标”的前后滑动,也会在漫长的时间轴上,存在最早点和最新点的限制。也就是可查询的时间范围。另外,从数据诞生时刻算起,经过多轮采集、清洗、运算等处理过程,最终能被我们通过接口查询到还会产生数据时延。2、空间则按照行政区域、自定义区域和栅格来划分。行政区域大家都熟知,就不赘述了,虽然定义很清晰,但是实践时却仍然要做些特殊处理,比如我们常说的苏州工业园区,其实按照民政部划分是不属于行政区的,但是作为经济开发区,它有独立的管委会,会对这个区域有一些数据分析需求,我们的模型就要能够兼容这种情况。自定义区域是用户自定义的目标区域,面积大小在0.01至1万平方公里范围内。栅格则是500*500的网格,一般用于热力图的热力值输出。3、最后来说说人群。我们每个人生来都是多面体,因而不可避免的主动或被动的被贴上各种标签。当我们从整个社会的角度,去分析一些规律性的社会现象,我们并不需要知道分析对象中每个人谁是谁,我们更在意的是这个群体中的特征分布,并利用这些特征分布得出统计学方面的推断。例如上网偏好、居住地偏好等等。模型中还有个隐形却不非常重要的核心逻辑。前面讲到政府客户是非常看重数据合规的,所以空间太小不行、人群太少不行,因为都有可能会暴露个人隐私,在划定区域或栅格、统计数据时就会有一些限制或处理,以此确保对外服务时的数据合规性。有了底座与模型,并结合服务场景配备基础服务,便构筑起了整个大数据应用能力架构,将海量大数据演变为数据服务,能够灵活满足差异化的数据需求和数据覆盖面,满足政务客户诉求的同时,解决能力定制化的痛点。1、丰富的数据资源:覆盖全国300+个城市,百万基站,上亿+手机用户,提供5分钟和1小时粒度,7*24小时全天候人流数据。2、可以多元化统计:拥有数十种维度,可以从不同角度洞察数据。3、能够灵活拓展满足场景需求:从模型到基础服务都能灵活组合,自行搭建应用。4、符合国家法律法规的隐私保护和数据安全:为移动用户负责、为客户负责。通过几个客户案例,让大家更直接的感知下我们能力创建的价值。今天主要分享城市规划建设、应急管理监控和社会人口分析这三个场景的案例,并趁此机会跟大家稍稍透露下我们正在孵化的诈骗态势感知能力。在介绍案例前,强调合作前提:我们政务洞察的数据服务重点面向政府部门或者是信誉良好的大中型企业、研究机构,而且有严格的资质审核流程,在收听直播的朋友们如果对产品感兴趣,还请关注知悉。第一个案例是面向某行政区城运中心,他们希望一方面实时监控重点区域的人流情况,比如交通枢纽、景区、商圈,多部门数据能够基于一份数据、一起进行区域保障管理;另一方面将数据接入区域网格和应急管理系统,研判和预警异常聚集情况并支持通知到网格员,以便提前做好应急疏散准备。我们所做的便是针对他们所管辖区域范围内的用户进行实时分析和画像描绘,包括热力分布、实时区域人数、驻留时长、人口流入流出、数据统计、人流预判、常驻人口统计等,并提供短信触达,包括针对特定区域内人群的触达和管理员的触达。数据呈现方面,我们提供可视化大屏、标准SaaS,客户也可以根据自身情况选择API接入自有系统,这个案例客户选择便是大屏和API接入。数据内容方面,除了基于既有模型的统计分析,我们借助机器学习突破传统人工研判的方式,实现人群聚集和流动的下个时段预测,通过对比预测和实时数据,提前发现异常聚集可能。除此以外,在一定历史数据基础上,建模演算不同时段的人群分布和流动情况,帮助客户适时调整区域保障资源。第二个案例是服务于某个场馆,对一些特定活动进行非常规群体性突发事件的主动感知和大型活动安保等问题的监测,为管理方处置突发事件和大型活动安全管理提供理论依据和应用实践指导。和第一个案例不同,这是针对室内的监测分析,这对我们来说也是最大挑战,场馆内的监测需要非常高的精度,大家可能看过车展,比肩接踵,室外可能按半径公里计算,而室内需要精确到米。除此以外,场馆有其自身管理体系,仅提供数据分析是不够的,还要能够开放生态,接入场馆的综合应急资源,以供客户实现资源的调度。基于大数据和开放生态,我们帮助客户打通了业务系统壁垒,实现数据智能分析和信息资源深度共享全局管控。第三个案例是针对某市关键交通枢纽分析春运客流趋势,以此预估当年针对春运需要如何铺设资源。通过分析春节前后到站、离站、驻留人群的数量,观察高峰、低谷时段,并结合往年同期数据,预估今年情况,据此做好迎接春运大军的准备。最后来聊聊移动数据与政务数据结合的案例,某公安反诈态势分析。我们在自有数据基础之上,融合反诈黑灰库数据,面向公安打造了电信网络诈骗态势分析产品。这款产品能实时预警疑似诈骗事件,帮助公安及时劝阻拦截疑似受害人上当受骗。产品主要提供一张屏、三张表、三条路和一封信。- 态势分析:“一张屏”总览辖区诈骗数据,洞悉诈骗案件趋势、诈骗源特征、易受害人群分布等整体态势。
- 诈骗预警:“三张表”精准识别电话、网络、APP诈骗,实时掌握疑似诈骗行为,高效管理疑似情况处理。
- 劝阻干预:“三条路”智能干预疑似诈骗,分类分级疑似诈骗行为,短信、智能呼叫、人工呼叫智能劝阻。
- 宣传防范:“一封信”提醒一类易受害人群,深度分析不同诈骗案件易受害人群共性特征,短信宣传防范。
- 数据资源优:依托中国移动全国海量数据基石,覆盖电信网络诈骗通话上网全场景。
- 模型发现准:储备多种诈骗类型识别模型,沉淀案件特征,准确、快速识别并预警。
- 一键阻断快:智能分析风险等级,采取不同干预方式,提升阻断效率,降低阻断成本。
这一期的TeaTalk· Online我们跟随魏老师,在永不止歇的大数据江湖中,窥见了应用创新实践的真正奥义。非常感谢魏老师带我们领略大数据实践的魅力所在。作为开发者社区系列活动的重要一环,未来TeaTalk· Online线上直播栏目将更加专注细分技术领域,进一步扩展知识广度、技术深度,加速拥抱开发者。关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/