次贷危机后的 10 年,他们这样来反欺诈
次贷危机已经过去 10 年,借助互联网技术,金融服务实现了许多模式创新,使资金流通更加灵活高效,其中 P2P 网贷(P2P 是英文 peer to peer 的缩写,意即“个人对个人”借款)业务近年来格外火热。
随着模式的不断创新,风险控制也面临着更多的挑战。在 P2P 领域,首先面临的就是欺诈风险。在美国纽约证券交易所上市、成为中国金融科技第一股的宜人贷又是如何处理欺诈问题的?
关于宜人贷
宜信公司 2012 年推出的一款在线金融服务平台。宜人贷通过科技驱动金融创新,为中国优质城市白领人群提供高效、便捷、个性化的信用结款咨询服务。
2015 年 12 月 18 日,宜人贷在美国纽约证券交易所上市,成为中国金融科技第一股。截止 2017 年 3 月 31 日,宜人贷累计服务了超过 60 万借款用户,近 120 万出借用户,累计促成借款总额达 393 亿人民币。
欺诈的行业挑战和链式发展
在美国,欺诈主要是由于信用风险而产生,但在国内,很多坏账是由欺诈产生,中国对于欺诈的惩罚不够,导致了类似事件频繁出现。作为一个行业的挑战,欺诈不仅只存在于在线 P2P 领域。
关于欺诈的行业挑战,举三个例子。
非银信贷:行业整体风险偏高,由于门槛较低,滋生了大量团伙欺诈、身份冒用、老赖、多平台借款、黑中介等,带来巨大经济损失,坏账率居高不下。
银行:开展网络支付、直销理财、电商、消费信贷、P2P等创新业务中,和非银信贷面临同样的问题。
电商:电商领域的在线支付、恶意点击、广告监测、黄牛、账户安全等方面面临交易欺诈风险。
这些问题是全行业的挑战,宜人贷面临的主要是信贷申请时候的欺诈。
现在大量欺诈已经不再只是个人作为,而是一种行业性质的行为。我简单分成三类:上游、中游、下游。
上游,主要是黑产技术服务,能力不逊于技术团队,力量强悍,积累了丰富的工具使用经验,包括虚拟模拟资料,做帐单造假等,成员都是计算机高手。
中游,把恶意注册的帐号释放出去,或者是通过交流平台招揽技术人才。另外,由于需要很多资料,到农村收一些大爷大妈的身份证。对他们来说,赚一百块钱,身份证借用两天没什么关系,实际上这些资料被用来骗贷了。
下游,有专人用这些资料来做欺诈、盗窃、勒索,甚至用来刷单。
如何快速评估欺诈风险及平台搭建
宜人贷如何建立一套快速评估欺诈风险的机制呢?
2014 年开始有这些想法,在现有风控体系外,把欺诈风险和信用风险分开做。欺诈风险单独拎出来,并将对用户的欺诈风险识别出来。我们建立了一套从数据采集到机器学习,并快速给出欺诈评分的体系。
在数据采集时,通过 SDK 的方式,也就是采集 SDK,可以在不同触点采集到用户的基本信息,只要用户触达任何一个终端,我们都实时地将这些用户信息送到 SENT EVENTS 上。
深度学习以前没怎么用,监督类学习是基于欺诈和非欺诈的用户去做分类,无监督用了知识图谱的技术。对于单个用户,每个事件会给出一个评分。
比如,用户打开 APP 会得分,因为怀疑安装了模拟器,用户进行申请时会给他提醒完善信息。对于优秀用户,根据他的设备 或者关联出的其他信息,在注册时给他打一个好的分数。
这是对于不同事件进行实时欺诈评分的流程。用户在设备激活的时候得一个分,注册的时候得一个分,查看新手引导的时候又得到一个分,这个分会实时变化。每次过来,用户都会带上基本信息:设备、IP 地址等等,可用作评估风险程度的特征。
上面说到的是反欺诈的基本架构,我们在内部做成一个产品化平台,今天主要介绍一下它的体系,主要基于三个层次。
首先是实时的数据采集,数据采集分几个部分,第一部分是基于 SDK 采集相关的用户行为数据,第二部分是用户授权的相应个人信息,包括消费数据和通话数据,第三部分是三方数据。
其次,我们用到了实时数据处理,基于知识图谱构建了三个层次:
第一个是欺诈评分模型,实时对用户的每个事件进行评分;
第二个是传统的规则引擎,我们用了一个非常强的规则;
第三个是团伙挖掘,这是一个很大的亮点。
前两点很多公司都在做。针对单个分类的问题,数据决定了模型好坏的上限,模型调的再好,只是决定效果无限逼近上限。团伙挖掘是基于知识图谱,把用户通过图的方式,挖掘他们之间的关系,把这些(有类似欺诈行为或关系的)用户拎出来。
在实时欺诈发现阶段我们采用产品化的工具,在流程里通过调查工具,直接给到信审。把每个用户提报出来,通过这套流程可视化平台,帮助快速理解用户是否欺诈,我们会做中介发现,把中介找到。第三是团伙监控和预警,把欺诈团伙挖出来。
每个阶段的具体实现过程
下面讲讲每个部分的具体实现过程。
第一个模块是基于 SDK 的实时数据采集,获取一手数据。我在去年加入了宜人贷,当时就在想,这么多的用户行为数据为什么不用来做反欺诈呢?用户的淘宝数据、消费数据,以及其他的很多临时性数据都可以作假,但是用户的行为数据一般不会去模仿,我们做了一个 SDK 采集框架,分成三层。
第一部分是数据采集,覆盖宜人贷所有客户触达终端的采集能力,采集用户行为、设备指纹等相关信息,比如型号、是否模拟器、各项物理层,以及网络源信息,这部分非常重要,它连接着一些上网轨迹,还有 Location,我们发现很多团伙都在一个地点,好几十个坏用户聚在一个基站下面。以上是采集层。
中间是实时数据处理,我们做了一层相应的配置,对于哪些数据是可用的,我们花了很多力气做数据清洗,刚开始的时候在这方面踩了不少坑,然后后续实时的时候会做一些数据回填,才达到一个比较好的运算。数据处理层分为离线和实时。实时数据直接灌到知识图谱里,离线数据做一些特征处理和建模分析。
在数据应用层,最简单的就是流量统计分析,分析用户的行为。其中两个方面跟反欺诈有关,一个是反欺诈前置,另一个是流量反作弊,对每个渠道过来的激活都需要做是否作弊的评分。在反欺诈前置方面,我们会对每个用户进行实时的欺诈评分。
这是 SDK 采集的基础框架。数据采集方面数据由固定表头信息+事件信息组成,每条记录都是一个事件,包含如获取定位行为、或者设备信息行为、用户点击行为、页面加载行为。数据发送有些策略:实时发送、满N条发送、默认 15 条、失败重发等等。
采集的内容分为几个模块。设备数据主要有手机品牌、手机型号、操作系统、设备 ID、App 列表。
行为数据主要包括账号登录、页面进入、按钮点击、信息输入、广告浏览、操作时间等。我们有很多流程,比如,新手机运营商授权的密码,很多人都记不住,但是欺诈分子一下子就输入了,他的输入速度非常可疑,我们通过聚类把这种用户聚在一起。
位置数据现在主要用四个:GPS、IP、基站信息、WIFI 列表。比较精准的是 GPS 和 WIFI,基站大概有 100~200 米误差。很多欺诈分子喜欢用代理 IP。
基于以上,把用户实时行为数据采集完之后,对每个用户会形成一个实时的欺诈评分。
这是一个实时预警流程。我们真正用的模型不只是只有行为,但是它的权重非常高,我们还用到很多的其他数据,需要用户授权的一些数据,我们都会放到欺诈的特征里面。
我们做了一个 FICO 评分标准,评分越高用户信用风险就会越小。此外还有一个规则引擎,我们会发现一些强有力的单条规则,或者多条单一规则组成的策略,对每个预警用户非常有效。
预警出来会分成两部分,一部分信用好的就直接拒了,另一部分交给反欺诈调研,形成黑名单。所有流程都是实时的,保证跟业务系统完全解耦,有快的反馈速度,十分钟放款,就要判断出他是否是欺诈。
模型训练,我们有一个好的点给大家分享下,大家可能做过,正负样本非常不平衡,欺诈领域也有这个问题,我们面临的是想要找出一些坏用户,但很不易。
坏用户常见的定义就是 MOB6 里面的 M3+(逾期三个月),不能把有信用风险的用户刨除掉,这个用户不一定是欺诈,他是违约了,但有可能就是没钱还,要把欺诈跟信用解耦出,可以信用风险的方式做信用定价。我们构建了基于欺诈标注的自动化学习,可疑对实时新增的欺诈标注,快速反馈回模型训练。
基于知识图谱的欺诈团伙发现
以上是对于识别单个欺诈用户的应用。接下来谈谈如何基于知识图谱判断欺诈团伙,大家知道团伙其实很难发现,发现了也很难认定。
我们采用了两种方式,第一种是通过无监督的方式,通过聚类的方式找到这些用户;另外就是通过知识图谱的方式发现关联关系。我们的知识图谱关系网用的是 Neo4j。
我们主要应用知识图谱做了三件事情:疑似中介识别、关联骗贷团伙识别、团伙监控&预警。关联骗贷团伙,一个用户来了之后,对单个用户的特征评价里有了非常多的数据,他跟某一个团的关联关系,他在团里的关联特征,比如一度联系人,和二度的设备联系有多少,这些是作为单个用户而言。此外还有对所有用户的全局搜索,从而发现骗贷团伙。
关于团的定义可以参考以下图。
以下是上线之后的短期效果。
面向行业的反欺诈解决方案:“先知”
宜人贷面向全行业的一个反欺诈解决方案——先知。
宜人贷 CEO 对此提出了三项服务要求。第一是数据抓取服务,包括对于淘宝数据、公积金、社保数据抓取的服务,提供给其他行业;第二是反欺诈能力。第三是精准获客能力。
宜人贷有非常多存量用户,我们已经投了很多钱去获取基本用户,这部分用户客单价非常高,我们希望把一些不符合宜人贷定位,同时又是优质的客户,他的风险不高,但是他可能就想借一千块钱的用户,这种用户我们是可以转出去给其他的平台。
我们的反欺诈能力是通用的解决方案。
第一,基于 SDK 采集行为数据;
第二,结合全网数据绘制关系图谱;
第三,通过规则+模型实时判断欺诈用户;第四,自动对接业务流程。
在产品流程方面,是基于 SaaS 的服务,用户可以在平台上自动完成预警欺诈用户设定,以及对于预警用户的处理。同时,这些服务可以对接到自己的业务流程里去,比如接入了“先知”系统后,对于用户预警,可以在平台上操作,同时也可以把这些数据通过API的形式对接到自有的信审里去。
本文来自:「QingCloud Insight 2017」上,麦思博(msup)组织了主题为“AI落地实践”的专场论坛。宜人贷数据产品经理 何林海 在本场带来了题为《构建基于社交图谱关系的反欺诈产品应用》的演讲。
<iframe class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" data-src="http://v.qq.com/iframe/player.html?vid=w0544vzgi4u&width=370&height=208.125&auto=0" width="370" height="208.125" data-vh="208.125" data-vw="370" style="display: none; width: 370px !important; height: 208.125px !important;"></iframe>
何林海,目前主要负责宜人贷反欺诈产品的搭建,在做反欺诈之前,主要负责 SDK 行为数据的采集,收集了大量宝贵的用户行为数据,目前在公司内各个项目中得到了广泛使用。 在宜人贷之前,就职于美团数据工程部。
「加速助力」AppCenter 2.0 提供包括计费、支付、财务报表、监控告警、工单系统、用户管理等一系列运营管理功能,为合作伙伴提供完善的商业运营支持。借助 AppCenter 2.0 平台,合作伙伴可以直接拥有云计算平台所需各类功能模块,快速便捷地开启商业运营之路。
青云QingCloud AppCenter 是一个生态平台,欢迎更多其它企业服务应用入驻 AppCenter,一起为 QingCloud 逾 8 万家用户提供优质服务。申请加入:
https://appcenter.qingcloud.com/partnership/index.html
AppCenter 激励计划
一、面向合作伙伴
AppCenter 认证应用服务商奖励计划
应用服务商在 AppCenter 发布应用经 QingCloud 认证后,可获得的奖励额度为 QingCloud 用户通过部署该应用所带来的资源(仅含主机和硬盘)消费的 10%。
“平步青云” AppCenter 伙伴计划
企业服务方向的创业项目,经 QingCloud 认证审核后,可获得 2 万元的云服务资源赞助,同时应用可以入驻 AppCenter。了解更多:
https://www.qingcloud.com/promotion/startups
二、面向用户 —— AppCenter 资源优惠计划
公有云用户通过 AppCenter 应用所使用的主机和硬盘资源可享受 10% 的优惠。
点击「阅读原文」获取更多内容。
- FIN -
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 1 三个层面看我国民营经济发展前景 7925366
- 2 小伙30多万买机器人对外租8000一天 7904649
- 3 《哪吒2》成香港单日票房榜冠军 7820438
- 4 产业“破题” 绘就振兴“答卷” 7786787
- 5 客机西安起飞后返航 引擎冒火光 7691194
- 6 偶像剧终于有不回避成长女主了 7504686
- 7 4人喝100瓶酒1人坠亡 KTV被判赔48万 7423592
- 8 女孩逃票进景区后坠亡 景区被判无责 7314589
- 9 8岁孩子厨房玩刀意外刺破肝脏 7238416
- 10 石矶娘娘原身能拉出比头发还细的丝 7129148