安全地拥抱数字货币,PayPal的底气是什么?
随着科技创新急速改变着金融市场,越来越多的机构和资金涌向“数字支付和数字形式的货币”。一个多月前,拥有超过 3 亿活跃用户的 PayPal 宣布将支持客户买卖和持有比特币,消息一出就引爆了市场。
1998 年到 2002 年,PayPal 从创立到上市只用了 4 年,然后以 15 亿美金被电商巨头 eBay 收购,成为了早期互联网时代的一个奇迹。这充满挑战的四年历程让 PayPal 开枝散叶般地制造了很多伟大的公司和企业家,也在金融支付领域站稳了脚跟。
诈骗和风险控制是金融行业绕不开的安全话题,作为领先的跨境支付企业,PayPal 一直面临着极大的风控压力和挑战,风险控制部门也成为了 PayPal 的关键部门。
2012 年,用数据和模型构建第三方支付风控体系也正处于传统和大数据结合的时间节点上,被“警察抓小偷”游戏模式吸引的张彭善主动加入了 PayPal 上海研发中心,回想起加入 PayPal 的八年多的时间,PayPal 风险管理计算平台研发架构师张彭善有很多感慨:“这期间我依次参与了离散大数据特征计算平台、机器学习平台、仿真计算平台、线上数据计算平台以及实时图计算平台等核心系统的构建,回想起来每个阶段都会有不同的技术难题,但同时技术支撑和解决问题的过程又能给业务带来价值,我很享受工作中带来的挑战。”
当年 PayPal 为了反欺诈研发了很多技术,PayPal 的员工通过数据去分析诈骗分子的特征,利用发现的规律进行欺诈检测,技术人员还想到一个至今被应用在很多场景的方法,他们生成一些印有各种扭曲的字母,背景模糊的图片机器很难识别,但是人却可以识别,大大减少了自动注册的比例。这些累积的技术和经验成就了彼得·蒂尔后来成立的神秘的大数据公司 Palantir,也奠定了 PayPal 成为全球使用最为广泛也最值得信赖的第三方支付工具之一。
欺诈检测的解决方案主要基于数据,PayPal 利用数据训练了非常多的模型,比如说一些主要应用的机器学习以及深度学习的模型。模型在一些复杂的欺诈检测场景表现得还不错,但还是有一些实时的欺诈却很难立刻反映到模型里面,因此再用规则作为模型的有力补充,可以灵活地去制定规则并部署到线上做风险防控。当然最终的基础都是数据和计算。
PayPal 风险管理计算平台研发架构师张彭善表示:“欺诈检测主要是作为风险管理的一个手段,我们通过使用欺诈检测降低公司损失,最重要的是我们能够去建立一个更加安全、更加值得信赖的支付平台。我们的 CRO 把自己定义为 CHIEF TRUST OFFICER,就是说我们把创建一个值得信赖的支付平台当作整个部门的愿景和目标。这里有一个第三方调研数据,PayPal 在顾客信任度、用户隐私保护信任度上排在第一,这也从侧面印证了我们在这样一个目标上做得还不错。”
PayPal 一直以来都致力于通过机器学习和 AI 模型来管理支付风险,并基于风险管理不同的业务需求构建了不同数据特点的计算平台,其中包括离线行为特征计算、实时行为特征计算,实时模型推断计算以及历史仿真计算平台。
不难看出,PayPal 的整个风险管理系统构建在由数据作为基础的机器学习智能模型和智能决策之上。数据是构建风险管理平台不可或缺的元素,任何风险管理能力离开数据都很难施展。而计算不仅是机器学习平台的基础,也是整个风险管理计算平台的基础。因此在这一过程中,计算、数据和平台构成了一个有机的统一整体,用以支撑风险管理的业务。
目前各大公司都在构建端到端的大数据机器学习平台,将大数据、机器学习、线上服务融合到一个端到端的平台。这样可以高效构建起整个机器学习模型的管道,数据以及模型的更改仅需要一些简单的操作就可以做到。PayPal 是如何构建端到端的数据计算平台,做到高效统一的呢?
在张彭善看来,一是开发构建各种子计算平台,二是将所有组件有机地统一起来构建成一个更大的面向用户的端到端的平台。不同的阶段面临着不同的问题和挑战。首先拥有支撑风险管理业务的各个子平台组件是第一步,初期 PayPal 内部从 0 到 1 为子平台组提供各种数据计算能力。随着业务的发展和需要,如何面向用户提高系统级别的计算能力这一需求变得更加强烈。
谈到如何将各个组件组合成端到端的统一整体,张彭善有着丰富的经验:“一是线上和线下系统的有机结合,历来线下和线上系统的数据不一致是构建各种数据计算系统的一大难题,从源数据和计算逻辑一致性上统一线上线下系统是提前解决节约排查时间最有效的方式。二是解决各种计算的可重用性问题,随着后期业务对于计算需求的增加,这个问题会造成非常多的重复计算和系统资源的浪费,为了整个底层计算系统的打通和共享,也为了解决了之前系统不足的问题,因此这需要提前布局。”
过去一年,张彭善一直关注图实时计算领域,图计算作为风险管理必备的维度的数据计算能力,也是 PayPal 风险管理系统最近一两年主要升级的部分。图计算结合实时图数据更新和实时图连接关系,为风险管理业务提供了更加实时和精准的连接关系特征。最近几年 PayPal 风险管理内部另一个比较重要的升级来自于模型和策略的自动上线系统,由于端到端的系统带来的好处,该系统可以实现定时自动构建新的训练数据、训练新的模型并部署上线用于风险管理业务,全程几乎不用人工的介入,极大地提高了新模型上线的效率。
机器学习在互联网行业的应用推动了大数据平台和 AI 平台的融合,如今机器学习技术早已占据了主流地位,无论是在风控、推荐、广告和搜索场景都得到了大量的运用,但是无论从平台还是从业务角度都依然面临着许多问题。
一是稳定性和实时性一直面临着很大的挑战,在支付场景中,模型的性能和稳定性是对立统一的两个方面,虽然目前深度学习在模型精准性上不断提高,但是系统稳定性却很难维持,系统和数据可用性问题使得深度学习算法不够稳定的特性凸显出来,在深度学习时代,实时性变得更有挑战。
二是机器学习过度使用带来的问题也亟需解决,对于业务指标的一致性,结果的可解释性和系统的简单性,机器学习系统在发展中一直没能很好地解决,甚至在某些方面背道而驰,长久发展下去必然带来各种问题。
事实上,在 PayPal 数据计算平台构建过程中,张彭善也遇到了很多挑战。尤其在负责线上计算系统之后,他一直关注数据和计算带来的不稳定问题,张彭善介绍道,具体构建过程中上游数据仓库某个字段的缺省值发生了变化,导致相关的特征计算出错进而线上模型分布变化剧烈,带来的直接的影响是某一个产品 5% 以上的交易被风控判定为拒绝交易,这极大地影响了用户体验。
张彭善总结道:“已经找出了问题的原因,解决这个问题很容易,但是更重要的是解决这个问题后要举一反三,一方面是各种计算特征和平台都要加强此类问题的排查,另一方面特征分布的变化要提供自动的预检查机制。”
由于问题横跨内部多个团队,PayPal“one team”文化带来的优势这时候便凸显出来,优秀高效的技术团队一直是是 PayPal 业务的重要支撑,作为这个共同体的组成部分每个团队都有着强烈的自我认同,各个团队以解决问题、避免以发生同类的问题为目标,通力合作,每次都能很好地解决问题,在实战中总结经验。如果遇到比较棘手或紧急的系统难题,线上问题解决中心部门会被赋予更大的权力去协调解决当下的困难。如果你对 PayPal 的工作内容感兴趣,如果这样的团队文化也恰好是你想要的,可以搜索“PayPal 招聘”或者点击【阅读原文】查看最新职位详情。
你想更详细地了解 PayPal 的风险管理系统及其数据计算平台吗?2020 年 12 月 21 日,在 QCon 全球软件开发大会上海站上,张彭善老师将就这一主题发表演讲,跟大家分享 PayPal 在构建数据计算平台以及处理实际平台问题的最佳实践和反模式案例总结,欢迎大家到大会现场共同探讨前沿技术,分享创新思路和实践经验。
采访嘉宾:张彭善
嘉宾介绍:PayPal 大数据研发架构师、资深数据科学家,2008 年硕士毕业于上海交通大学,2012 年加入 PayPal 风险管理平台部门至今。在 PayPal 主要负责实施和构建了大数据计算平台、离线机器学习平台以及实时机器学习平台用以支撑 PayPal 全球风险管理业务。目前除负责机器学习平台外,正带领团队构建 PayPal 实时图计算平台用以加强风控数据维度。在大数据计算、分布式系统实现和优化、大规模机器学习和深度学习系统优化以及高可用可扩展计算平台等领域有着丰富的实战经验。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 习近平会见萨摩亚总理菲娅梅 7933320
- 2 地铁疑因钉子户改线 花5亿拆迁一半 7905758
- 3 东北局地特大暴雪已破纪录 7804310
- 4 寒潮≠冷空气?“冷知识”了解一下 7783002
- 5 菲前总统炮轰现总统吸毒成瘾 7683956
- 6 日本近海发生6.3级地震 7522675
- 7 #北京飘雪了# 7497282
- 8 余承东说Mate70对得起那四个字 7349068
- 9 俄军向乌克兰发射了188架无人机 7273887
- 10 失联5个多月后,马天宇回来了 7108423