隐私到底能不能卖?怎么卖?| 硅谷直说

百家 作者:硅谷洞察 2018-04-20 03:21:25



硅谷Live / 实地探访 / 热点探秘 / 深度探讨



Facebook、谷歌们,都保持冷静,跟欧盟认怂吧!




一条推特引发的浪潮


位于南半球的新西兰,秋分时节是三月中。一个叫做迪兰·马凯(Dylan McKay)的年轻程序员慵懒地玩儿着 Facebook,他想起昨天和朋友午饭时的聊天。朋友提到Facebook搞了个页面,在这个页面上可以下载自己所有的个人数据。你在Facebook上的所有活动,无论是点赞还是留言,都能一股脑儿下载下来。


这个挺有意思的!于是迪兰就试了试。这个页面很难找,不过迪兰还是找到了,他试着下载了自己的所有用户数据,然后一点一点的翻着。


用Facebook登录过的App?嗯这个Facebook果然存着呢。我最近在Facebook上看过的视频?没想到这个Facebook也会存起来。


哎等等!这是什么?为什么我的所有通话记录也被Facebook追踪了?通话开始的时间、通话时长、通话者的名字,怎么连这些Facebook都知道?我没有用Facebook打电话啊!Facebook不是在盗取我手机的信息吗?


新西兰小哥迪兰·马凯,发现Facebook追踪了自己的通话记录。

他立刻在推特上发了截图,这条推特被转发了四万一千次。图自网络


近来,越来越多的人发现自己下载下来的Facebook用户数据,包含Facebook以外的个人信息。这个事情给最近隐私问题缠身的Facebook雪上加霜,“删掉Facebook” 的话题标签在推特上来了一轮又一轮,甚至有投资人考虑,是不是该让扎克伯格辞职了?


等等,先别着急去Facebook公司门口举牌子抗议。这个事情大家不觉得很蹊跷吗?Facebook一直在偷偷存着通话数据这事儿不假,但为什么这个新西兰小哥迪伦,今年才突然发现自己被追踪了呢?为什么Facebook一方面要偷偷摸摸地监视着用户的数据,一方面又要开放一个页面,宣布它到底监视了你的哪些信息呢?这就像一个小偷,在夜里一边翻找着你家的值钱东西,一边大声喊:珠宝!现金!笔记本电脑!这些东西我可都拿走了啊!


一切的答案,都藏在一个大众并不熟悉的名词里。这个名词,就是我们今天的主题——GDPR。


啥?啥叫GDPR?


GDPR 的全称很枯燥,叫“通用数据保护规范”(General Data Protection Regulation)。虽然你可能没听说过它,但 Facebook、谷歌、亚马逊等这些硅谷巨头的老板们,一听 GDPR 就头疼。这些公司的很多员工,一听GDPR 就想哭。而很多欧洲的不少律师,一听GDPR就会两眼放光,赚钱的机会又!来!了!


GDPR 这个数据保护规范,到底有什么神奇之处?


GDPR,其实就是2016年欧盟颁布的隐私法。这个规范包含下面几个内容:

  • 用户自己的数据,必须可以随时被自己查看、修改、删除、下载

  • 任何公司,必须在收集用户数据之前,让用户签一个协议

  • 收集16岁以下儿童数据,必须经过家长同意


简而言之,就是用户的数据,控制权必须要在用户手中。


这个法律,没得说,每一条定得都特别有道理。比如数据查看权。如果Facebook 追踪了我几点起几点睡,那我必须得知道。不然到了Facebook给我推送安眠药广告的时候,我都不知道为什么。


还有数据修改和删除权,我要是用谷歌搜索了“草榴网”、“脱衣舞俱乐部”、“优衣库试衣间”什么的,那我得有办法给删掉,不然我老婆翻我电脑的时候,我没法解释。


另外就是未成年人保护权,不能偷偷追踪孩子玩儿的手机游戏,然后天天给他推送“屠龙宝刀、点击就送”。孩子自控力不高,又没有经济独立,不能瞒着父母,从他们身上赚钱。


2016年立的法律,2018年5月25日才开始执行,欧盟还是很人道的!给各大公司两年时间准备。但等 5 月 25 号一到,如果发现任何公司违反,那就重罚。要么交 2000万欧元,要么交4%的营业额,哪个罚得多交哪个。


这个罚款,相当重!到底有多重呢?咱们举个例子,谷歌在2017年的营业额是1096亿美元,4%的营业额就是大概44亿美元,够谷歌买两个Snapchat,或十个雅虎、或十四个Airbnb。


基本没有公司敢跟欧盟犯横,这个款金额实在太高了。


律师给互联网公司的建议:保持冷静,跟GDPR认怂吧

(https://www.hospitalitynet.org/opinion/4084533.html)


今天,随着 Facebook 这一大堆用户隐私的丑闻,美国的议员们也开始把目光转向欧盟,希望在美国也搞一个类似的隐私法。有了欧盟的 GDPR、美国未来的隐私法,个人隐私问题会在全球法律上更完善、更多样。这对互联网产业的健康发展是非常有利的。


雷总您冷静


任何立法都有争议,GDPR 这么伟大光荣正确的法律也不例外。首先最大的争议就是:到底哪些数据是用户数据,哪些数据不是呢?


很多人说这不废话吗,从我身上来的就是,别人身上来的就不是。这个时候,程序员就会扶一扶黑框眼镜告诉你,事情没有那么简单。


一个互联网公司的数据,大概是下面这么个模式:


这个图看着太抽象,我们瞎编个例子:


小米CEO雷军每天在北京上班,他装了一个叫做“QQ天气”的应用,每天早上醒来,都需要查一下北京是不是有雾霾、要不要戴口罩。雷军每次打开QQ天气,QQ天气都会偷偷地给腾讯的数据中心发送这么一条信息:“20XX年X月X日,用户雷军,在北京海淀区,查看了本地天气。”


有时候雷军也去一趟印度开个发布会,现场给印度粉丝们发一批小米手环。于是时不时也会查一下新德里的天气。这些行为当然也被QQ天气如实汇报给马化腾了。每天QQ天气给腾讯做的这个小报告,因为没有进行过任何处理,所以叫做“数据生肉”。


日积月累,腾讯已经有五百多条关于雷军的小报告了,这些小报告太多,于是腾讯做了一个简单处理,把五百条小报告变成一句话:“雷军在去年两年内查看了523次北京天气,23次新德里天气。”这个数据因为不是直接从雷军身上扒下来的,而是腾讯后台处理出来的,所以我们管他叫“数据熟肉”。


雷军和印度粉丝们热情交流,并用标准的英语表示问候

(http://mobile.zol.com.cn/560/5601897.html)


当然,腾讯不可能只追踪雷军,它肯定还会追踪同样使用QQ天气的马云、刘强东、李彦宏。经过总结,腾讯发现,过去一年内,一共10万人在北京使用了QQ天气。“10万”这个数字,并不是从某一个用户身上总结过来的,而是多种数据共同推导而出的。所以我们管它叫做“衍生数据”。


数据熟肉和衍生数据,被腾讯一股脑地交给人工智能 “腾讯小Q”。小Q看了看,觉得像雷军这种经常去新德里的北京人,应该经常给他在手机上同时推送北京和新德里的天气。于是人工智能把这个给雷军手机上的QQ天气一说,QQ天气立马给雷军发了两条推送:一条北京的、一条新德里的。“北京今天重度雾霾,而且忒冷”、“新德里今天重度雾霾,但是vely vely hot”。


个人数据从收集,到处理,到归纳,到人工智能,再到返回用户,这就是互联网公司最简单的数据处理模式。任何使用人工智能的互联网公司,都有这些种类的数据,也都会采取这个流程。


咱们继续讲故事,雷军有一天突然想把自己的数据都删掉,于是给马化腾打了个电话。“没问题!”马化腾说完挂了电话。但第二天,雷军依旧收到了两条推送:“北京今天终于晴了”、“新德里今天继续雾霾”。


雷军于是跑到马化腾办公室理论去了。


“你不是删掉我的所有数据了吗?为什么腾讯还是知道我要去新德里?” 雷军很愤怒。


“雷总请冷静一下,”马化腾不紧不慢地讲,“我们确实把您手机每天发的小报告(数据生肉)都删了,但您经常用QQ查新德里天气这个习惯(数据熟肉),不是从您身上追踪来的,而是我们腾讯总结出来的。”


“那也不行,只要和我有关的数据,你都得删掉!你信不信我今天就把QQ注销了?” 雷军摔门而去。


第二天早上,雷军又收到了QQ天气推送:“北京沙尘暴,新德里今天还雾霾。欢迎注册腾讯会员,获得更多体验!”


雷军又找马化腾去了。


“雷总,您冷静一下。”马化腾淡然自若的说。“尽管您注销了QQ号,但我们发现,住在您家附近的人、您的家人、同事、朋友,都会经常去新德里跟随出差。这个数据(衍生数据)不是您的数据,而是我们根据所有用户分析出来的。这个您不能让我们都删掉吧?”


“少跟我来这套!” 雷军已经出离愤怒了,“我让所有小米员工,都注销QQ号!我们全家人,都注销QQ号!这样你们就不能给我推送了吧?”


第三天早上,并不意外地,雷军又收到了QQ天气推送:“北京下雨了,新德里艳阳高照。欢迎注册腾讯会员,获得更多体验!如果您让您的家人朋友注册腾讯会员,会奖励Q币哦!”


“这回你怎么解释?我办公楼的全体员工都没有QQ号了,我老婆孩子都戒了QQ了。你们为什么还知道我是雷军,我要去新德里?”雷军揪着马化腾衣领问。


“啊,对不起啊,”马化腾笑了,“您原来的数据已经教会我们这个人工智能小Q了。它……它给您的手机推送习惯了。”


腾讯小Q,腾讯的其中一个人工智能 

图自 qrobot.qq.com


上面只是我编的段子,但由此可见,用户个人数据这个边界,其实特别模糊。数据熟肉算不算个人数据呢?熟肉的起源是生肉,但它是互联网公司辛苦总结出来的,难道控制权不该给互联网公司一部分吗?衍生数据算不算个人数据呢?如果算的话,那我不就把我内部服务器的原理都免费公开了吗?利用你的数据训练出来的人工智能,算不算你的个人数据呢?如果算的话,每次你注销账号,我们都有把训练出来的人工智能给“杀死”吗?


臣妾做不到啊!


咱们退一万步讲,就算个人数据这个边界特别清晰,真正把数据的控制权交给用户也不是一件容易事儿。


比如,我是个互联网大V,我发了一个慈善组织的推广微博,然后鼓励大家捐款。大家纷纷在评论区留言,说一定支持,一定把链接分享出去。然后,我等到深夜没人注意,偷偷把我的慈善组织的微博改成了一个网页游戏的广告,把链接指向了“贪玩蓝月”。结果第二天,微博用户们发现我这个广告下面全是“支持!”“非常有价值!”那这条微博,不就把原来写评论的人给坑了吗?这个时候,个人用户数据是一种讨论场景。一个场景的控制权,不能交给单独一个人。


咱们再想一个场景:两个 ISIS 恐怖分子用 WhatsApp 发信息,确定在哪里搞爆炸。第二天,他们真的这么干了,造成了几百人伤亡。FBI 找到了WhatsApp,说我们要这两个人的聊天记录。结果 WhatsApp 发现,ISIS这俩人早就把聊天记录删了,警方根本没法追踪到嫌犯。这个时候,个人用户数据是一种嫌疑人证据。一个犯罪证据的控制权,不能交给凶手。


假设现在有这么一个页面,这个页面可以查看、修改、删除、下载我所有的个人信息,这多方便啊!问题是,黑客也是这么想的。只要拿到你的密码,他就可以在你发现之前,瞬间下载完你所有的银行卡号、身份账号、裸照等等。理想状况下,个人隐私的控制权在自己手里。可现实生活中,个人隐私的控制权很容易就流到了黑客手中。


2014年,黑客瑞安·柯林斯(Ryan Collins)盗窃了一众好莱坞明星的裸照

“大表姐”詹妮弗·劳伦斯也是受害者之一


还有,不能追踪16岁以下的孩子的个人数据,但这个执行起来实在是太难了。世界大多数国家,都没有互联网实名制。根本就不知道这个用户到底是不是上网时候如实汇报了自己的年龄。一个在线观看“色戒”的中年用户头像,屏幕后可能是10岁的孩子。一个“你是不是已经满16岁”的对话框,完全不能避免一个孩子的数据被追踪。家长协议也是槽点满满,我去哪儿找这孩子他爹的账户去?就算孩子提交了一个有他爹签名的“家长同意书”,我作为互联网公司怎么知道这真是他爹,而不是隔壁王叔叔呢?


做这些隐私页面其实并不简单。像谷歌、Facebook、LinkedIn、亚马逊,这些成立了近20年的互联网公司收集了这么多用户数据,一下子让他们都把这些数据给用户还回来,臣妾实在做不到啊!很多创业公司,一共只有那么几个程序员,突然让他们写一大堆隐私页面,会让整个公司半年停摆。如果这些小公司到了5月25日这个截止日期,做不出隐私页面,那就会被罚巨款。担负不起怎么办?要么滚出欧盟市场,要么自己破产。


上有政策,下有对策


因为上面这些难点,互联网公司想了各种各样的对策,绕过种种隐私法。


最简单的做法,就是让用户很难找到自己的隐私。比如我们开头提到的新西兰小哥迪兰,他就是找个各种犄角旮旯才找到自己在 Facebook 的隐私数据的。你必须得在主页顶上点最右边的小三角,然后进入隐私页面,然后点下面的一行小字:“下载你的 Facebook 数据”。Facebook 还算良心,如果你去谷歌,就会发现谷歌的下载页面更难找。它藏在谷歌的帮助页面里面,需要点三个犄角旮旯才能找到。凭着这个小花招,互联网公司既能满足法律要求(也就是必须要有隐私页面),又能确保大多数人根本找不到这个隐私页面。


Facebook的隐私页面,藏在犄角旮旯里


第二种方法,就是百试不爽的“用户协议”。弹出一个巨长无比的用户协议,然后问你同意不同意。你只能点同意,不然上不了这个网。最近大家是不是都开始发现各种软件、网站突然协议弹窗变多了?原因就是这个欧盟的 GDPR。


第三种方法,叫做“支付墙”(Pay Wall)。就是说,假如你不想被我们的网站追踪,那就得每月给我们交钱。上面的雷军如果不想让马化腾追踪自己,那马化腾有权说:“你必须每个月充Q币、买黄钻会员。” 每月交的钱,就像给黑社会的保护费。交过保护费以后,就像建了一堵“隐私墙”,Facebook、谷歌就不再追踪你,也不会用广告骚扰你了。


最近扎克伯格刚刚被美国国会质询,一个参议员问小扎:“是不是以后我们把钱给Facebook,Facebook 才不追踪我们的隐私?”扎克伯格并没有立即否认,反而很委婉地说:“我们永远都会有一个免费版的Facebook。”这话让人听完非常睡不着觉。因为扎克伯格很可能在暗示,免费版的Facebook会把你的隐私卖给广告商。如果你不想让我们卖的话,欢迎充“Facebook会员”啊!


还有一些方法就比较冷门了,比如删账号。如何应对16岁以下儿童的隐私保护呢?这个太棘手,所以有些公司会干脆注销掉所有孩子的网络账号,删掉所有他们的信息,以防信息泄露给广告商,给自己招来麻烦。


当然这些对策都是 GDPR 法律边界的试探,如果欧盟认为互联网公司的“支付墙”、或者“用户协议”并不合法,那么甭管你是 Facebook 还是谷歌,都得乖乖交罚款。


个人隐私和“数据启蒙运动”


我们在这里讲 GDPR,并不想解释一个枯燥的法律,或者谴责某个互联网公司滥用隐私。我想借着隐私立法的契机,讲一个社会运动——数据启蒙运动。


最早注册 Facebook 的那一批人,根本不会想到 Facebook 会背叛他们、贩卖个人隐私。因为互联网时代是免费的、是公开的、是尝鲜者的乐园。互联网时代也是快节奏的,它可以迅速淘汰掉弱者,迅速推翻前一个巨头。在这些互联网公司咿呀学语的时候,都是懵懂无知的理想主义者:扎克伯格并不想在Facebook上放广告,拉里·佩奇只想做一个简单的网页搜索,杨致远想把雅虎变成一个互联网门户,陈士骏只想把 YouTube 变成人们分享小视频的广场。


Facebook、谷歌、雅虎,它们最早都不是广告公司,但都想不出更好的赚钱办法。于是创业者们发明了一种完美的模式——免费模式。用户注册免费,但个人数据会被网站追踪,用来推送广告。因为注册是免费的,所以Facebook、谷歌这样的公司用户量会出现暴增,可以迅速成为霸主。个人数据是无穷无尽的,只要认真挖掘,一定能卖个好价钱。


在免费模式里,你和我都不是Facebook的客户,而是Facebook的产品。我们的隐私数据生肉会被 Facebook 煮成熟肉,打包卖给出价最高的广告商。可用户的增长如果达到了饱和怎么办?那就从已有的用户身上挖掘更多的数据,用更高级的工具做出更细致的分析,卖给更多的广告商。


360创始人周鸿祎推崇“免费模式”

2018年,360快视频盗取了B站大量账号和视频,

可以说是把“免费模式”做到了走火入魔


我们今天看到,大数据非常火爆,数据分析师年薪十万美元,道理就在这儿。互联网公司像从奶牛身上挤奶一样,从用户身上“挤”数据。然后数据工程师用 Kafka、Storm、Hadoop、Spark 这些外行人根本没听说过的工具,把数据生肉处理成熟肉。数据分析师仔细地把用户数据整理归类,然后给广告商端出来。一个谷歌的前部门经理曾说过,谷歌的核心竞争力不是搜索或者安卓,也不是地图或者日历,它的竞争力是能把用户数据变成钱(“User Data Monetization”)。“把用户数据变成钱”,这才是免费模式的背后逻辑。


可随着Facebook隐私丑闻的爆发,人们越来越意识到,泄露个人网络隐私是危险的。这种个人隐私的觉醒,会带来一场“数据启蒙运动”。它会推动各国隐私立法,让Facebook、谷歌这样的互联网公司获取用户数据的成本越来越大。


在未来几年,我们会看到越来越多像GDPR这样的隐私法出台,也会看到越来越多的“扎克伯格”们出庭作证。如果谷歌想做一款新的应用,那一定要考虑这个应用会不会泄露用户隐私。Facebook 想搞新的交友工具,那也得先征求用户每个人的意见。


免费模式带来的野蛮商业生长,会因此逐步放缓。互联网公司雇佣的那些数据工程师、数据分析师、人工智能科学家们,也有可能也会越来越少,越来越没有继续挖掘用户数据的动力。


随着“隐私启蒙运动”的兴起,大数据时代下的免费模式,会不会成为历史呢?

 特约作者:屈直 

屈直,雅虎软件工程师。深入分析,大胆预测,敬请关注 “硅谷直说”。 


封面图自网络,版权属于原作者


推荐阅读

区块链报告 | 脑机接口报告 

硅谷人工智能 | 斯坦福校长

卫哲 | 姚劲波 | 胡海泉 

垂直种植 | 无人车

王者荣耀 | 返老还童 




关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接