隐私到底能不能卖?怎么卖?| 硅谷直说
硅谷Live / 实地探访 / 热点探秘 / 深度探讨
Facebook、谷歌们,都保持冷静,跟欧盟认怂吧!
一条推特引发的浪潮
位于南半球的新西兰,秋分时节是三月中。一个叫做迪兰·马凯(Dylan McKay)的年轻程序员慵懒地玩儿着 Facebook,他想起昨天和朋友午饭时的聊天。朋友提到Facebook搞了个页面,在这个页面上可以下载自己所有的个人数据。你在Facebook上的所有活动,无论是点赞还是留言,都能一股脑儿下载下来。
这个挺有意思的!于是迪兰就试了试。这个页面很难找,不过迪兰还是找到了,他试着下载了自己的所有用户数据,然后一点一点的翻着。
用Facebook登录过的App?嗯这个Facebook果然存着呢。我最近在Facebook上看过的视频?没想到这个Facebook也会存起来。
哎等等!这是什么?为什么我的所有通话记录也被Facebook追踪了?通话开始的时间、通话时长、通话者的名字,怎么连这些Facebook都知道?我没有用Facebook打电话啊!Facebook不是在盗取我手机的信息吗?
新西兰小哥迪兰·马凯,发现Facebook追踪了自己的通话记录。
他立刻在推特上发了截图,这条推特被转发了四万一千次。图自网络
近来,越来越多的人发现自己下载下来的Facebook用户数据,包含Facebook以外的个人信息。这个事情给最近隐私问题缠身的Facebook雪上加霜,“删掉Facebook” 的话题标签在推特上来了一轮又一轮,甚至有投资人考虑,是不是该让扎克伯格辞职了?
等等,先别着急去Facebook公司门口举牌子抗议。这个事情大家不觉得很蹊跷吗?Facebook一直在偷偷存着通话数据这事儿不假,但为什么这个新西兰小哥迪伦,今年才突然发现自己被追踪了呢?为什么Facebook一方面要偷偷摸摸地监视着用户的数据,一方面又要开放一个页面,宣布它到底监视了你的哪些信息呢?这就像一个小偷,在夜里一边翻找着你家的值钱东西,一边大声喊:珠宝!现金!笔记本电脑!这些东西我可都拿走了啊!
一切的答案,都藏在一个大众并不熟悉的名词里。这个名词,就是我们今天的主题——GDPR。
啥?啥叫GDPR?
GDPR 的全称很枯燥,叫“通用数据保护规范”(General Data Protection Regulation)。虽然你可能没听说过它,但 Facebook、谷歌、亚马逊等这些硅谷巨头的老板们,一听 GDPR 就头疼。这些公司的很多员工,一听GDPR 就想哭。而很多欧洲的不少律师,一听GDPR就会两眼放光,赚钱的机会又!来!了!
GDPR 这个数据保护规范,到底有什么神奇之处?
GDPR,其实就是2016年欧盟颁布的隐私法。这个规范包含下面几个内容:
用户自己的数据,必须可以随时被自己查看、修改、删除、下载
任何公司,必须在收集用户数据之前,让用户签一个协议
收集16岁以下儿童数据,必须经过家长同意
简而言之,就是用户的数据,控制权必须要在用户手中。
这个法律,没得说,每一条定得都特别有道理。比如数据查看权。如果Facebook 追踪了我几点起几点睡,那我必须得知道。不然到了Facebook给我推送安眠药广告的时候,我都不知道为什么。
还有数据修改和删除权,我要是用谷歌搜索了“草榴网”、“脱衣舞俱乐部”、“优衣库试衣间”什么的,那我得有办法给删掉,不然我老婆翻我电脑的时候,我没法解释。
另外就是未成年人保护权,不能偷偷追踪孩子玩儿的手机游戏,然后天天给他推送“屠龙宝刀、点击就送”。孩子自控力不高,又没有经济独立,不能瞒着父母,从他们身上赚钱。
2016年立的法律,2018年5月25日才开始执行,欧盟还是很人道的!给各大公司两年时间准备。但等 5 月 25 号一到,如果发现任何公司违反,那就重罚。要么交 2000万欧元,要么交4%的营业额,哪个罚得多交哪个。
这个罚款,相当重!到底有多重呢?咱们举个例子,谷歌在2017年的营业额是1096亿美元,4%的营业额就是大概44亿美元,够谷歌买两个Snapchat,或十个雅虎、或十四个Airbnb。
基本没有公司敢跟欧盟犯横,这个罚款金额实在太高了。
律师给互联网公司的建议:保持冷静,跟GDPR认怂吧
(https://www.hospitalitynet.org/opinion/4084533.html)
今天,随着 Facebook 这一大堆用户隐私的丑闻,美国的议员们也开始把目光转向欧盟,希望在美国也搞一个类似的隐私法。有了欧盟的 GDPR、美国未来的隐私法,个人隐私问题会在全球法律上更完善、更多样。这对互联网产业的健康发展是非常有利的。
雷总您冷静
任何立法都有争议,GDPR 这么伟大光荣正确的法律也不例外。首先最大的争议就是:到底哪些数据是用户数据,哪些数据不是呢?
很多人说这不废话吗,从我身上来的就是,别人身上来的就不是。这个时候,程序员就会扶一扶黑框眼镜告诉你,事情没有那么简单。
一个互联网公司的数据,大概是下面这么个模式:
这个图看着太抽象,我们瞎编个例子:
小米CEO雷军每天在北京上班,他装了一个叫做“QQ天气”的应用,每天早上醒来,都需要查一下北京是不是有雾霾、要不要戴口罩。雷军每次打开QQ天气,QQ天气都会偷偷地给腾讯的数据中心发送这么一条信息:“20XX年X月X日,用户雷军,在北京海淀区,查看了本地天气。”
有时候雷军也去一趟印度开个发布会,现场给印度粉丝们发一批小米手环。于是时不时也会查一下新德里的天气。这些行为当然也被QQ天气如实汇报给马化腾了。每天QQ天气给腾讯做的这个小报告,因为没有进行过任何处理,所以叫做“数据生肉”。
日积月累,腾讯已经有五百多条关于雷军的小报告了,这些小报告太多,于是腾讯做了一个简单处理,把五百条小报告变成一句话:“雷军在去年两年内查看了523次北京天气,23次新德里天气。”这个数据因为不是直接从雷军身上扒下来的,而是腾讯后台处理出来的,所以我们管他叫“数据熟肉”。
雷军和印度粉丝们热情交流,并用标准的英语表示问候
(http://mobile.zol.com.cn/560/5601897.html)
当然,腾讯不可能只追踪雷军,它肯定还会追踪同样使用QQ天气的马云、刘强东、李彦宏。经过总结,腾讯发现,过去一年内,一共10万人在北京使用了QQ天气。“10万”这个数字,并不是从某一个用户身上总结过来的,而是多种数据共同推导而出的。所以我们管它叫做“衍生数据”。
数据熟肉和衍生数据,被腾讯一股脑地交给人工智能 “腾讯小Q”。小Q看了看,觉得像雷军这种经常去新德里的北京人,应该经常给他在手机上同时推送北京和新德里的天气。于是人工智能把这个给雷军手机上的QQ天气一说,QQ天气立马给雷军发了两条推送:一条北京的、一条新德里的。“北京今天重度雾霾,而且忒冷”、“新德里今天重度雾霾,但是vely vely hot”。
个人数据从收集,到处理,到归纳,到人工智能,再到返回用户,这就是互联网公司最简单的数据处理模式。任何使用人工智能的互联网公司,都有这些种类的数据,也都会采取这个流程。
咱们继续讲故事,雷军有一天突然想把自己的数据都删掉,于是给马化腾打了个电话。“没问题!”马化腾说完挂了电话。但第二天,雷军依旧收到了两条推送:“北京今天终于晴了”、“新德里今天继续雾霾”。
雷军于是跑到马化腾办公室理论去了。
“你不是删掉我的所有数据了吗?为什么腾讯还是知道我要去新德里?” 雷军很愤怒。
“雷总请冷静一下,”马化腾不紧不慢地讲,“我们确实把您手机每天发的小报告(数据生肉)都删了,但您经常用QQ查新德里天气这个习惯(数据熟肉),不是从您身上追踪来的,而是我们腾讯总结出来的。”
“那也不行,只要和我有关的数据,你都得删掉!你信不信我今天就把QQ注销了?” 雷军摔门而去。
第二天早上,雷军又收到了QQ天气推送:“北京沙尘暴,新德里今天还雾霾。欢迎注册腾讯会员,获得更多体验!”
雷军又找马化腾去了。
“雷总,您冷静一下。”马化腾淡然自若的说。“尽管您注销了QQ号,但我们发现,住在您家附近的人、您的家人、同事、朋友,都会经常去新德里跟随出差。这个数据(衍生数据)不是您的数据,而是我们根据所有用户分析出来的。这个您不能让我们都删掉吧?”
“少跟我来这套!” 雷军已经出离愤怒了,“我让所有小米员工,都注销QQ号!我们全家人,都注销QQ号!这样你们就不能给我推送了吧?”
第三天早上,并不意外地,雷军又收到了QQ天气推送:“北京下雨了,新德里艳阳高照。欢迎注册腾讯会员,获得更多体验!如果您让您的家人朋友注册腾讯会员,会奖励Q币哦!”
“这回你怎么解释?我办公楼的全体员工都没有QQ号了,我老婆孩子都戒了QQ了。你们为什么还知道我是雷军,我要去新德里?”雷军揪着马化腾衣领问。
“啊,对不起啊,”马化腾笑了,“您原来的数据已经教会我们这个人工智能小Q了。它……它给您的手机推送习惯了。”
腾讯小Q,腾讯的其中一个人工智能
图自 qrobot.qq.com
上面只是我编的段子,但由此可见,用户个人数据这个边界,其实特别模糊。数据熟肉算不算个人数据呢?熟肉的起源是生肉,但它是互联网公司辛苦总结出来的,难道控制权不该给互联网公司一部分吗?衍生数据算不算个人数据呢?如果算的话,那我不就把我内部服务器的原理都免费公开了吗?利用你的数据训练出来的人工智能,算不算你的个人数据呢?如果算的话,每次你注销账号,我们都有把训练出来的人工智能给“杀死”吗?
臣妾做不到啊!
咱们退一万步讲,就算个人数据这个边界特别清晰,真正把数据的控制权交给用户也不是一件容易事儿。
比如,我是个互联网大V,我发了一个慈善组织的推广微博,然后鼓励大家捐款。大家纷纷在评论区留言,说一定支持,一定把链接分享出去。然后,我等到深夜没人注意,偷偷把我的慈善组织的微博改成了一个网页游戏的广告,把链接指向了“贪玩蓝月”。结果第二天,微博用户们发现我这个广告下面全是“支持!”“非常有价值!”那这条微博,不就把原来写评论的人给坑了吗?这个时候,个人用户数据是一种讨论场景。一个场景的控制权,不能交给单独一个人。
咱们再想一个场景:两个 ISIS 恐怖分子用 WhatsApp 发信息,确定在哪里搞爆炸。第二天,他们真的这么干了,造成了几百人伤亡。FBI 找到了WhatsApp,说我们要这两个人的聊天记录。结果 WhatsApp 发现,ISIS这俩人早就把聊天记录删了,警方根本没法追踪到嫌犯。这个时候,个人用户数据是一种嫌疑人证据。一个犯罪证据的控制权,不能交给凶手。
假设现在有这么一个页面,这个页面可以查看、修改、删除、下载我所有的个人信息,这多方便啊!问题是,黑客也是这么想的。只要拿到你的密码,他就可以在你发现之前,瞬间下载完你所有的银行卡号、身份账号、裸照等等。理想状况下,个人隐私的控制权在自己手里。可现实生活中,个人隐私的控制权很容易就流到了黑客手中。
2014年,黑客瑞安·柯林斯(Ryan Collins)盗窃了一众好莱坞明星的裸照
“大表姐”詹妮弗·劳伦斯也是受害者之一
还有,不能追踪16岁以下的孩子的个人数据,但这个执行起来实在是太难了。世界大多数国家,都没有互联网实名制。根本就不知道这个用户到底是不是上网时候如实汇报了自己的年龄。一个在线观看“色戒”的中年用户头像,屏幕后可能是10岁的孩子。一个“你是不是已经满16岁”的对话框,完全不能避免一个孩子的数据被追踪。家长协议也是槽点满满,我去哪儿找这孩子他爹的账户去?就算孩子提交了一个有他爹签名的“家长同意书”,我作为互联网公司怎么知道这真是他爹,而不是隔壁王叔叔呢?
做这些隐私页面其实并不简单。像谷歌、Facebook、LinkedIn、亚马逊,这些成立了近20年的互联网公司收集了这么多用户数据,一下子让他们都把这些数据给用户还回来,臣妾实在做不到啊!很多创业公司,一共只有那么几个程序员,突然让他们写一大堆隐私页面,会让整个公司半年停摆。如果这些小公司到了5月25日这个截止日期,做不出隐私页面,那就会被罚巨款。担负不起怎么办?要么滚出欧盟市场,要么自己破产。
上有政策,下有对策
因为上面这些难点,互联网公司想了各种各样的对策,绕过种种隐私法。
最简单的做法,就是让用户很难找到自己的隐私。比如我们开头提到的新西兰小哥迪兰,他就是找个各种犄角旮旯才找到自己在 Facebook 的隐私数据的。你必须得在主页顶上点最右边的小三角,然后进入隐私页面,然后点下面的一行小字:“下载你的 Facebook 数据”。Facebook 还算良心,如果你去谷歌,就会发现谷歌的下载页面更难找。它藏在谷歌的帮助页面里面,需要点三个犄角旮旯才能找到。凭着这个小花招,互联网公司既能满足法律要求(也就是必须要有隐私页面),又能确保大多数人根本找不到这个隐私页面。
Facebook的隐私页面,藏在犄角旮旯里
第二种方法,就是百试不爽的“用户协议”。弹出一个巨长无比的用户协议,然后问你同意不同意。你只能点同意,不然上不了这个网。最近大家是不是都开始发现各种软件、网站突然协议弹窗变多了?原因就是这个欧盟的 GDPR。
第三种方法,叫做“支付墙”(Pay Wall)。就是说,假如你不想被我们的网站追踪,那就得每月给我们交钱。上面的雷军如果不想让马化腾追踪自己,那马化腾有权说:“你必须每个月充Q币、买黄钻会员。” 每月交的钱,就像给黑社会的保护费。交过保护费以后,就像建了一堵“隐私墙”,Facebook、谷歌就不再追踪你,也不会用广告骚扰你了。
最近扎克伯格刚刚被美国国会质询,一个参议员问小扎:“是不是以后我们把钱给Facebook,Facebook 才不追踪我们的隐私?”扎克伯格并没有立即否认,反而很委婉地说:“我们永远都会有一个免费版的Facebook。”这话让人听完非常睡不着觉。因为扎克伯格很可能在暗示,免费版的Facebook会把你的隐私卖给广告商。如果你不想让我们卖的话,欢迎充“Facebook会员”啊!
还有一些方法就比较冷门了,比如删账号。如何应对16岁以下儿童的隐私保护呢?这个太棘手,所以有些公司会干脆注销掉所有孩子的网络账号,删掉所有他们的信息,以防信息泄露给广告商,给自己招来麻烦。
当然这些对策都是 GDPR 法律边界的试探,如果欧盟认为互联网公司的“支付墙”、或者“用户协议”并不合法,那么甭管你是 Facebook 还是谷歌,都得乖乖交罚款。
个人隐私和“数据启蒙运动”
我们在这里讲 GDPR,并不想解释一个枯燥的法律,或者谴责某个互联网公司滥用隐私。我想借着隐私立法的契机,讲一个社会运动——数据启蒙运动。
最早注册 Facebook 的那一批人,根本不会想到 Facebook 会背叛他们、贩卖个人隐私。因为互联网时代是免费的、是公开的、是尝鲜者的乐园。互联网时代也是快节奏的,它可以迅速淘汰掉弱者,迅速推翻前一个巨头。在这些互联网公司咿呀学语的时候,都是懵懂无知的理想主义者:扎克伯格并不想在Facebook上放广告,拉里·佩奇只想做一个简单的网页搜索,杨致远想把雅虎变成一个互联网门户,陈士骏只想把 YouTube 变成人们分享小视频的广场。
Facebook、谷歌、雅虎,它们最早都不是广告公司,但都想不出更好的赚钱办法。于是创业者们发明了一种完美的模式——免费模式。用户注册免费,但个人数据会被网站追踪,用来推送广告。因为注册是免费的,所以Facebook、谷歌这样的公司用户量会出现暴增,可以迅速成为霸主。个人数据是无穷无尽的,只要认真挖掘,一定能卖个好价钱。
在免费模式里,你和我都不是Facebook的客户,而是Facebook的产品。我们的隐私数据生肉会被 Facebook 煮成熟肉,打包卖给出价最高的广告商。可用户的增长如果达到了饱和怎么办?那就从已有的用户身上挖掘更多的数据,用更高级的工具做出更细致的分析,卖给更多的广告商。
360创始人周鸿祎推崇“免费模式”
2018年,360快视频盗取了B站大量账号和视频,
可以说是把“免费模式”做到了走火入魔
我们今天看到,大数据非常火爆,数据分析师年薪十万美元,道理就在这儿。互联网公司像从奶牛身上挤奶一样,从用户身上“挤”数据。然后数据工程师用 Kafka、Storm、Hadoop、Spark 这些外行人根本没听说过的工具,把数据生肉处理成熟肉。数据分析师仔细地把用户数据整理归类,然后给广告商端出来。一个谷歌的前部门经理曾说过,谷歌的核心竞争力不是搜索或者安卓,也不是地图或者日历,它的竞争力是能把用户数据变成钱(“User Data Monetization”)。“把用户数据变成钱”,这才是免费模式的背后逻辑。
可随着Facebook隐私丑闻的爆发,人们越来越意识到,泄露个人网络隐私是危险的。这种个人隐私的觉醒,会带来一场“数据启蒙运动”。它会推动各国隐私立法,让Facebook、谷歌这样的互联网公司获取用户数据的成本越来越大。
在未来几年,我们会看到越来越多像GDPR这样的隐私法出台,也会看到越来越多的“扎克伯格”们出庭作证。如果谷歌想做一款新的应用,那一定要考虑这个应用会不会泄露用户隐私。Facebook 想搞新的交友工具,那也得先征求用户每个人的意见。
免费模式带来的野蛮商业生长,会因此逐步放缓。互联网公司雇佣的那些数据工程师、数据分析师、人工智能科学家们,也有可能也会越来越少,越来越没有继续挖掘用户数据的动力。
随着“隐私启蒙运动”的兴起,大数据时代下的免费模式,会不会成为历史呢?
特约作者:屈直
屈直,雅虎软件工程师。深入分析,大胆预测,敬请关注 “硅谷直说”。
封面图自网络,版权属于原作者
推荐阅读
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 澳门是伟大祖国的一方宝地 7950787
- 2 央视曝光未成年人绕开防沉迷只需4元 7900498
- 3 上海地铁又现致歉信专用章 7808056
- 4 2024 向上的中国 7792686
- 5 张雨绮 为了讨大家喜欢才穿成这样 7654131
- 6 星巴克大罢工 7529203
- 7 特朗普赞成TikTok继续在美国运营 7403680
- 8 大S老公具俊晔站C位跳女团舞 7300088
- 9 男子暴瘦110斤后被质疑戴人皮面具 7224118
- 10 老人花2万买保健床垫后再不愿去医院 7162405