想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。

百家 作者:差评 2021-12-08 07:57:10



前几天, Meta 公司推出了一个据说开发了4年的鉴黄工具,为了阻止别人在社交网络上传你的私密照。


功能简单来讲是这样:


用户需要先通过第三方运营的网站上传照片给工具,提取照片的数字指纹,之后这个数字指纹会共享到社交平台,用于检测是否有人分享这些照片。


听起来是不是挺厉害?但这里面有个前提条件,就是得先把自己的落照上传给这个工具。


不是,你们搞了 4 年,就搞出了这么个玩意?


要说这个项目,还得追溯到 2017 年。


当时还叫 Facebook 的 Meta 公司,为了帮助身陷色情报复的受害者,开始研究起了网络鉴黄,这一项目还获得了社会各界的认同。


最初版本的工具于 2018 年推出,需要用户通过邮件上传自己的私密照片,由工作人员审核,进行照片的数字指纹提取,用于检测平台上是否存在相似图片。


征集也就算了,还打算依靠人工审核,这波操作当时就收获了一大片问号。


过了一年, Facebook 打了一个补丁。这一次,后续检测平台图片的任务,交到了 AI 手上。


然而,前期搜集照片数字指纹的步骤,还是得依靠人工审核。。。


前前后后四年过去了, Meta 公司终于憋出了工具的新版本。


审核人员终于下岗了,提取照片数字指纹的工作,总算交给了 AI 。


为了挽救一下被搞臭的名声, Meta 公司还把提取数字指纹的工具搭建在了第三方网站上,只共享包含数字指纹的数据库。


这个怎么都绕不开的数字指纹,其实就是哈希值,也相当于一张图片独一无二的数字信息。两组图片哈希值差异越小,图片的相似度就越高。


搞出这么一套东西的原因,也是因为单张图片信息量太大了,直接拿来比对非常困难,所以需要一个更简单的方式。


想要把数据量压缩下来,就得抓取出来图片的关键特征,用特征点来代表这张图。


而对于图片而言,最关键的特征,就是线条。


之所以选择线条,原因也很简单。以下面这张图为例,去掉颜色和明暗细节,只保留线条,我们就可以得到第二张图。


看到没有?只要保留线条,就算是简单的黑白线条,查重率还是 100% 。而且线条的数据量一看就比颜色小得多,处理起来更容易。


所以说,哈希值的核心,就是通过“ 线条 ”这一关键特征来识别图片。


知道要提取哪方面的特征之后,我们还得把特征量化成数字。咱们再来看看下面这张图,系统会先砍掉大部分色彩及尺寸数据,得到 32 * 32 像素的灰度图。


接下来,对这张黑白马赛克的线条特征进行一次信息提取。


可以看出来,线条部分像素灰度变化大( 红圈内 ),相同灰度像素点出现的频次较低。


而大面积着色部分像素灰度变化小( 绿圈内 ),相同灰度像素点出现频次较多。


根据这个特征,我们就可以对像素点进行一次重排,把出现频次低的像素点扔到左上角的位置。


这样一来,我们就可以用左上角的这些像素来表示这张图片的线条,这一下子又省事了不少。


但这还不够,还得想办法把它变成一个字符串。


处理办法也不难,系统会在这一步计算出这堆像素点的平均灰度值。


像素点灰度低于这个平均值的计为 0 ,高于平均值的计为 1 ,之后我们就会得到一串字符串,它就是图像的二进制哈希值代表,当然,实际运用中还会继续换算成十六进制哈希值。


从图片变成一小段字符,数据比对的工作效率一下子就高多了。


这项技术最早由微软与 Hany Farid 教授共同开发,如今已经发展得非常成熟,特别是在打击违法文件传播的工作中应用十分广泛。


没错,如果有人用网盘传给你的远古色图被夹了,那一定就是这项技术的功劳。


几个月前,苹果为了打击儿童色情犯罪行为,扫描用户相册使用的也是哈希技术。只要通过对比 CSAM ( 儿童性虐待材料 )数据库中已存在的哈希值序列,就可以检测用户手机中是否存在违规照片。


但它只能在广泛流传的文件中奏效,如果想用同样的方法毙掉网上的私密照片,不好意思,服务器上没有你裸照对应的哈希值。


这也就意味着要用这招,你要么给他们送一份裸照的哈希值,要么就得往服务器上送一份自己的裸照,让他们帮你把哈希值算出来。


很不幸的是,Meta 这次用的就是后面这招,也就是说,虽然后台没有审核人员了,但你依旧需要往服务器上发一张裸照。


这波啊,以毒攻毒了属于是。


而且虽然他们保证自己不会保存照片,但是中间万一被黑客给截了呢?只要联了网,没有人能保证中间的任何一个步骤,不会被人拦截窃取。


与 StopNCII.org 和合作的技术平台
仅共享哈希值,而不是图像本身 ▼


而且我就想不明白了,线上算是算,到本地算不也是算嘛?干嘛不直接搞个离线工具包,让用户自己提取哈希值上传呢?


看不懂。


况且就算在本地计算哈希值,这套方案的破解方法,也简单到令人发指。


因为哈希值检测的技术核心是提取图片轮廓信息,所以只需要在线条上做点手脚,数字指纹分分钟比对失败。


比如,简简单单给图片加个涂鸦,立刻“ 查无此图 ”,想要对你展开色情报复的人,随手就能绕过这一道坎。


Meta 公司四年时间搞出来这么一份形同虚设的工具,说真的,实在有点说不过去。

以至于网友们直接提议,干脆一刀切算了,全网禁止色图上传绝对保险。


再不济, Facebook 的人脸识别玩得那么溜,直接比对脸部特征也比拿裸照搭建数据库强啊。


撰文:兴坤   编辑:面线   

图片资料来源:
Google图片、
https://about.fb.com/news/2021/12/strengthening-efforts-against-spread-of-non-consensual-intimate-images/、
https://www.cnblogs.com/Kalafinaian/p/11260808.html



关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接