想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。
前几天, Meta 公司推出了一个据说开发了4年的鉴黄工具,为了阻止别人在社交网络上传你的私密照。
功能简单来讲是这样:
用户需要先通过第三方运营的网站上传照片给工具,提取照片的数字指纹,之后这个数字指纹会共享到社交平台,用于检测是否有人分享这些照片。
听起来是不是挺厉害?但这里面有个前提条件,就是得先把自己的落照上传给这个工具。
不是,你们搞了 4 年,就搞出了这么个玩意?
要说这个项目,还得追溯到 2017 年。
当时还叫 Facebook 的 Meta 公司,为了帮助身陷色情报复的受害者,开始研究起了网络鉴黄,这一项目还获得了社会各界的认同。
最初版本的工具于 2018 年推出,需要用户通过邮件上传自己的私密照片,由工作人员审核,进行照片的数字指纹提取,用于检测平台上是否存在相似图片。
征集也就算了,还打算依靠人工审核,这波操作当时就收获了一大片问号。
过了一年, Facebook 打了一个补丁。这一次,后续检测平台图片的任务,交到了 AI 手上。
然而,前期搜集照片数字指纹的步骤,还是得依靠人工审核。。。
前前后后四年过去了, Meta 公司终于憋出了工具的新版本。
审核人员终于下岗了,提取照片数字指纹的工作,总算交给了 AI 。
为了挽救一下被搞臭的名声, Meta 公司还把提取数字指纹的工具搭建在了第三方网站上,只共享包含数字指纹的数据库。
这个怎么都绕不开的数字指纹,其实就是哈希值,也相当于一张图片独一无二的数字信息。两组图片哈希值差异越小,图片的相似度就越高。
搞出这么一套东西的原因,也是因为单张图片信息量太大了,直接拿来比对非常困难,所以需要一个更简单的方式。
想要把数据量压缩下来,就得抓取出来图片的关键特征,用特征点来代表这张图。
而对于图片而言,最关键的特征,就是线条。
之所以选择线条,原因也很简单。以下面这张图为例,去掉颜色和明暗细节,只保留线条,我们就可以得到第二张图。
看到没有?只要保留线条,就算是简单的黑白线条,查重率还是 100% 。而且线条的数据量一看就比颜色小得多,处理起来更容易。
所以说,哈希值的核心,就是通过“ 线条 ”这一关键特征来识别图片。
知道要提取哪方面的特征之后,我们还得把特征量化成数字。咱们再来看看下面这张图,系统会先砍掉大部分色彩及尺寸数据,得到 32 * 32 像素的灰度图。
接下来,对这张黑白马赛克的线条特征进行一次信息提取。
可以看出来,线条部分像素灰度变化大( 红圈内 ),相同灰度像素点出现的频次较低。
而大面积着色部分像素灰度变化小( 绿圈内 ),相同灰度像素点出现频次较多。
根据这个特征,我们就可以对像素点进行一次重排,把出现频次低的像素点扔到左上角的位置。
这样一来,我们就可以用左上角的这些像素来表示这张图片的线条,这一下子又省事了不少。
但这还不够,还得想办法把它变成一个字符串。
处理办法也不难,系统会在这一步计算出这堆像素点的平均灰度值。
像素点灰度低于这个平均值的计为 0 ,高于平均值的计为 1 ,之后我们就会得到一串字符串,它就是图像的二进制哈希值代表,当然,实际运用中还会继续换算成十六进制哈希值。
从图片变成一小段字符,数据比对的工作效率一下子就高多了。
这项技术最早由微软与 Hany Farid 教授共同开发,如今已经发展得非常成熟,特别是在打击违法文件传播的工作中应用十分广泛。
没错,如果有人用网盘传给你的远古色图被夹了,那一定就是这项技术的功劳。
几个月前,苹果为了打击儿童色情犯罪行为,扫描用户相册使用的也是哈希技术。只要通过对比 CSAM ( 儿童性虐待材料 )数据库中已存在的哈希值序列,就可以检测用户手机中是否存在违规照片。
但它只能在广泛流传的文件中奏效,如果想用同样的方法毙掉网上的私密照片,不好意思,服务器上没有你裸照对应的哈希值。
这也就意味着要用这招,你要么给他们送一份裸照的哈希值,要么就得往服务器上送一份自己的裸照,让他们帮你把哈希值算出来。
很不幸的是,Meta 这次用的就是后面这招,也就是说,虽然后台没有审核人员了,但你依旧需要往服务器上发一张裸照。
这波啊,以毒攻毒了属于是。
而且虽然他们保证自己不会保存照片,但是中间万一被黑客给截了呢?只要联了网,没有人能保证中间的任何一个步骤,不会被人拦截窃取。
而且我就想不明白了,线上算是算,到本地算不也是算嘛?干嘛不直接搞个离线工具包,让用户自己提取哈希值上传呢?
看不懂。
况且就算在本地计算哈希值,这套方案的破解方法,也简单到令人发指。
因为哈希值检测的技术核心是提取图片轮廓信息,所以只需要在线条上做点手脚,数字指纹分分钟比对失败。
比如,简简单单给图片加个涂鸦,立刻“ 查无此图 ”,想要对你展开色情报复的人,随手就能绕过这一道坎。
Meta 公司四年时间搞出来这么一份形同虚设的工具,说真的,实在有点说不过去。
以至于网友们直接提议,干脆一刀切算了,全网禁止色图上传绝对保险。
再不济, Facebook 的人脸识别玩得那么溜,直接比对脸部特征也比拿裸照搭建数据库强啊。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 老百姓的事情是最重要的事情 7994257
- 2 多省否认花一万亿推平黄土高原 7982862
- 3 央视蛇年春晚分会场确定 7873101
- 4 数说2024中国经济脉动 7744258
- 5 13.2万瓶“特供酒”销毁 7618563
- 6 中国籍两兄弟在日本偷走3200颗包菜 7557102
- 7 近9000亿美元!拜登签了 7400211
- 8 网红羊毛月被禁止关注 7308468
- 9 充绒量仅3克 波司登客服回应 7226722
- 10 景区回应李现在虎跳峡举国旗 7122468