“黄暴”视频看出心理阴影,内容审核师能被AI拯救吗?
大数据文摘出品
作者:刘俊寰
但不管是YouTube还是国内,视频审核都没有文摘菌想象的这么美好。
在知乎上,相关话题的浏览量已经达到了167951次,其中网友@white举例说道,“ISIS杀戮人质的视频让我狼狈不堪,非洲人民凶残的一面让我感到害怕,美国黑人区发生的让我感到惶恐,美国天黑时散发出恐怖的色彩!可能人类的本质就是杀戮,被割喉的人疯狂的挣扎,暗红色的血液缓缓慢流动出来,日本自杀深林中令人作呕的尸体……”
知乎话题链接:
同样,作为YouTube的内容审核师,他们的工作并没有轻松到哪去。
YouTube的内容审核师Peter告诉TheVerge,他每天负责的就是极端暴力(violent extremism)的视频审核,这可以说是整个审核工作中最致郁的一个板块,正如上文提到谷歌为审核团队制定了严格的工作计划,他必须看足够量的暴力色情视频。
“每天你都会看到有人砍人,或者射杀亲友,”Peter说,“你会觉得,这个世界很疯狂,这会让你感到不舒服,甚至不想继续活下去。我们到底为什么要这样对待彼此呢?”
在过去一年里,Peter和同事们的生活都受到了极大的影响。一位同事患上了神经衰弱,还有一位同事因工作中的焦虑和抑郁而痛苦不堪,饮食和作息逐渐紊乱,最后患上了急性维生素缺乏症,不得不住院接受治疗。
不止是Peter和同事们,另一位视频审核师Daisy曾负责Google视频中的恐怖主义和儿童虐待内容的审核,从事这项工作后,她曾一度难以和孩子交流互动。在接受精神科专家诊断后,她被确诊患有PTSD,至今仍在接受治疗。
根据报道,审核师在申请工作的时候通常并不了解极端视频会对身心造成怎样的伤害,而就YouTube的审核师所透露的内容来看,谷歌向应聘者所说明的审核数量和工作要求往往是过低的。
虽然谷歌为全职审核师制定了相关的医疗保健标准,他们可以休假数月,以解决严重影响工作与生活的心理问题,但这只是谷歌内部被报道的情况,全球范围内还有更多未被报道的内容审核师遭受了心理创伤后被公司无情忽视。
AI参与视频审核并非近几年才有,最早2000年左右,就有公司在做这方面的尝试。但那时,视频审核需要人为设定特征和规则,比如黄颜色皮肤面积分布情况。一直到深度学习得到发展后,视频审核才终于变得“灵活”了。
但是,在视频审核上,目前业内普遍采用的仍然是“人机结合”的方式,并且人工在其中占据着重要比例。
YouTube的算法工程师向文摘菌透露,目前YouTube上大部分视频仍需要经过人工审核,被审核视频一部分是AI检测出来,一部分是用户举报的,但最终都需要专业的审核师把关决定是否违规。
根据爱奇艺算法工程师Leo的介绍,目前业内有以下两种比较常见的“人机配合”审核方式:
一种AI将相对确定的视频进行分类,然后对部分用户做出推荐,观察用户反应,其中高热视频会人工率先审核;
另一种是AI将视频标记为“good”或“bad”,当审核师遇到标注有“bad”视频时再细致地审核,这也提高了审核效率。
爱奇艺目前采取的是第二种模式。视频会先经过机审预判,然后再进行人工一审和复审,其中机审结果主要作为参考辅助人工,另外还有视频清查机制。
针对AI取代人工审核的说法,Leo认为还为时过早,虽然AI在客观视频的审核上做得足够好,但一旦涉及与语境语义相关的主观内容,就捉襟见肘了。
AI审核存在两个技术难点,一个是算法准确率问题。在业内有句话,“脱离数据集来谈准确率都是耍流氓”,这就是说,用数据集训练出来的AI模型并不都能匹配实际行为,还存在用户行为偏差等诸多影响因素,即使AI审核的准确率达到了99%,考虑到用户上传的视频量,剩下1%的累计量也是惊人的。
而一旦出现疏漏,视频网站将承受巨大的风险。
另一个难关就是对内容的主观判断。简单来说,不是所有露骨的内容都是色情,也不是所有色情视频都有裸露,再加上视频内容中涉及到的文字、语音等多方面情景混杂,对人来说较容易判断,但对机器而言需要多个算法叠加。
Leo告诉我们,比如在处理音频内容时,一方面需要利用ASR转化成文本,另一方面需要对声音分类,这就包括一些无意义的音频,比如娇喘声。如果画面中还出现了文字,需要借助OCR把文字从视频中抠出来,但最终都要利用NLP,也就是文本理解。
因此,人工审核在整个审核领域仍然是至关重要的一环。爱奇艺配置的专业审核团队主要负责甄别用户上传视频的内容,将不符合国家法律法规、平台标准的内容筛除。
对AI审核而言,除去上述的准确率和内容主观判定对AI而言仍然无解之外,对敏感内容的界定本身尚未清晰也是一个不可忽视的重要原因。
在国内,违规内容一般统一由广电总局统一规范,视频网站在规则界定上显得被动,他们需要根据广电总局指定的标准进行严格的自审,甚至有些公司会成立专门的法务咨询岗位,专门研究广电总局的政策。
而在全球范围内,更多的视频网站承担着自行定义敏感内容的职责。但也正因为有更大的主动性,他们就承担更大的责任。想要全球范围内统一的审核标准无疑是一项非常棘手的工作,如果没有考虑到当地文化因素,严重情况下视频网站会陷入与政府和民众的苦战中。
比如,2018年7月,印尼政府禁止了流行的短音乐视频制作应用TikTok,也就是抖音国际版。不久前,美国军队出于安全考虑,也明确规定了禁用TikTok。
根据印尼媒体的报道,印尼政府禁止TikTok是因为该应用程序包含了太多负面视频,印亚公众情绪也普遍反对青少年使用TikTok,因为有些视频会对青少年造成不良影响。其中一个视频是这样的:开始是一段舞蹈,随后镜头猛然切到一具尸体,有关部门调查后发现这具尸体是拍摄者的亲戚。
除了上述涉及死亡的视频,世界范围内对以下内容的视频都格外谨慎:
煽动暴力的宗教仇恨言论 假新闻和为政治目的而传播 针对个人/组织的诽谤性语言
对内容的审核需要文化意识和对相关社区“标准”的语境理解。尽管AI可以执行预调节,帮助减少人工审核的工作量,但人工参与仍是不可缺少的环节。 AI面临着公众不信任,特别是可能存在无意识的人类或技术偏见。此外,算法可能对违规内容起不到检测作用。针对此,一方面要定期分析并调整算法,另一方面,利益相关者应保证AI的透明度。 由于格式多样性和内容复杂度,用户生成的视频内容越来越难以分析,它们需要被解释为一个整体,以此来鉴定是否违规。为了更好地了解用户行为,及时更新违规有害内容的定义,平台和服务提供商之间最好能够共享数据集,这有利于利益相关者获得更好的文化意识和语境理解。
https://www.theverge.com/2019/12/16/21021005/google-youtube-moderators-ptsd-accenture-violent-disturbing-content-interviews-video
实习/全职编辑记者招聘ing
加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 重温总书记对人民警察队伍的嘱托 7947827
- 2 民警被刺4刀牺牲前画面看得心痛 7944587
- 3 在上海看见唐僧开紫色迈凯伦了 7878314
- 4 成渝地区双城经济圈五周年成绩单 7798385
- 5 蔡明打车被司机问今年会上春晚吗 7666437
- 6 晓华理发店开进了春晚后台 7589544
- 7 54岁工藤静香状态 7465302
- 8 格陵兰岛政府:不想当丹麦人 7370500
- 9 李现护驾火了 7244569
- 10 百万人在线云蹲守帮肥娟看店 7159778