人工智能概念诞生至今,一路伴随着是是非非,但如今「AI+大数据」已经在各个方面切实造福了人类。我们想用一篇文章的时间,回顾一下近年来人工智能的落地情况。当年网飞凭借一部《纸牌屋》破圈,一举成为流媒体平台的顶流,因其对技术的包容度,使得网飞在巨头林立的当下,依旧能坐稳流媒体头把交椅的位置。大数据帮助网飞打造出《纸牌屋》,如今网飞还想更进一步,前段时间尝试了用 AI 编写剧本。在 AI 执笔写本子之前,网飞「强迫」它看完了 40 万小时的恐怖电影,以一部电影 90 分钟为例,这相当于一口气看完了 27 万部电影。有了范本积累,AI 从中学会了吓人的套路,并写出了一部名叫《Mr Puzzles wants you to be less alive》的恐怖电影脚本。这部电影发布在「Netflix is a joke」频道里,这部恐怖短片仅有 4 分多钟,画风比较粗糙,里面缝合了许多 B 级片爱好者非常熟悉的桥段:电锯、机关、谜题、面具男。虽然元素整得像模像样,然而剧情禁不起仔细推敲,漏洞百出,看完全片的观众都说这更像是一部喜剧片,我想之所以会发生这种情况,大部分恐怖片的剧本逻辑本身就存在诸多问题,把这些电影作为训练样本,我们就不指望能教出好学生了。或许只要稍加设计,给学习样本分级,之后再进行迭代,未来人工智能真的能创作出令人眼前一亮的艺术剧作。不过如今看来,这只是一次有趣的尝试。英伟达在 2019 年的 GTC 大会上,展示了一款交互应用 GauGAN,根据文字输出图像。而就在上个月,英伟达将这款应用更新至 2.0 版本。譬如用户在文本框里输入「海水冲击着滩石」,AI 就能实时生成一张栩栩如生的图像,堪比摄影大片。它就像一名建模师,根据文本在脑海里生成画面,并且画出极为真实的图片。英伟达为其投放了超 1000 万张公共 Flickr 图片进行模型训练。英伟达标表示这套系统已经被用于电影和游戏领域,或许是用在分镜创作上,天然契合这种用途。另外 GauGAN 还有另一个功能,就是人工智能版的你画我猜,名叫英伟达 Canvas。用户在画布上简单地画上几笔,人工智能就能用它「毕生所学」往不同颜色、形状的区域内填充图片,猜出你想画的图像,最终生成出较为理想、照片级的画。这套系统难点在于如何让天空、海洋、石头、云彩不同图层自然地衔接过渡。不光是英伟达,OpenAI、Adobe、微软亚研院都在进行类似的多模态预训练模型项目。这已经不算什么新鲜事儿了,Google 从 2016 年在初代 Pixel 手机上就引入了计算摄影的理念,在人工智能的帮助下,手机摄影存在的一些先天劣势被一个个攻破。在那之后,手机拥有了极快的合焦速度、消除鬼影、明亮且清晰的夜间模式等能力,计算摄影如此好用,甚至反过来影响了传统单反和微单的发展。此外,痴迷于人工智能和算法的 Google,还开发出了相当不错的高清修复算法,人们利用这套算法,可以把老照片的细节变得清晰可辨;可以往一张 32x32 像素的马赛克照片里填充更多像素,变成一张 256x256 的照片;可以把一张照片放大后再转高清,从而实现某种意义上的无限放大。实现这一切的基础依旧是机器学习,用海量的图片库对 AI 训练,然后通过大规模图像比对学习提高还原的准确性,再学习迭代。这种通过预测实现的高清修复,或许永远达不到实拍高清图那样真实,但依旧有着很高的应用价值。想想你家里的老相册,如果把里面的照片全都变高清,会不会唤醒你对片中场景里的更多记忆呢?上面提到的,大多是 AI 好的一面,倘若这项技术落入不良分子手里,AI 就成了原有秩序的破坏者。今年 7 月,网上出现了一种新型游戏外挂。在 Anti-CheatPD 放出演示视频中,演示者利用采集卡收集图像,充当外挂的「眼睛」,再用 AI 进行视觉定位,筛查出图像中的人形目标,一旦识别出敌人,作弊系统快速计算出鼠标需要移动的方位和距离,并将结果反馈给输入控制设备,充当外挂的「手」,「替」玩家移动鼠标,完成自瞄。由于这种作弊方式并不需要篡改游戏文件,所以不会被目前的反外挂机制抓到,而且还可以用在主机上,作弊流程依旧是「采集画面-筛查-计算-反馈 」。这款外挂的出现,让号称游戏净土的主机圈炸了锅。虽然这款外挂的开发者在被动视警告过后,把工具下架并删除了其在 YouTube 上传的视频,然而这只是明面上的下架,其他拥有相应开发技能的人,可以利用相同的视觉训练算法,开发出另一套作弊工具。更可怕的是,这套外挂系统隐蔽性极强,很难反制。或许只有 AI 能够解决了,所用方法便是学习玩家习惯,从而侦察出一些非常规操作,加上人工筛查实现甄别,但这就跟现实世界中的抓捕行动一样,我在明敌在暗,反外挂系统需要成百上千倍的努力才能完成抓捕,前路漫漫。我们已经看过太多被外挂玩坏的游戏了,希望未来我们不会被坏人用 AI 剥夺游戏的乐趣。AI 外挂破坏游戏平衡,而索尼想利用 AI 助手,让玩家的游玩过程更顺畅。去年索尼公开的一份专利显示,未来主机端将会加入 AI 助手,帮助玩家脱离卡关,充当类似于游戏攻略的角色。它的作用机制类似于 Siri,玩家向 AI 提问「我该如何击败这个 Boss」,AI 便会作出反馈,提出解决办法。它的底层逻辑依旧是搜索引擎,但在某种意义上实现了「我带你们打」。如果我们要盘点 2010 年后最大的科技进步有哪些,自动驾驶必有一席之地。无论是传统车企还是造车新势力,他们都在发力自动驾驶技术,其中最为激进的当属特斯拉。在今年 7 月特斯拉上线的 FSD Beta 9.0 版本中,特斯拉具备了城市道路中的自动驾驶辅助功能,能够在交通情况复杂的城市道路中完成变道、超车等动作,这一切仅靠 Tesla Vision 光学图像视觉系统实现。在路试视频里看来,特斯拉自动驾驶的操作还是比较顺畅的,但在转弯、变道场景下显得有点犹豫,像极了刚刚拿到驾照上路的我。特斯拉在汇入主路时犹豫不决,图片来自:@Chuck Cook不光是特斯拉,许多车企都有公布自动驾驶路测视频的习惯,但车主们别被这些视频冲昏头脑.无论是自动驾驶或是辅助驾驶,都远远称不上完美,为自己和他人的安全着想,请理性看待这项技术,切勿把驾驶权完全托管给人工智能。明年冬奥会,一位 AI 央视主播将正式上岗,她会在央视新闻中负责手语播报工作。虽然我看不懂手语,但从她的手部和嘴部动作看来,自然且流畅,确实跟真人手语翻译没有太大差别。她利用自然语言理解技术将人的文字或语音翻译成手语动作,继而用躯干和表情呈现出接近真实的手语表达能力。十月举办的华为 HDC2021 大会上,也出现了一个「AI 手语数字人」。听障人士在她的帮助下,也能「听到」手机中播放的视频内容,这才是科技造福人类的正确打开方式。从今天的 AI+ 发展趋势看来,人工智能赋能的效果显著,它没有像科幻电影里描写的那样,让人类走向灭世。整体大多都是善意的,在它的帮助下,方便了人们的工作与生活,只希望现状能持续下去,人们少动一点歪脑筋,让科技继续向善而生。
点击「在看」
是对我们最大的鼓励
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/