纵览iPhone X所有新特性:从3D人脸识别到A11Bionic神经引擎
机器之心原创
机器之能编辑部
3D 摄像头和 AI 会是新一轮智能手机变革的引爆点。
今年,恰逢苹果手机发布十周年。北京时间 9 月 13 日凌晨 1 点,苹果在乔布斯剧院召开新品发布会。
北京时区的果粉们熬了一个多小时后,终于等来「压轴嘉宾」——苹果十周年特别版 iPhoneX。外观上,iPhone X 首次在 iPhone 上实现 OLED 全面屏,前身和背部采用了玻璃材质,内部采用不锈钢材质,防尘防水,屏幕尺寸达 5.8 英寸。iPhoneX 的屏幕为 Super Retina Display,分辨率达到了 2436 x 1125,其每英寸有 458 个像素,这超过了以往所有的 iPhone。
它的独特之处是没有「Home 键」,库克在发布会上将这款「iPhoneX」的特别版称为「iPhone10」。没了 TouchID,iPhone X 采用 Face ID 作为手机生物辨识技术。为了实现最佳功能,除了利用位于屏幕上方的 TrueDepth 相机之外,手机还使用了新的神经引擎。嵌在新款 A11 Bionic 芯片里的神经引擎是双核心架构,能每秒处理 6 兆个指令。Face ID 的安全系数比 Touch ID 更强,同时兼容于现有的 Touch ID 保护功能。
过去十年中,智能手机变得越来越轻薄,越来越快速,但是其它功能方面似乎没很大的改进,各家厂商的产品也日趋同质化。想要预测未来智能手机的样子,不妨将注意力放在设备的摄像头以及利用该组件的软件上。
「智能化的路径需要新的传感器,3D 摄像头会是一个典型的代表。」阅面科技 CEO 赵京雷在接受机器之心采访时表示。「摄像头是手机捕获世界的眼睛,捕获的任何图像,都需要进行处理,AI 为这些图像的处理赋予了更多可能。我们认为视觉 AI 技术的应用将掀起智能手机下一波浪潮。」商汤科技告诉机器之心。
一、消失的 Home 键
iPhone X 的解锁由简单的三个动作串联完成,拿起手机、看一眼手机、手指从手机底部向上滑即可。苹果手机从「滑动开锁」时代,演进到「指纹解锁」时代,最终进化成现在的「看一眼解锁」时代。通过边上的按钮,也能呼唤出 Siri。
其实,苹果考虑对 Home 键进行改变的时间远比我们认为的要早。去年苹果发布 iPhone 7 和 7 Plus 的时候,这些设备获得了巨大的成功,吸引了众多新的以及想要换新机的用户,他们对相机出色的表现赞不绝口,但也仅限于此,除此之外并无更多值得夸耀之处。他们也在不知不觉中改变了 Home 键的属性,因为这些新的苹果机并不像过去的设备那样对 Home 键有很高的依赖度。
Home 键的消失的部分原因在于工艺设计。从屏幕材质和尺寸大小方面考虑,全面屏基本不存在工艺难题,难点在于需要手机厂商解决摄像头、指纹键等多个手机部件的位置布局形态。虽然智能手机配置指纹识别功能已经普及,但在智能手机实现全面屏的需求下,指纹识别功能前置和后置等形式会出现不同程度的工艺难题。小米 Mix、LG G6、三星 S8 等手机表明,指纹识别功能的归置已经成为时下较为棘手的问题
虽然虹膜识别也是较为成熟的生物识别技术。但在智能机上的大规模采用,会受到成本和技术的限制,用户体验也不佳。有调研显示,相比指纹识别,虹膜识别只是添置一个红外摄像头,但是红外摄像头的单价远远高于一颗指纹模组,也给手机厂商带来成本压力。
「指纹膜组的取消不仅能够在价格上打开新思路,所节省出来的空间还可以让手机厂商实现其它性能的提升与完善,或是新功能的尝试与创新。同时,人脸解锁与全面屏是紧密结合的,随着全面屏的触发,未来人脸识别将成为全面屏的标配。」旷视科技副总裁吴文昊告诉机器之心。
二、「看一眼」解锁,苹果的优势与布局
起价 999 美元的 iPhone10 后置双摄像头后,再配备前置 3D 感应摄像头(TrueDepth),不仅支持 AR 增强现实技术,还可以与相机配合,完成面部识别验证。「这个阶段而言,以苹果的应用为分水岭,可以认为它的安全性超过了指纹。」赵京雷告诉机器之心。
1、成熟的人脸识别技术。以往的脸部识别系统错误接受率达到 1%,安全性相当糟糕。旧式脸部识别系统仅仅使用摄像头来给你拍张照片,然后拿它来跟存储在设备上的图像进行对比,进而作出判断。盗贼只需要在摄像头前举起一张你的脸部照片,就能骗过该类系统——有人已经蒙骗过三星的脸部识别功能。
红外脸部识别功能安全很多。其运行方式如下(以高通的深度感应摄像头系统 Spectra 为例):Spectra 系统中的一个模块会对物体发出红外点,以便根据那些点的大小和扭曲度来收集物体深度方面的信息。如果那些点比较小,那该物体就是在离得较远的地方;如果它们比较大,那物体就是比较近。接着,成像系统会将模式拼合成你的脸部的精细 3D 图像,进而在解锁智能手机之前判断你是否是它的主人。
有了 3D 信息,无论是在美图,还是在人脸修复方面,都可以实现更多的功能。比如现在图像软件中的 AR 特效,往往眼镜、表情等叠加的信息是与人脸错位的,就像是贴上去的一样,如果有 3D 深度信息,则可以更自然。
在人脸识别验证上,强弱光、角度和遮挡的影响,都会让识别的效果打折扣,而深度信息就能弱化这些问题,适应恶劣的光照,非常大的表情变化,以及非常大的姿态变化。
「人脸解锁的抗干扰能力较强,能够抵抗眼镜、小范围遮挡和角度变化以及较暗的光线等。而指纹解锁在戴手套或是手指出汗、潮湿的状态下则是完全失效的。」旷视科技告诉机器之心。由于人的头部形状非常独特,Face ID 出错的可能性只有百万分之一,大幅低于 Touch ID 的五万分之一。
2、未雨绸缪的布局。全球生物识别市场预计 2020 年将达 250 亿美元,其中目前增速最快的为人脸识别,在应用场景不断增加的情况下,人脸识别将是下一个消费终端创新的大方向。
从终端厂商来看,苹果、三星、华为、Facebook、谷歌的多项专利显示,各大终端巨头都在纷纷布局人脸识别技术。谷歌早在 2012 年久获得人脸识别解锁手机的专利,而苹果获得相应专利的时间为 2015 年。但苹果在手机端的布局最为明显,先后收购 PolarRose,PrimeSense,Perceptio,Faceshift,Emotient,Turi 等人脸识别相关技术公司。
2013 年,苹果收购 3D 传感技术公司 PrimeSense,这家公司因为给微软的 Kinect 提供了传感器而走红。业界也一致认为它的技术会应用到苹果自家硬件产品当中。
PrimeSense 主要提供传感器和中间件,可以让设备感知周边的三维环境,实现人机交互。而如果这种技术用于前置摄像头,可以为拍照、背景虚化、人脸识别、手势识别带来便利。它使用了结构光方案来获取深度信息,原理简单来说,就是向空间投影一定图案,传感器获取反射回来的图案,与原图进行对比就能生成深度图。
在专利方面,苹果在 15 年获得人脸识别解锁设备的专利,特意保护红外传感器的使用,符合人脸识别的需求。
苹果表示,会将人脸识别技术应用到 ApplePay 以及第三方应用中去。目前,支付宝、券商、银行为主的金融服务机构也已经从去年开始大量采用人脸识别开户、转账、付款等,以招商银行为例,人脸识别能够实现手机端超过 50 万的转账。
「苹果的技术肯定是特别成熟的,否则它不会用的。而且现在虽然看似只是用人脸解锁替代了登录,但在未来还将与手机支付等应用关联,这些都是与安全技术相关的。」赵京雷告诉机器之心。
红外线扫描技术也存在局限性。高通专业人士曾表示,你身上穿戴的东西,如帽子或者围巾,可能会让该摄像头系统无法正常运行。此外,专家称,红外光会被户外明亮的太阳光压过,因此脸部扫描系统在沙滩上可能没那么稳定。不过,专业人士仍然看好苹果这一举措。
「这个一个非常大的趋势。因为手机作为非常大的交互设备,目前正在向着更加智能化的方向在走。...... 这次 iphone8 在前置摄像头加入 3D Sensor 用于人脸解锁,我非常看好这个应用。」赵京雷告诉机器之心。因为这个应用代表了整个交互认证,从配合式认证向非配合式认证的迈进。以往的识别手段,不管是指纹、密码还是虹膜,都需要用户去配合进行,但人脸是非常自然的。
「现在苹果是在前置摄像头加入 3D 摄像头,后置摄像头也引入了双摄进行图像拍照的优化。在未来,后置摄像头也可能加入深度摄像头,类似 AR 将虚拟和现实的融合的技术,在手机端也可能会迎来快速发展。我们是比较看好的。」赵京雷进一步表示。「2018 年将会是智能手机摄像头技术取得巨大突破的一年。」高通产品经理菲利普 - 詹姆斯 · 雅各博维茨(Philip-James Jacobowitz)指出。
3、专用 AI 芯片。「看一眼」iPhone 10,瞬间解锁屏幕。目前,人脸解锁的速度已经可以达到毫秒级别,加上点亮屏幕和启动摄像头的时间。如此精准、高效的识别效果,离不开苹果 AI 专属芯片的功劳。
iPhone X 的「留海」里有许多传感器,用 3 万多个点,以 3D 形式识别用户面部,通过训练神经网络建模、识别人脸。无论是换发型、留胡子、戴帽子还是光线强弱不同,都不影响系统识别。苹果为此打造了 A11 Bionic 神经引擎。这个神经引擎使用双核设计,每秒运算 6000 亿次。面部数据都由 A11 引擎处理。为保证用户的隐私,苹果称所有相关的运算都将在本地运行,不会被上传到云端。
早在今年 5 月,彭博社援引消息人士的说法称,苹果正在开发一款专用于人工智能的芯片。苹果内部将这款芯片称作「苹果神经引擎」,将有助于优化苹果设备涉及人工智能的任务,例如面部识别和语音识别的处理。据称,苹果未来将把人工智能任务转移至专用芯片,从而延长电池续航时间。
这次推出的苹果 A11 内置了苹果自研的 GPU,可用于辅助人脸识别、语音识别等 AI 应用,比上代产品快了至少 30%。苹果 A11 芯片采用 6 核心设计,包括 4 个 Mistral 核心(4*2.5Ghz)和 2 个 Monsoon 核心,都具备独立寻址能力。iPhone 10 的续航时间也多出 2 小时(比较 7 系列手机)。
三、Animoji 和更有趣的 Siri
在这次发布会上,我们发现 Siri 更加多才多艺了,比如更自然的语音、实时翻译、更精准的预测。另外,Siri 借助机器学习,还能更了解用户的兴趣,可以据此推荐新闻、帮用户回复消息等。
另外,我们还看到人脸 3D 追踪系统的另一个有趣应用——动画形象的合成 Animoji。追踪面部超过 50 块肌肉,可以用人脸表情创造有趣的动画表情,还能录制成短视频。
在 iMessage 中,用户可以将自己的表情、口型事实地附加到卡通形象上去。接着,用户的卡通形象将作为动图参与到聊天中来。在 SnapChat 中,用户能够使用苹果的人工智能技术为自己「戴上面具」。此外,iPhone X 的后置竖排摄像头,也是为机器学习任务而设计。目前,该摄像头能够与机器学习技术合作,在按下快门之前实时地自动调参。
「AI 技术的大规模应用将带来两大赋能,一种是生产力的提升,一种是创造全新的交互方式。」商汤科技告诉机器之心。「视觉 AI 技术在手机中的应用,很大程度上将带来的是后者——交互方式的创新。例如解锁时,通过人脸解锁;拍照时,通过智能算法,来实现背景虚化、暗光增强等等;除上述场景外,AR 技术在手机上的应用,虚实结合,无论在娱乐、生活、办公等场景下,都将带来无限可能。」
本文为机器之心原创,转载请联系本公众号获得授权。
✄------------------------------------------------
加入机器之心(全职记者/实习生):hr@jiqizhixin.com
投稿或寻求报道:content@jiqizhixin.com
广告&商务合作:bd@jiqizhixin.com
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 奋力打开改革发展新天地 7907953
- 2 中国黄金原董事长家搜出大量黄金 7944888
- 3 保时捷断臂求生 7819820
- 4 “冷资源”里的“热经济” 7796094
- 5 女子过马路遭压路机辗压身亡 7645056
- 6 刘强东提前发年终奖 7549665
- 7 向佐红毯小牌大耍 7440813
- 8 喝水后有4种表现提示肾有问题 7351560
- 9 十来岁男孩尾随女孩进电梯脱裤子 7205626
- 10 飞机锁座越来越多 7175619