下个世代的语音助手应该是什么样子的?

百家 作者:最美应用 2019-05-08 12:30:52

Google Assistant:嘿 Siri,我成精啦!

Siri:没有从网络上找到关于“我成精啦”的信息。

北京时间凌晨 1 点,2019 年 Google I/O 开发者大会拉开了帷幕,主要介绍了谷歌在软件方面的一些进展,也有少量的硬件信息,下个月的苹果 WWDC 也是类似的。

熬夜看完,信息量有点多,大体上包括:

• 更加实用的 AR 功能;

• 适用于网页端的 Duplex;

• 下个世代的语音助手(最大亮点);

• 更全面的隐私保护;

• 针对特殊人群的辅助功能;

• 一些关于 Android Q 的新亮点;

• 可以体验 Android Q 测试版的机型;

• 还有硬件。


其实看起来和今年苹果的春季发布会一样,大多内容在国内是无法体验到...不过仍然有很多需要关注的,毕竟要跟上时代嘛~

可以看到,这次的 Google I/O 大会,重点依然是在科技的可用性和实用性上,谷歌的目标也一直都是这个,而且看完后,我像往常一样期待着谷歌的回归...

对于上面提到的这些开发者大会的内容,我们还是详细地来介绍一下吧:


AR

Google Search

1. 在 Google Search 结果页中可以展示 3D 模型;

2. 3D 模型可以进行拖动、旋转、动态演示等操作;

3. 3D 模型可以通过 AR 展示在摄像头前的现实场景中,可以用这些模型来研究医学问题、搭配衣服、参观景物等;

虽然看起来好像与以往的 AR 区别不大,不过重点是 Google 为了在搜索结果中呈现更多的 3D 模型,正在积极地与 NASA、New Balance、Samsung、Target、Visible Body、Volvo、Wayfair 等知名机构或者企业展开合作。

除此之外,Google Search 还会增加一系列丰富的搜索内容,比如播客;这应该是一次搜索引擎内容上的跨越,国内某搜索引擎可能短时间内跟不上了。


Google Lens

2017 年发布的 Google Lens(一款智能识别内容,查找相应信息的程序) 这次也有了极其实用的功能升级。

1. 餐厅菜单扫描,自动识别推荐菜品,并且可以点击查看用户评价;(国内是不是可以接入大众点评?)

2. 账单识别,识别账单上的金额,还可以实时计算需要付的小费数目,应该也能更方便地 AA;

3. 部分合作的杂志内容,可以通过 Google Lens 扫描指定内容获得动态的画面,比如菜品的制作过程。

4. 对镜头内的文字内容进行实时翻译并覆盖在画面中,并且可以朗读;(应该就是谷歌翻译)

另外,Google Lens 现在支持在 Assistant、相册和相机里使用,可以开发的空间还有很多,后续应该会有更新的。


Google Assistant

谷歌的语音助手,本身就已经是最先进的手机语音助手之一,这次 I/O 大会之后真的可以算是修炼成精了。


网页端 Duplex

Duplex 本身是 Google 的一项 AI 技术,它被用在 Google Assistant 中,可以实现智能的自动化操作,相当于语音版的 workflow 或者捷径,比如它可以根据你的订餐指令,模拟人声帮你打电话完成预定餐厅,登记个人信息等操作,非常的强大。

这次登录了网页端,Chrome 用户应该能第一时间体验到这个强大的功能了(还是要科学上网),通过浏览器就可以完成各种自动化操作,很期待。


Google Assistant 升级

本次大会的最大亮点就是这个全新的 Google Assistant,完全改观了以往的语音助手体验,总结起来就是一个字:快,非常快!

1. 将语音识别的数据量从 100G 压缩到 0.5G,可以极快的完成高质量的语音识别,同时也支持不联网的本地语音操作;

2. 一次唤醒,后续操作不需要重复唤醒,可以实时处理用户请求;

3. 支持连续操作,可以一口气通过 Google Assistant 完成各种各样的命令;

4. 可以实现在多个应用中的操作,比如把相册里的图通过短信发送给别人;

<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_800423937275494400" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPoQ2wIvCwdFyG8ErhZ0Yxuh66OzRbHh1UJiakOTvZBnLqEC6qUHFf21xM5luykf43RpJqEOWcGxkPyPI6nzI8pA%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7916666666666667" data-w="1290" data-src="http://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&auto=0&vid=wxv_800423937275494400" width="352" height="198" data-vh="198" data-vw="352" style="display: none; width: 352px !important; height: 198px !important;"></iframe>

(看这个视频感觉更直观)

5. 个人偏好内容,Google Assistant 可以根据用户的个人信息,来帮你完成一系列操作,比如问「我娘家那边这周末天气怎么样?」或者「给我看我的大学毕业照片」等。

6. 还有基于 Assistant 的驾驶模式,更加智能,可以告诉你距离目的地的时间,给你推荐可以联系的人,或者可以听的音乐等。

好像可以说的东西也不很多,但其实升级实现的功能真的非常非常令人受用,Google 自己也称做是「Next gen Assistant」,下个世代的语音助手,可见其重要性。

又是本地语音,又是跨应用操作的,好像就差大爆炸和闪念胶囊了


隐私

可能是由于近几年隐私问题比较严重吧,Google 和苹果春季发布会一样,也再一次强调了对隐私信息的重视程度。

1. Google 将支持用户定期删除隐私记录

2. 在 Chrome 浏览器、Google 搜索、Google Assistant 语音助手、YouTube、新闻和地图等应用中会有更全面和细致的隐私保护和控制选项。

3. 而且除 Chrome 以外,YouTube 和地图也将支持匿名(无痕)模式。


辅助功能

同样是本次 Google I/O 的一大亮点,针对特定人群的辅助功能让大会又进入了一波高潮。


Live Transcribe 实时翻译

1. 针对经常外出的人士设计,可以即时将他人的发言识别并翻译成指定语言,方便理解和沟通;

2. 目前已经支持 70 种语言和方言;

除了正常使用,Google 同样关注残障人士的生活体验,这两项重要的辅助功能可以给他们提供极大的便利:

Live Caption 全局实时字幕

顾名思义,就是一项在设备上做到实时字幕的功能,YouTube 其实之前就有这项功能的雏形,这次更加完善。

在支持此功能的设备上,本地视频、Instagram、YouTube 都可以实现实时字幕转换,可以为听觉不佳的用户提供帮助,当然也可以在正常情况下使用。


Live Relay 无需开口打电话

利用这个功能,说话不便和听觉不佳的用户都可以实现和他人打电话交流,对方的话可以实时转换为文字显示,你可以通过打字将内容转换为语音,实时地向对方表达。


Android Q

虽然是今天才正式发布的,但其实年初 1 月份就已经有内测版本的详细信息泄露了,所以本次大会上公布的信息亮点并不多。

1. 原生支持折叠屏手机,有专门为折叠屏设计的多任务和应用切换模式;

2. 系统底层支持 5G(好像是国内厂商超前了);

3. Dark Mode 深色模式

4. On-Device 机器学习,Live Caption 等功能的技术支持,可以离线使用;

5. 智能回复,针对短信的功能,可以识别时间和地址等信息(好像还是国内厂商超前了);

6. Focus Mode 专注模式,让用户可以专心使用某几个 App,也是为了在休息模式(让用户远离手机的功能)下可以保证必要工作。

7. 隐私相关,系统增加了更严格和精细的权限控制,防止 App 滥用权限和用户信息;

8. Android Q 尝鲜版率先支持 21 款设备,除了谷歌自家的 6 款 Pixel 手机外,有:

· Asus ZenFone 5Z

· Essential PH-1

· HMD Global Nokia 8.1

· LG G8 ThinQ

· Realme 3 Pro

· Sony Xperia XZ3

· Tecno Spark 3Pro

· Huawei Mate 20 Pro

· OnePlus 6T

· OPPO Reno

· vivo X27、vivo NEX S、vivo NEX A

· Xiaomi Mi Mix 3 5G、Xiaomi Mi 9

另外据一加手机官方消息,一加即将发布的 OnePlus 7 也可以体验到 Android Q 尝鲜版。


 关注「最美应用」,后台回复「ANQ」

 获取部分机型 Android Q 尝鲜版下载地址 


最美尾巴

整体看下来,Google I/O 2019 的主要关注点无疑是 AI,Google 凭借着自身的技术能力和影响力,不仅做到了更好的将科技和生活结合,也让越来越多的人关注到多样的群体。

并且谷歌也一直在努力实现着自己的目标:

Building a more helpful Google for everyone.


小美说 

想 Google

想 Google

想 Google




延展阅读

关注知群增长共创社(微信号:zhiqunzz

回复「chw」,获取报告下载地址


想 Google 的  ↓↓↓

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接