“我让 AI 来处理我 24 小时的音频信息——这会是未来吗?”

百家 作者:AI100 2022-11-23 20:06:08
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)

这几年 AI 发展和进化的速度,几乎可以用三个字来形容:杀疯了。

AI 下棋、AI 编程、AI 作画、AI 写小说、AI 预测蛋白质结构……当 AI 逐渐融入我们的生活,你是否设想过,我们的未来会如何发展?会像许多科幻电影和赛博朋克类小说中说的那样,让 AI 管理和安排我们的日常?

正如未来学家尼葛洛庞帝所说,“预测未来的最好方法,就是去创造未来”,最近国外一位小哥 RoberDam 便提前“体验”了一把他眼中的未来:“我 24 小时都用音频记录自己,然后用 AI 来处理这些信息——这会是未来吗?”


恰好出现的 Whisper


说来有些好笑,RoberDam 会对这个测试提起兴趣的原因之一,是 1TB 内存手机的出现:“迄今为止已经有多种型号的智能手机都具有 1TB 的内存,这能干什么呢?能全天候地记录自己的音频!”

恰好今年 9 月底,OpenAI 又发布了一个名为 Whisper 的语言 AI 模型,并声称它在英语语音识别方面的准确性已接近人类水平——RoberDam 灵光一闪,齐活儿!

“当然,这只是一个预测未来的实验,就是想看看什么可能、什么不可能。”

首先,RoberDam 买了几个麦克风带在身上,整天开着,记录他一天说的话。计划当一天结束后,他就把这些音频交由 OpenAI 的 Whisper 处理,转化为文本文件,从中提取信息。

不过,毕竟每天说的话太多,RoberDam 认为还是有必要画个重点的。因此,他创建了一个初级的“数字助理”程序,将一些重要信息通过关键词“Robert”和“End Robert”主动让其捕捉:“每次我说出‘Robert’这个词时,表明我之后所说的一切都是我对助手的命令,直到我再次说‘End Robert’,意味着命令结束。”

举两个例子:

  • 想让“数字助理”记录当天的体重,RoberDam 只需大声说:“Robert WEIGHT 60.1 end Robert。”

  • 想让“数字助理”记录当天的睡眠时间,RoberDam 也只需说:“Robert SLEEP 7 hours 14 minutes end Robert。”

等一天结束,Whisper 将当天的音频处理并转换为文本后,“数字助理”程序就会负责搜索命令的文本并提取关键词之间的所有内容。


足以确保 100% 的隐私,还等同于“模拟 API”


说到这里,可能有些人会觉得,何必如此麻烦搞个“数字助理”,直接用 Google 的“OK GOOGLE”和苹果的“Siri”不香吗?

以“OK GOOGLE”为例,RoberDam 总结了三点局限:

  • 命令受限:不够了解“OK Google”可以交互式地做什么,对它的一些命令只会作为 Google 搜索返回。

  • 不够隐私:你对“OK Google”说的命令和完整音频文件都会一起保存在 Google 中,搜索历史记录就能查到。你不仅能听到自己的声音,旁边人的对话可能也会被录进去。

  • 同步处理:当你向 Google 发送命令时,通常会有几秒的延迟,可能用于搜索也可能在辨别你的命令,而这会分散你的注意力,让你关注它的反馈,有时候这比你直接手动操作还慢。

基于这三点,RoberDam 自己创建的“数字助理”就很好地解决了这些问题:

  • 命令受限:命令由 RoberDam 自己决定,他知道“数字助理”能处理什么。

  • 不够隐私:所有音频只有 RoberDam 一人拥有,确保 100% 隐私。

  • 同步处理:它是异步处理的,所以 RoberDam 不用费心盯着它有没有及时响应,想到了就说出命令,一天结束后它会自己处理。

另外值得一提的是,这个“数字助理”某种程度上来说等同于一个“模拟 API”——一些电子设备原本只能与手机连接,但现在 RoberDam 通过将音频交由“数字助理”处理,间接实现了多个设备之间的通信。


目前还存在一些弊端


总之,某一天 RoberDam 终于克服了羞耻心,时不时就对着麦克风喊着:“Robert……end Robert”,最终他明确向“数字助理”说的所有信息都可以集中在日常控制面板中:

不仅如此,RoberDam 表示,为了进一步了解当天的日程,还可以创建“我的日记”以生成当天所做事情的摘要:

不过,RoberDam 也承认,这种 AI 处理方式还存在一些弊端。例如:现阶段的“数字助理”并不会提醒他当天必须要做的事情;由于是异步处理的,只有到晚上才知道那些命令有没有被成功处理;还有在别人眼里,他的“自言自语”可能有点奇怪。

除了 RoberDam 主动要求“数字助理”处理的信息,他日常被麦克风记录下来的其他音频也有作用。以下是他目前正在进行的尝试:

  • 关系温度计

根据对夫妻关系的研究,通过研究夫妻对话,特别有关夫妻之间积极和消极互动,可以以高达 90% 的准确率预测夫妻是否要离婚:https://www.gottman.com/blog/the-magic-relationship-ratio-according-science/

  • 情绪分析

尝试按小时进行情绪分析,以便能够确定白天产生最大压力、放松、快乐和悲伤的情况。

  • 全面回顾

等于一个搜索引擎,可以完整回顾他对某个话题的确切看法。

对于 RoberDam 以上的研究,许多网友表示新奇和肯定:

  • 一般来说,我们不希望被别人监视,但我们自己活动的管理记录可能非常有价值。

  • “好主意,以后可以搜索日志以供参考,因为它都是文本。”

那么,你认为这种形式会是 AI 发展的未来吗?

参考链接:

  • https://roberdam.com/en/wisper.html

  • https://news.ycombinator.com/item?id=33608437

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接