科大讯飞「听见 M1」转写机器人测评

百家 作者:威锋网 2018-11-02 13:13:25



速记行业第二春。

在如今的信息时代,人们的工作生活节奏越来越快,以前我们从报纸上看到一篇文章,或许是昨天,甚至是前天的新闻。现在我们看到的新闻,也许 3 分钟前刚刚发生。这个过程中,很多传统领域的工作效率似乎跟不上时代的步伐了。


以新闻产生过程中的速记为例,以前我们面对新闻录音文件,一般就是拿录音笔录下来,回到公司拷到电脑上,然后慢慢听取回放,再整理成文字。为了校对往往需要根据录音来回听 2-3 遍,这个工作过程中不但要求手头必须有电脑,还得有一个专人放下手头的活去专门干这件事,亦或是交给速记公司去处理。

 

如果说国内有哪家企业能够让传统速记行业焕发新生,科大讯飞最应该被人提及。从智能语音技术起步,开发智能语音平台,建立中文语音交互技术标准,这家专攻“语音”的科技企业,在人工智能领域逐渐成为领军者。

 

伴随在消费端的产品持续输出,讯飞语音输入法、讯飞翻译机等产品的面世让更多人看到了中国科技企业在人工智能领域的跃进。这次我们拿到了一款人工智能与语音识别技术相结合的硬件产品:「讯飞听见 M1 转写机器人」

智能速记产品走向台前,真正的短板在哪里?


事实上,智能速记产品真正的短板并不在语音识别本身。如今许多速记公司为了增加效率,降低成本,也开始将现场记录下来的高保真录音通过讯飞、百度等在线语音识别平台转成文字记录,再通过真人校对完善记录准确率。在这个过程中,与智能速记产品直接进行PK 的是传统高保真录音笔,而非智能语音识别这个功能了。

 

科大讯飞一直在寻求能够改进行业痛点的解决方案,所以我们在讯飞听见M1这款产品上面看到了普通录音笔无法实现的几个亮点功能:

 

  • 首先是 7+1 环形麦克风阵列,360° 全向型自动声源定位,能够轻松拾取 10 米以内有效声音,实现高品质录音;

  • 在这背后作为支撑的是一块 24bit 高精度的拾音芯片,能够通过对环境、室内混响、方向性噪声的抑制,来提升拾音效果,进行无损录音;

  • 光有硬件自然不够,科大讯飞为这款产品深度定制了拾音算法,深度定制的波束形成,搭载了 Dereverberation 去混响技术,结合语义分析等算法之后,转文字准确率相对以往提升了30% 之多。


 

以上这些功能才是真正为讯飞听见 M1 带来行业竞争力的特点。当然,其他诸如PCM 无损录音,Wi-Fi/USB 双传输等传统录音笔上的功能一个也没落下,毕竟,这些作为一款录音设备的基本配置,讯飞没理由不做好。

 

所以我们的测试重点,是讯飞听见 M1 能否通过麦克风阵列,拾音功能来解决嘈杂、广阔、远距的环境下,普通的录音笔面临的录音声音小、噪声大等问题。同时看看配套的App 与在线编辑、分享导出文稿等功能是否能进行更快速,更有效的速记功能。

 

 

迥然不同的造型设计,用意原是核心卖点

 

值得一提的是讯飞听见M1 的造型,与传统录音设备完全不同,其设计为一个圆饼型装置,白色简约的外观相比以往长条灰黑的录音笔来说更为时尚亮眼。这样设计的原因主要也是因为其配备的7+1 麦克风阵列技术能够保证 360° 全方位收音,我们可以看到它周围排列着 7 个小孔,同时中间也有 1 个小孔,这就是 7+1 麦克风阵列技术,能够有效辨别不同方位的声音并不会搞混。侧边还有两个小孔则是支持用户装上挂绳,在复杂的情况下挂在脖子上或者挂在手上都不会丢失。 

 

 

相比传统录音笔众多的操作按键,讯飞听见 M1 只有两个按键(录音键+Wi-Fi 键)、三个指示灯(录音指示灯+Wi-Fi 指示灯和电源灯)以及 1 个 Type-C 的充电/数据接口。

 

这样的设计能够让更多的用户可以轻松上手,毕竟以前速记过程中最麻烦的还要指导一下现场人员如何操作录音笔,有时候指导不详细或对方没理解,可能发生没有录音的严重失误,讯飞 M1 可以说完全可以避免了这样的错误发生。

 

讯飞听见 M1 拥有 2900mAh 的大容量电池,在充满电的情况下可以连续录音 10 小时左右。更让人惊喜的是其搭载的 Type-C 数据接口充电 10 分钟就能够录音 1 个小时,同时也支持边充电边录音,可以说完全杜绝了内置锂电池产品「没电怎么办」的情况。


讯飞听见M1产品参数

 

 

测试结果令人惊喜,基本跑赢 95% 准确率基准

 

在测试之前,我们先来说说讯飞听见 M1 与传统录音笔截然不同的方面,那就是 Wi-Fi连接与配套 App。相比于传统录音笔只能连接到电脑上来操作,讯飞听见M1 可以直接通过 Wi-Fi 与手机连接,在讯飞听见的 App 上可以直接显示讯飞听见 M1 的电量和存储空间,其内置的 16GB 容量事实上能够录制长达 72 小时的音频,几乎不存在一次会议不够用的状况。

 

 

而在手机上,我们就可以直接导入音频,随后可以可执行重命名、删除、播放、转文字等操作,其支持从讯飞听见 M1 传输到手机内,随后可以实时转换为文字,并可进行在线编辑,编辑校对后可立即导出文档分享。相比以前必须携带一台电脑与录音笔协同办公来说,效率的提升可谓立竿见影。

 

另外,用户还能对讯飞听见 M1 设置数据加密,防止别有用心的用户偷偷连接到设备之后操作数据。在信息安全形势日益严峻的今天,网络攻击、勒索病毒、黑客窃取等手段司空见惯,保护隐私尤为重要。在推进人工智能向前发展的同时,科大讯飞对大数据及其商用产品的安全保护所做的努力可圈可点。重视数据安全和隐私保护,是一家科技企业的基本义务,也是职责所在。

 

但我们最为关心的其实还是 7+1 的麦克风阵列对音频的收录与随后的转写准确率到底如何?

 

我们将讯飞听见 M1 的在线转写,录音笔分别进行了对比测试,分别在 5 个不同面积的场景下进行不同人数的测试,随后测试结果令我们非常惊喜:

 

  • 高保真录音的在线转写功能准确率相比手机与录音笔,提升将近 4%;

  • 在任何场合下转写准确率已经超过了 95%这一基准线,可以说用户只需在转写之后简单校对一遍,甚至不校对也不会影响后续使用。

转写准确率测试

 

随后我们对讯飞听见 M1 进行了极限对比测试,通过在安静办公室与嘈杂环境的星巴克进行对比,来测试 7+1 麦克风阵列的实际应用效果,其结果也令我们满意:

 

  • 安静的办公室内,单人说话识别准确率达到了 98%左右;

  • 嘈杂的星巴克内,两人说话识别准确率达到了95% 左右;

  • 7+1 麦克风阵列保证了安静环境 98%,嘈杂环境 95%,这已经是一个非常了不得的数据了。


场景极限测试

 

 

技术的背后是人工智能学习,学习的本质是大数据

 

人工智能的本质是什么?学习。可是如果没有样本,又如何学习?如何改进?样本大数据又从何而来?

 

科大讯飞深谙云平台的重要性,早在 2010 年便上线了讯飞开放平台,以云服务的方式提供 AI 语音、AI 视觉、AI 认知、AI 人机等人工智能交互技术和垂直应用场景解决方案。到目前为止,讯飞开放平台的开发者数量有 80 万左右,覆盖了 19 亿终端设备,日均服务次数达 46 亿次,日均音频转写达到了 8000+小时,月均音频转写达到了 20 万+小时,平均每分钟要处理撰写6.29 条音频。

 

如此海量的数据提供了几乎囊括各行各业的样本数据,讯飞在帮助用户人工纠错的同时,事实上也在对人工智能进行同步纠错与升级,这才有了较高水准的中文智能语音及语言技术。讯飞听见 M1 的方方面面无不代表了新兴科技时代的智慧结晶。

讯飞听见 M1 官方售价1299 元,眼下正好赶上双十一活动,活动预售价格为 1099 元,而购机还赠送 990 元的在线语音转文字服务,对于商务用户来说是不错的产品体验时机。如果你想体验上述种种比传统录音更智能、快捷、多场合的录音转写功能,不妨考虑这款集人工智能、阵列拾音、无线连接 App 等优点于一身的优雅“小圆饼”。

 


更多相关内容


你需要了解的iPhone Xs/Xs Max双卡功能详情

全面屏+A12X+面容ID 史上最强的iPad Pro发布 

更小、更快、更全面 全新MacBook Air 发布

精彩组团为你呈现


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接