过去,语音识别这一技术被国外垄断,他们的中文语音识别技术一塌糊涂,但在国内没有好的竞品,以至于在中国横着走。调戏siri就是很多国人对语音交互的唯一理解。
科大讯飞通过这二十年的追赶,逐渐赶上了国外的脚步,在中文语音识别上独占鳌头,甚至在和国外语音识别系统对抗的过程中依然收获不菲。
讯飞听见仅仅在19年就斩获数十个奖项,在中文语音转文字这一领域抢到了领先的地位。
这种领先看起来可能不起眼,但科技的发展,总是由一些散碎的发明组合而成,这些散碎的发明单独很弱小,但组合起来,就将发挥出几何倍数的力量。
当语音交互只能用来当语音输入法打字的时候,恐怕大部分人不会意识到,它还可以成为一个优秀的即时转录、翻译软件用来文字创作。
当讯飞听见给春晚配字幕的时候,恐怕大部分人也意识不到,它将会成为听力障碍者的耳朵。
当会议结束就能用人工智能技术快速输出会议记录的时候,大部分人意识不到这种准确同步背后的技术积累。
小米一直致力于建立自己的AIOT体系,而这个AIOT体系最核心的关键,就是交互的入口,这个入口过去更多是通过手机,现在已经一定范围内转向了语音,未来,势必要彻底倒向语音。
在人机交互的这条路上,人类已经走过了一条很长的路,从打孔纸带,到键盘鼠标,再从键盘鼠标到触摸屏,语音交互,或许是下一个人机交互的入口,它将会彻底改变我们使用电子产品的方式。
而讯飞在语音上的投入,为我们抢下了人机交互时代的入场门票。
如果你问我讯飞是什么,我会告诉你,他们是一群妄人,因为他们试图重修禁忌的巴别塔。
神用语言割裂人,而人将用智慧打破语言的隔阂,重建那个通天的建筑。
这一次,我们不但要建起一个全人类能够自由交流的巴别塔,还要让这塔通到天上去,成为真正的通天塔,去连接我们未曾见过的世界,我们会让电脑听得懂人说话,将AI引入到我们的生活中。
这座通天塔的尽头会是什么?
也许不是天堂,而是更浩瀚更遥远的宇宙,是技术发展的无尽想象,是科学家们脑洞远方的神秘未知,是梦想者顽固的执着。
但这不重要,因为我们知道。
通天塔,就在那里。