揭秘奥运赛场上的语音技术 | AICon

百家 作者:InfoQ 2021-08-20 19:51:42

运动员在不断打破记录的同时,其实离不开新科技的助力。印象最深的是游泳运动员身穿的仿生鲨鱼皮泳衣,在游泳的过程中,可以让水流更加顺畅的从运动员身体的各个部位划过。

除此之外,今年东奥会上也出来现了很多新科技应用场景,有点像科技“秀场”。

这里选取语音技术来展开,例如科大讯飞在开放创新平台基础上,建成了一套具有奥运特征的多语种智能语音和语言关键技术服务平台,为中国奥运代表团提供了“语音转写”和“机器翻译”两项技术类别的支持,方便大家在会场上和不同国家的运动员交流,也便于识别不同语言文字的意思。

另外,像语音合成技术也得到了广泛应用,此次奥运会期间,基于百度大脑领先的语音技术,央视体育客户端集成了百度智能云语音合成服务,该能力采用了百度大脑自主研发的并行 WaveRNN 合成技术,合成后的语音高度拟人,情感和韵律表现力大幅提升,当夺冠后及时播报,让用户享受到真人播报般的体验。

WaveRNN 合成技术,以发音片段为基本合成单元,多个发音片段并行合成,每个片段内部以自回归的方式串行合成。同时,为了保证发音片段之间 WaveRNN 隐状态的连续性,使用隐状态预测网络为每个发音片段提供初始隐状态,有效解决了并行合成带来的 WaveRNN 隐状态中断问题,保证了并行合成的高质量。

其实,大家常听到的很多磁性男声、甜美女声、可爱童声等风格多样的语音播报,基本上都是合成的声音。除了上面所说的这些技术之外,其实背后还有更深入的研究。将于 11 月 5-6 日,在北京国际会议中心举办的 AICon 人工智能大会上,就邀请了百度语音首席架构师贾磊博士分享《百度语音最新技术进展:端侧全双工语音交互及其芯片 IP 化》,他会来分享端侧全双工语音交互及其芯片 IP 化的话题。

  • 你将获得:

了解到最新的百度语音交互技术和百度语音的相关产品落地
了解到最前沿的跨学科的端到端深度学习建模技术
了解到 5G 时代的最新 AI 语音芯片的发展趋势和技术思路

语音交互系统的核心技术是云端自然语言处理技术,而科大讯飞在这方面拥有丰富的经验积累,本次 AICon 人工智能会议上,科大讯飞北京研究院院长王士进博士将来分享《科大讯飞自然语言处理技术进展及应用实践》话题。

  • 你将获得:

了解自然语言处理技术框架
了解科大讯飞认知智能国家重点实验室在自然语言处理技术上的最新进展和应用实践
了解自然语言处理技术面临的挑战和未来发展趋势

初次之外,本次大会还设置了 NLP 技术与应用、人工智能前沿技术、通用机器学习技术、计算机视觉实践、推荐广告技术与实践、AI 工程师团队建设与管理、认知智能的前沿探索、AI 与产业互联网结合、大数据计算和分析、大规模机器学习算法及应用、智能语音前沿技术应用、大规模预训练模型进展、自动驾驶技术等 14 个专题。

目前大会门票限时 8 折特惠中,购票欢迎联系票务小姐姐文柳:13269078023(电话同微信),点击底部 【阅读原文】 了解更多大会信息。

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接