作者 | 夕颜
头图 | 下载于视觉中国
出品 | AI 科技大本营(ID:rgznai100)
早在2015年左右,直播和短视频的兴起渗透进普通人的日常生活,人们信息消费的内容已经开始从文字向语音、视频信息转变。而疫情期间全民“家里蹲”的窘境,让直播连麦、视频会议、在线教育、游戏直播、电商直播等实时音视频的需求瞬间爆发。
作为实时音视频应用的底层技术支撑,信息的传递也从IM(即时通讯,Instant Message)、传统的CDN流媒体分发,向着以实时音视频为主的RTC(实时通信,Real-Time Communication)转变。
RTC是一项发展十年有余的技术,如今因为疫情被推上风口,但现阶段主流的应用还是实时音视频。为了解RTC的发展现状与未来,本文将聚焦实时音视频,从业界巨头腾讯的音视频发家史出发,从中洞见国内RTC发展的脉络。
为了更好地了解RTC,我们先从它的概念说起。
RTC、IM、WebRTC、实时音视频有什么区别?
RTC意为实时通信,它已经有了许多比较成熟的技术和应用积累,大家也许并不陌生,但因为都涉及到“实时”两个字,还是有很多人会把IM、实时音视频、WebRTC等相近的概念混淆。RTC究竟与这些词汇有什么区别?首先,IM和RTC都是一套网络通信系统,其本质都是对信息进行转发。其最大的不同点,是对信息传递的时间规定。从场景上来说,即时通信包括文字聊天、语音消息发送、文件传输、音视频播放等,通俗的说,就像发短信;实时通信的场景包括语音、视频电话会议、网络电话等。通俗的说,就像打电话。另外,即时通信主要要求可靠,保障信息送达,而实时通信主要要求低时延和接通率。从技术环节上来说,即时通信主要包括信息发送和确认,而实时通信则的技术细节则包括采集、前处理、编码、服务端接入、转发、服务端接入、解码、播放和渲染。此外,两者的传输协议也不同,前者最常用的通信协议是TCP、UDP,后者则是视需求而定,RTP、UDP、TCP协议或者类TCP连接协议都有使用。RTC与WebRTC的概念最容易混淆,但实际上二者并不能划等号,WebRTC针对网页实时通信标准,只提供了基础的前端功能实现。简而言之,WebRTC仅是RTC技术栈中的几个小细分的技术组合。而RTC最常用的应用场景之一,就是实时音视频,像疫情期间大量爆发的视频会议,就是典型的实时音视频场景。了解了RTC的基本概念后,我们将通过剖析腾讯音视频的发展,以小见大,摸清国内RTC快速发展的背后逻辑。以腾讯为例,是因为这家公司不仅在音视频领域布局早,且如今在国内音视频产业占据了较大的市场份额。2020年IDC报告显示,腾讯云在中国音视频产业中的解决方案市场份额排第一,覆盖了国内90%的音视频用户,成为腾讯2B业务、向外输出能力和服务的“排头兵”。且随着最近腾讯云音视频在在基础网络层面推出“三合一”的RT-ONE™音视频通信基础网络的动作,RTC能力进一步得到整合。从腾讯音视频技术和业务演进历程,可以一定程度上折射出国内音视频的发展史。腾讯所谓的“三合一”RT-ONE™音视频通信基础网络,是指融合了自家积累多年的TRTC实时音视频通信网络、IM即时通信网络与CDN流媒体分发网络,其中TRTC网络主要承载腾讯的音视频实时通信业务, 可帮助用户快速搭建低延时的音视频互动解决方案,IM即时通信网络负责即时通信消息和业务信令,CDN则可应对海量大并发直播、点播内容分发。为什么在这个时间点推出“三网合一”,也是得益于疫情的契机。疫情期间,全民性的线上沟通交流需求让视频会议、电商直播互动、游戏连麦等实时音视频应用爆发,在技术层面上其实既需要有高并发、大带宽的CDN的流量分发,也需要高实时互动的音视频通信,更需要IM信令和通信服务的能力,这3个需求并发,为云厂商提出了新的挑战。早在实时音视频领域有所布局的腾讯把积累的三张网融合在一起,复用底层技术,共建技术能力。举个例子,微信视频号的直播功能上线,准备时间其实只有一个多月的时间,这虽然让人难以相信,但确实是因为复用了腾讯云的TRTC和直播CDN,才会在短时间内完成部署上线。可以看到,腾讯此次“三网合一”,最大的意义就在于把其TRTC、IM和CDN的能力集中打包给客户,让用户不用在需要建设自己的RTC能力时,再花力气和资源分别对接三种不同的厂商,一站式把这三种能力都带给用户。这让腾讯成为业界唯一一家同时具备实时通信网络、即时通信网络和流媒体分发网络于一体的云厂商,可以预见,其他厂商要想在竞争激烈的RTC市场占据优势,势必也要模仿腾讯,最终整个RTC领域都将从“内卷”中获益。在腾讯音视频21年的发展历程中,正是因为抓住了几次发展机遇,才能水到渠成地成为音视频领域巨头。第一个阶段在2015年之前,那时QQ后台部门(当时叫做即时通讯平台部)为了支撑QQ的海量并发和全球互联,其实已经具备了双向视频通话的能力,积累了音视频通信的技术栈。反观这个阶段,人们的内容消费还主要是以文字和图片为主,在这些场景下主要关注的是图片加载的时延。而稍微先进一些的具有音视频通话能力的应用在市场上虽然也有一些,如移动视频社交应用陌陌等基于SIP或WebRTC的音视频通话软件,但QQ、微信的视频通话,在国内音视频市场中仍然占大头。到第二个发展阶段(2015-2020年),腾讯开始做能力开放,基于腾讯云品牌对外开放视频相关能力服务。再到2016年,国内迎来了直播风口,腾讯抓住了直播CDN高速发展的红利,特别是游戏直播。再到2017-2018年,以快手、都与、B站为标志,短视频也迎来爆发期,腾讯又及时抓住了CDN流媒体短视频的红利。前后两波红利使得腾讯的CDN流媒体分发网络快速发展,成为中国最大的CDN服务商之一。自此之后,音视频基本上已经从泛娱乐渗透进各个垂直行业,人们内容消费的习惯的改变,让音视频成为各行各业的基础设施。这个阶段,RTC技术的进展支撑了直播和短视频的爆发,反过来也让RTC技术和应用获得了珍贵的发展机遇。这时候,人们主要关注的是视频的播放是否流畅,而基于WebRTC的低时延视频系统不断优化,甚至出现了支持8K全景的直播产品,如阿里视频云在2018年云栖大会上展示的全球首个8K互联网直播解决方案,超高清视频标准体系建设越来越完善,低延迟、高清的实时互动交流体验已经完全不是问题。2021年之后,腾讯音视频进入了第三个发展阶段,也就是在疫情催化下的线上需求的爆发,腾讯云再次抓住了在线教育、娱乐、金融和电商直播等在线服务的红利,迅速覆盖主流市场。三次实时音视频的历史发展机遇,腾讯都接住了,自然而然跻身国内RTC头部企业。距离我们最忌一次的新冠疫情把RTC推向了风口,几乎所有人都认为这将是一个潜力巨大的发展领域。腾讯也是如此,在此期间,腾讯发现了互联网对于IM和实时音视频的需求量意外地巨大,TRTC的用户体量和IM的客户数呈井喷式爆发,他们认为,相信未来两到三年,TRTC个IM这两张网一定会发展成与CDN同等体量和同等技术规模的网络,而在公有云能力和底层设施之间进行大通和共建大有可为,这次机会将是实时音视频发展的一次重大历史机遇和转折点。据腾讯预估,音视频直播、实时音视频这两个实时相关的领域今年的全球市场规模将达到50亿元,RTC多人互动实时音视频领域虽然现在的体量还较小,但预估今年市场空间将达到15-20亿,未来几年年复合增长率将保持在30%-40%。整个行业和全球资本对于实时音视频都非常看好,究其根本就在于资本认为实时音视频将和5G、云计算一样,成为未来的核心基础设施之一。再者,除了互联网,大量传统行业进行数字化转型,音视频通信的需求量必然不会小。以实时音视频为代表的RTC已经在风口上随时起飞这一点毋庸置疑。那么未来,实时音视频未来有哪些发展趋势和方向值得业界格外注意呢?腾讯云副总裁李郁韬给出了自己的预判。他认为,安全将是实时音视频未来需要重点关注的方向,也即机遇所在。不同于直播,实时音视频的通信安全非常重要,对于隐私的诉求较高,端到端加密,自定义秘钥等加密技术都是未来相关厂商需要提供的能力保障。另一方面,未来在音视频的服务中,大家关注的指标无非是时延、成本、卡顿率、质量指标,用一套服务就能够把这些需求全部满足是用户希望看到的。腾讯未来可能会进一步发布一些云端或终端的产品,其实都是往这个思路上走。多样性协议以及不同场景解决方案的组合,也是腾讯未来真正的着力点。之前做直播,主流的协议适配主要是上行协议RTMP,下行协议FLV,而现在很多上行也开始使用类RTP的协议,或者UDP之上的协议来解决弱网的问题。随着腾讯云3张网打通,在上行部分,腾讯云计划逐渐构建比较完善的SRT协议,QUIC后续也会支持。下行也是类似的思路,所有的协议都会平行支持,包括基于WebRTC CDN推出快直播,基于QUIC CDN推出点播加速的CDN产品。本文以腾讯云音视频的发展历程为例,展示了国内实时音视频发展的现状与未来,数字和成熟的应用案例都说明,以实时音视频为主要应用场景的RTC正遇历史机遇期,谁能抓住这波红利,在RTC竞争中杀出重围,时间会给出答案。关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/