《视频直播技术详解》系列之二:处理
视频或者音频完成采集之后得到原始数据,为了增强一些现场效果或者加上一些额外的效果,我们一般会在将其编码压缩前进行处理,比如打上时间戳或者公司 Logo 的水印,祛斑美颜和声音混淆等处理。在主播和观众连麦场景中,主播需要和某个或者多个观众进行对话,并将对话结果实时分享给其他所有观众,连麦的处理也有部分工作在推流端完成。
开放式设计 
Android SDK 地址:https://github.com/pili-engineering/PLDroidMediaStreaming
常见视频处理功能
- -(void)setBeautifyModeOn:(BOOL)beautifyModeOn;
- -(void)setBeautify:(CGFloat)beautify;
- -(void)setWhiten:(CGFloat)whiten;
- -(void)setRedden:(CGFloat)redden;
- -(void)setWaterMarkWithImage:(UIImage *)wateMarkImage position:(CGPoint)position;
- -(void)clearWaterMark;
连麦是互动直播中常见的需求,其流程如上图所示。主播和部分观众之间可以进行实时互动,然后将互动结果实时播放给其他观众观看。
基于以上业务需求,我们很容易想到基于单向直播原理,在主播端和连麦观众端进行双向推流和双向播流的方式互动,然后在服务端将两路推流合成一路推送给其他观众。但 RTMP 带来的延迟决定了这种方式无法做到用户可接受的互动直播。
实际上,互动直播的主要技术难点在于:
- 低延迟互动:保证主播和互动观众之间能够实时互动,两者之间就像电话沟通,因此必须保证两者能在秒级以内听到对方的声音,看到对方的视频;
- 音画同步:互动直播中对音画同步的需求和单向直播中类似,只不过互动直播中的延迟要求更高,必须保证在音视频秒级传输情况下的秒级同步。
- 音视频实时合成:其他观众需要实时观看到对话结果,因此需要在客户端或者服务端将画面和声音实时合成,然后以低成本高品质的方式传输观众端。
上图是一个基于 WebRTC 协议实现多方实时通讯的示意图,本地用户(主播)和远程用户(连麦观众)之间的连接通过 RTCPeerConnection API 管理,这个 API 包装了底层流管理和信令控制相关的细节。基于该方案可以轻松实现多人(14 人以下)的多方实时通信,如下图所示:
当然,在通信人数少的情况下,其复杂度相对简单,如 2 人情况下。但人数增多至 4 人之后,其可选的网络结构就增多了,如上图所示,可以每个点之间形成自组织网络的方式通信,也可以以 1 人为中心形成星型通信网络,还可以让大家都通过一个集中式的服务端进行通信。
作为一个高性能、可伸缩的直播基础服务提供商,七牛直播云经过评估选择了以主播为中心形成星形通信网络,支持主播和多个观众之间的互动质量。同时,为了保证合成后的音视频实时传输到其他观众端,这里采用经过改造的 UDP 协议传输:
- 通过 UDP 降低传输延迟。
- 在 UDP 之上进行传输控制,保证用户互动体验 QoS。
在下一篇连载中,我们将详细介绍编码和封装,敬请期待!
【没看过瘾?直接来上免费公开课】
为了让大家能够将技术理论快速应用到实践开发中,七牛云联合慕课网特别制作了一期课程,专门针对移动直播应用开发,供大家学习参考。
点击「阅读原文」学习《2 小时搞定移动直播 App 开发》
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 中法元首相会都江堰 7904367
- 2 中方不接受日方所谓交涉 已当场驳回 7808689
- 3 大闸蟹为何会在欧美泛滥成灾 7713651
- 4 国际机构看中国经济 关键词亮了 7616968
- 5 家长称婴儿被褥印不雅英文单词 7520520
- 6 日方军机滋扰擅闯或被视为训练靶标 7424419
- 7 罪犯被判死缓破口大骂被害人一家 7327791
- 8 国乒8比1击败日本队 11战全胜夺冠 7238010
- 9 男子欠近5000元房费 酒店倒贴都不搬 7135509
- 10 千吨级“巨无霸”就位 7044513







七牛云
