Image

     疫情时代,这些基于实时音视频技术实现的应用场景,正在被快速地被挖掘出来。

来源 | 罗超频道

自2020年4月问世以来,实时语音社交平台Clubhouse的热度持续飙升,席卷欧美市场。1月25日,Clubhouse宣布完成1亿美元的B轮融资,估值达到10亿美元。

2月1日,马斯克在Clubhouse创建聊天室,知名风投机构Andreessen Horowitz(Clubhouse,以及与马斯克合作的多家初创公司的股东)等创投机构的嘉宾等也在房间内。

据媒体报道,该房间的人数突破5000人,打破Clubhouse以往的房间人数限制。数以百计的记者和YouTube直播员都加入了该房间。而Clubhouse背后的实时音频服务商为声网(API.US)。

1月28日,实时互动云服务商声网宣布收购即时通讯云和客服云服务商环信,交易预计在 2021 年第一季度完成。

Image

官网显示,环信定位“稳定、安全、可靠的通讯云和云客服服务商”,提供环信即时通讯云、环信客服云、音视频云、客服机器人、云呼叫中心等云服务,面向社交、教育、保险、电商、医疗、硬件、招聘、游戏娱乐等八大行业提供解决方案,覆盖近40余万开发者,服务近30万款APP,数万家企业的选择,客户名单中不乏自如、花椒直播、国美在线、新氧(SY.US)、拼多多(PDD.US)等知名公司,已获得红杉、经纬与SIG投资,是IM 领域的头部玩家。

Image

声网Agora则是全球实时互动云服务第一股,最新(2月2日)市值约70亿美元。2013年Webex创始工程师之一、前YY语音CTO赵斌率先看到实时互联网的巨大机会,创立了做实时音视频互动云服务的公司声网,开发者可基于其API快速创建视频社交、互动直播、在线课堂、游戏开黑、AR远程协作、远程车险、视频问诊等实时音视频互动应用。

声网是实时音视频互动云领域的领头羊,小米(01810.HK)、陌陌(MOMO.US)、新东方(EDU.US,09901.HK)等明星公司均是其客户。

Image

作为实时音视频(Real-time Communication, 简称RTC)的领头者,声网拿下IM云头部玩家环信,意欲何为?

01 疫情加速,音视频需求激增

疫情爆发后,人们见面变得更难,线上互动应用呈现出爆发式增长,在线教育、在线会议、互联网医疗、电商直播等行业扶摇直上。不仅原有的“在线”行业如沐春风,一些传统行业也在进化、蜕变,通过“云化”适应疫情下的“宅”时代。

来自艾媒咨询的数据显示,2020年在线教育迎来新转机,在“停课不停学”的政策扶持下,在线教育市场规模增速回暖,市场规模达到4858亿元,增速上升至20.2%。

不少教育机构纷纷投身线上,相继推出在线大班课、在线小班课、1v1课堂、双师课堂等在线教育产品或服务。教育机构的快速“在线化”转型,直接推动实时音视频需求大幅增长。

不仅如此,2020年在线会议、远程办公需求也迎来井喷式增长,包括Zoom、Google Meet、Telegram在内的全球主流在线会议产品都迎来下载高峰。

在全球市场,在线服务的概念向在线庭审、金融面签、在线招投标、云会展等多样的企业级应用场景延伸,用户对移动设备的依赖进一步增强,各类应用上线即时通讯和实时音视频功能,用户习惯加速养成,对互联网通讯的短期需求将有望演变为长期趋势。

Image

同时,后疫情时代,还催生出了让人意想不到的实时互动新场景。人们可以通过“线上自习室”,不用出门,打开摄像头,就可以云同桌们一起在线自习,互相监督;家长和老师可以通过智能作业灯远程给孩子布置作业,并进行辅导;“Watch Party”场景帮助人们实现了即使在异地,也可以和对的人一起在线上“边看剧边聊天”,这些基于实时音视频技术实现的场景,难以想象会这么快速地被挖掘出来。

02 直播爆发,实时互联网才是未来

不论是否有疫情,人们希望通过互联网跨越空间实时互动的诉求都一直存在,只是尚未被激发出来。

2019年我在《实时互联网,才是5G最被忽视的价值?》一文提出,5G基于强大的低延时、高带宽和大容量能力,让真实物理世界与在线虚拟世界更加紧密、实时和深刻地连接在一起,进一步模糊了“比特世界”和“原子世界”的边界,将让“实时互联网”时代真正来临。

曾几何时,互联网只是信息载体,图书、音乐、电影、新闻这些数据被“比特化”在互联网流转,互联网“缓存”世界不同的时间点。

4G移动互联网时代,互联网越来越接近这个真实世界,通过Timeline、信息流、视频流这些更加实时的方式复制世界到互联网。

5G时代,互联网则将全面进入“实时互联网”时代,无处不在的IoT、VR/AR设备会实时采集内容,网络上的内容就是世界此时此刻的真实映射。

不论是实时音视频,还是即时通讯,均是在解决人们线上互动的需求。

对于开发者来说,云服务商需要提供更加丰富而全面的能力,让其可以快速、便捷、低成本地构建任何想要的实时互动应用,让其用户可以获得所有丰富的互动体验,这个想象空间比今天的直播+行业要大得多。

企业与用户需要的不是传递信息的实时云通讯能力,而是线上实时互动,用声网创始人兼CEO赵斌的话说,线上实时互动让用户“共享情景”,将各种线下互动情景搬到线上,让其拥有与线下类似甚至是超越线下的体验。

传统在线教育可能更多是信息的单向传递,有了互动能力学生可以向老师提问,有了实时互动能力老师与学生共享情景,可以同处类似于VR教师的情景中,双方体验都会质变,在线教育会变为实时互动教育。

类似应用还有云游戏、云演唱会、云聚会、云球赛、云驾驶、云手术、云工业操作等等。实时互动会彻底改变人与人,人与世界的交互方式。

和千里之外的朋友云游戏开黑,一场对战之后还觉得不够过瘾,聊天室里走一波继续讨论“战术”,这或许就是RTC和IM 结合的体现。

这样再看,声网收购环信的举措就更容易理解,甚至可以认为,不收购环信,声网也一定会通过别的手段布局IM云,来补充自己的RTE版图。

03 加速布局,声网如何编织RTE版图?

虽然声网起家于实时音视频RTC领域且拥有行业公认的竞争力,但其在上市时就自称实时互动云服务商,而不是实时云通讯服务商。

2020年声网更是明确要做的是“Real-Time Engagement Platform-as-a-Service”,即实时互动云服务(RTE PaaS)。

Image

RTC和RTE有什么不同?RTC即是实时音视频技术。而RTE 是声网在上市F-1文件里首次提出的概念,可以简单粗暴的理解为“构建实时互动应用场景所需要用到的产品和技术组合”,除了核心的RTC之外,还包括信令、白板、录制、存储、IM等。背后的核心逻辑是,互动重要的是情景共享,而非单纯的信息交换。

在拿下环信前,声网就已四面出击,扩大自己的RTE版图。

首先是建立生态,通过合作伙伴来补充自己在RTC外的诸多能力。2019年声网聚焦在RTC技术上,针对客户RTC外的实时互动需求,声网发布了云市场,建立开发者生态,引入美颜、鉴黄、语音识别、互动白板等领域的上下游合作伙伴,一起给客户提供完整的实时互动能力。

其次是投资并购,直接拿下核心的实时互动能力服务商,进行深度整合。2020年上市后,基于更加充沛的资金流,声网加速了产品布局,花钱不只是可以节省时间,更重要的是可以拿下行业与自身能力互补的优秀公司,获得其专业技术、知识产权、客户资源、领域经验以及人才。

一位业内人士向罗超频道透露,2020年12月,声网将实时互动白板服务商netless 从开发者生态中孵化出来,并入声网,并成立互动应用创新团队。

当时,netless累计注册企业以及开发者用户已超 2000 个,累计提供互动白板时长服务超过 30 亿分钟,最高峰值同时在线人数超过 40 万人,成长势头很猛。

Image

这一次收购的环信,也是声网补充实时互动云版图的重要战略布局。环信以 IM 起家,为开发者提供安全可靠的即时通讯网络,并且在即时通讯市场占据领先地位。此外,环信的客服云业务也在国内处于第一梯队,有广泛且高质量的客户群。

Image

最后是自主研发更具针对性产品类型,填补市场空白。

作为一家技术驱动型公司,在核心技术、核心能力与核心行业,声网更加倾向于自研更具针对性的产品类型,来完善RTE能力,填补市场空白。

针对低延迟直播服务(兼具CDN的成本优势与RTC的低延时能力,主要面向高并发、强互动的场景),声网推出了“极速直播”,面向对文字、白板等消息互动低延时要求相对高,或有低频互动需求的直播场景,延时在1.5s-2s之间。

1月20日,声网正式发布教育行业首款 aPaaS 产品灵动课堂,覆盖1v1、小班课、大班课三大场景。

基于低代码(Low-code)开发平台,教育机构与开发者最快可以 15 分钟上线自有品牌、全功能的在线互动教学平台,节省 90% 开发时间,此前教育机构与开发者基于教育PaaS平台,一般需要几百个 API 接口才能开发“在线互动课堂”,而使用SaaS服务则很难结合业务进行量身定制。声网的“灵动课堂”填补了SaaS和PaaS之间的市场空白。

Image

看到这里就能发现,声网拿下环信不是一个孤立的动作,而是整个RTE生态棋局的一枚重要落子,此举补齐与强化了声网的IM云通讯能力,可以给客户提供亿级并发、稳定安全的IM能力,且RTC+IM深入融合也有望形成更多创新互动能力。

此外,环信的开发者服务经验、客户资源、技术积累、人才、品牌等等都可与声网的合力协同,形成1+1>2的效应。

04 野心显露,声网布局RTE的底气何在?

12月拿下netless、1月收购环信,频繁出手表明声网正在加速编织RTE版图。在RTE上,声网的野心比外界看到得更大。

其底气在于:

1、声网有足够强的技术底子,特别是RTC技术底子。声网创始人是技术背景,也一直非常看重视技术人才和研发投入。

据上市时前招股书披露2018年声网研发费用共计1442.6万美元,占全年总营收33.0%,2019年升到2362.3万美元,占全年总营收36.7%,相反,销售支出占比却是下滑的,这足以反应出声网是一家技术驱动型公司,声网主要通过开发者社区来做推广,体现出其技术自信。

上市后,声网进一步加大研发投入,2020年二季度研发费用达1100万美元,同比提高91.3%;Q3 研发费用达1244.9万美元,再创新高。

种瓜得瓜,种豆得豆,研发大投入就有大产出,基于技术优势,声网一方面可以强化RTC等核心技术优势,另一方面可以探索5G、XR、AI等面向未来的RTE技术。

声网占据了RTC这一实时互动场景构建的核心技术优势,就像苹果抓住OS一样,基于此,声网才可以吸引合作伙伴来其生态,同时保证自己的核心话语权。

虽然巨头与越来越多创业者都推出了实时音视频云服务,但声网聚焦在此深耕多年、且重视研发,在诸多核心技术上形成专业壁垒,它创造了全球首个、迄今为止规模最大的实时音视频网络——软件定义实时网SD-RTN。

2、声网有充沛的资金流。

2020年Q3财报显示,声网三季度实现3080万美元总营收,同比增长80.8%,截至2020年9月30日,现金、现金等价物及短期投资为6.35亿美元,远超2019年底的1.06亿美元,这表明声网具有充沛的现金流。

基于此,它有底气做短期没收益、对未来却很重要的技术布局,同时可以大手笔买买买,快速整合优质RTE团队与能力。

3、声网的客户忠诚度逐渐提升。

基于技术与体验优势声网得到客户的认可。2020年三季度,声网活跃客户数量达1815,同比增长95.4%;季末过去12个月金额续费率187.9% ,2019年底这一数字为131%,续费率增长表明客户忠诚度在提升。

客户认声网,合作伙伴才跟声网一起玩,其生态形成了雪球效应,可以具备大而全的RTE能力,提供全场景一站式集成体验。

Image

值得一提的是声网创造全球首个、迄今为止数据处理能力最强、分析维度最广的实时音视频质量诊断分析产品——水晶球Agora Analytics;全球范围内首个实时互动体验质量标准——XLA。

这两个产品,前者为企业和开发者提供全周期通话质量监测、回溯和分析的解决方案,帮助他们及时发现问题、定位原因、解决问题,提升用户体验。

后者则解决了实时互动体验质量无章可循、不可衡量、无保障的痛点。如有XLA指标没有达标,声网最高可进行 100% 赔付。

当其他企业的实时音视频质量还是“黑盒”状态的时候,声网率先打破灰色地带,将其透明给客户,背后代表着对自己技术的自信,也代表着对市场氛围更加清澈的期望。

RTC与RTE虽然只有一字之差,却有传输信息与共享情景的本质差别。当一众玩家依然执迷于RTC技术的PK时,声网早已瞄准RTE布局实时互动与实时互联网,再一次走在行业前面。 

追加内容

本文作者可以追加内容哦 !