1024是程序员的节日。 

技术驱动型公司,都喜欢将盛会选在这一天,其一很符合企业调性,其二为一年的产品技术成果做个全面总结;其三Q4也是商业结果关键的季节。 

声网的RTE大会是焦点中的焦点,今年的主题是「智能·高清」,前者是产业里最炙热的当红炸子鸡,后者的价值反而被严重低估了。 

借着大会的热度,我们来认真聊一下「高清」。 

出品 / 巨头财经 

01 高清是一个不可逆的体感过程

从阴极射线管(CRT)的发明、液晶显示技术的诞生,到智能手机时代的高分辨率屏幕、HDMI2.0版本推出进入真4K时代,再到如今,处处都是高清显示屏、高清直播、高清视频流、高清VR体验。 

数字高清这条技术道路演进,基本追寻摩尔定律,每18个月高清效果提升一倍,每18个月高清显示成本降低一半(没那么严谨,总体是吻合的)。 

人类这种碳基生命,对高清体验有三层有趣的潜意识: 

第一层,高适应性。 无论多快速的技术迭代,人类总是能更快速地适应,毫无障碍; 

第二层,不满足性。 原理也很简单,和人类生命数十亿年进化比,数字化还在初阶阶段,从理论上来讲,人的眼睛视网膜有几百万个锥形细胞,还含有上亿个棒状细胞,最少达5亿像素,比当前最先进的相机还要先进; 

第三层,不可逆性。 比如近视人群,一戴上适合的眼镜就很难摘下;比如习惯了4K视频,再也无法忍受360p/480p的观感。 

这些年,消费者对观看直播、视频互动时的视频画质要求越来越高,用户的音视频消费习惯,逐渐从简单的信息交换转向追求真实还原。 

究竟进化到什么程度了呢?在RTE大会上,设置了广播级4K高清实时互动的展示环节,通过两个电视大屏鲜明地对比了当前主流的1080P高清与广播级4K高清画质之间的区别,再次刷新了人们对高清体验的新认知。

 这也是RTE大会的意义之一,让最先进的技术以肉眼可见的方式呈现在观众面前。 

02 RTE大会,透露了两大高清趋势

RTE大会已经连办9年了。 

9年前,整个国内甚至亚洲,都没有任何一个专门交流实时音视频的行业会议;9年后,声网举办的RTE 大会规模已经扩张到 20 多个论坛,吸引了近3000 名行业观众。 

2016年的连麦互动,2017年的在线教育,2018年的电商直播,2019年的线上演唱会… 

几乎每年,RTE大会都能在实时音视频未来发展趋势的研判上,提供前瞻性的行业洞察。 

今年也不例外。2023以“智慧·高清”为主题的RTE大会,确实称得上一场“智能+高清+商业+思想”的盛宴。 

尤其是这两点。 

其一,定义了一个标准,首创基于公共互联网的广播级4K高清实时互动; 

广播级超高清可以带来更加逼真的视觉效果,高对比度和丰富的色彩表现可以使影像更加生动,细节更加清晰。 

按声网创始人兼CEO赵斌的解释“4K不仅仅只有分辨率一个维度,光亮强度的动态范围、色彩的真实度、饱和度,以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。” 

为此,声网提供了一套全面的解决方案,包括高色深、广深域、高帧率、HDR、360度视频、点云以及4K和8K的支持。 

这些技术和功能的结合,使得声网能够提供高质量的音视频传输和渲染,满足广播级4K高清实时互动的需求。 

其二,发布全球高清能力地图,标注哪些国家和区域可以支持实现1080P高清的实时互动。 

凭借97%的直播秒开率,100ms的直播帧出图,500ms1V1 业务连通耗时,1.1%的超低视频卡顿率,声网在提供丝滑实时互动体验方面表现出色。 

通过该地图,用户可以了解到哪些地区的网络基础设施和带宽能够满足实现1080P高清实时互动的需求。 

这对于企业、教育机构、媒体公司以及个人用户来说都非常有价值。 例如,企业选择合作伙伴或扩展业务时,可参考地图评估实时互动能力,做出明智决策。 

再比如,社交泛娱乐企业在海外拓展时,可以根据全球高清能力地图的指引,灵活选择出海策略,并因地制宜地展开与视频相关的业务。 

前者是将行业标准再次推进一大步,其技术壁垒又加深了一尺;后者更有意义,在出海风口盛行的今天,无疑是一张极具参考价值的数字航海图。 

03 供给侧视角:高清实时互动的四层场景意义

先不讲那么多技术参数。 

声网定义的4K高清实时互动,不仅仅是底层技术的突破,更具有解决方案级的适配实用性。 

一般消费者理解的高清,直观感受是画质怎么样,是不是清晰流畅。 

其实在供给侧,高清能力有四层场景意义: 

一是最顶尖的高清能力,考验软硬件的参数配置;二是同等物理硬件条件下,通过码率算法等优化,实现更高清的体验;三是C端体验,结合网络上下行速率、本地计算能力等具体情况,给出瞬时最优解;四是在服务端,尽可能降低高清成本,提供同等成本下的最优解。 

早在今年7月,声网就发布了“实时高清·超级画质”解决方案,其参数已经达到了4K高清水平,还针对应用场景实现三项特别优化: 

AI画质增强。 光照不足时能智能补光,曝光过度时能暗光增强,色彩饱和度不够时一键就能实现智能调节。 

人眼感知优化。 即在编码过程中,能通过降低对用户感兴趣区域的量化参数值,从而分配更多的码率,以提升这些区域的画面质量。换句话说,用户关注的内容会变得更清晰。 

低码高清。则是在同等宽带下实现更高的清晰度。码率最高下降70%,最低 500K 即可实现 720p 视频流畅体验。

04 应用层视角:高清实时互动已在各行业开花

“总是有粉丝吐槽我美颜假,要我自己调整参数实在是太难了;稍微开高清一点网就变差,卡成马赛克;这个平台的画质就只支持这个效果....” 

以上种种直播时常出现的问题,借助声网的“实时高清·超级画质”都能够得到很好解决。可以说,实现身临其境的高清体验,势必会成为实时互动行业的新迭代方向。 

最直观的数据表现也很诱人。据了解,做视频连麦和直播时,与标清画质相比,高清画质频道的用户次均观看时长、人均观看时长、留存时长分别增加了14%、30%、10.3%,打赏率也会得到大幅提升。 

除了泛娱乐,声网在元宇宙、教育、物联网、金融、医疗、企业协作、数字政府、智慧城市等超过200多个应用场景中,其实都有实战级的案例。 

针对物联网设备使用场景,声网通过客户端的视频增强方式和自研超分算法,解决了硬件资源不足和网络差的问题,将视频门铃或门锁场景中的画质从360P提升到720P,提高了画质清晰度。 

此外,声网还提供多项音视频黑科技,包括高清语音引擎、视频增强策略、实时美声算法、AI降噪和回声消除能力等,为用户带来更高保真、更趣味、更高清的音视频体验,真正满足跨端跨平台万物互联的需求。 

在工业远程协作场景中,声网为华晨宝马打造了远程协作解决方案,利用增强现实眼镜,让产线工程师与后端专家共享情景和时空,使专家能够像亲临现场一样指导工程师进行问题修复。 

在保险理赔领域,声网为太平财险、众安保险提供了“远程定损理赔”的技术支撑,勘察员不必到达事故现场,车主与理赔客服远程视频就能完成定损理赔。 

05 商业化视角:高清实时互动的管道价值被大大低估了

实时互动领域的技术迭代速度相当惊人,尤其是随着视频生态和直播生态的成熟,几乎占据了全网80%以上的流量,高清体验标准下的实时互动,已经成为管道级新基建,其价值是被严重低估的。 

稍微总结下,实时高清等技术至少给客户业务带来以下3个商业价值: 

增强用户粘性: 

高清画质和清晰音频提供更出色的观看和听觉体验,使用户更满意,增加他们使用产品或服务的频率和持续时间。 

塑造品牌形象: 

通过提供高清音视频体验,客户能够展示对细节和品质的关注,彰显自己在技术和用户体验方面的领先地位,从而增强品牌形象和市场认可度。 

以差异化竞争优势增收: 

高清技术使客户能够在竞争激烈的市场中区别于竞争对手,并创造新的业务应用场景。这不仅有助于吸引更多用户和市场份额,还为客户提供了增值服务和附加收费的机会,增加收入来源。 

相关研报显示,在B端产业方面,实时互动市场未来5年平均每年将迎来35%的增长,预计到2025年,全球实时互动服务规模将达120亿美金。 

目前市场只有两类玩家,一类是巨头,自闭环下的海量数据优化,为自身生态服务,兼顾一些能力开放;一类声网这样的第三方服务商,为全网多种生态提供多元、定向、优质解决方案。 

实时互动产业是一个长周期生意,当企业的技术储备和综合能力建设达到一定程度时,必然会迎来拐点。声网过去的技术积累和行业深耕,其价值已经逐渐显现。 

06 供给巨头财经的思考:卖水者,终极方向是建设绿洲 

声网创办9年,技术壁垒的背后是日拱一卒的深耕;RTE大会办了9年,也是某种技术理念和技术价值的延续性表达。 

正如创始人&CEO赵斌所说:“实时互动是互联网企业必须的工具和功能。我们希望通过这样的大会,让开发者能够像使用水一样简单地使用实时音视频功能。” 

市场是变化的,竞争是内卷的,VC驱动是萎缩的,企服结果是肉搏战的,卖水者迎来春天还需要一段时间。 

作为实时互动领域的开创者,声网始终保有“搭建一个中立、实践、深度沟通平台”的初心,未来行业大概率会朝着生态化、孵化式的方向发展,而"一站式陪跑服务"是未来生态的雏形。 

卖水者,终极方向是建设绿洲。 


追加内容

本文作者可以追加内容哦 !