文 | 白嘉嘉
近日,一则新年问候视频刷屏了互联网。
视频里,马斯克、比尔盖茨、贝克汉姆等海外名流用一口字正腔圆的汉语,祝贺大家新年快乐,话语间甚至用上了“一帆风顺、两全其美、三阳开泰”这样“高端”的表达技巧。
评论区里,除了“普通话说得真好”的褒奖,有一部分眼尖的人认出来,这组视频其实是通过AI技术生成的。
作为AI的分支,数字人堪称2023年最炙手可热的商业故事之一。只要几千元的成本,再花上一些时间录制音频和视频,大模型就能训练出数字分身,从嘴形、说话节奏到肢体语言,几乎和本人一模一样的。
然而,这片蓝海最近起了一些波澜——一家叫Heygen的数字人企业,遭到了行业头部企业的声讨。
Heygen是它的美国名字,在国内,它叫诗云科技。两边都注册公司的直接收获是,Heygen可以分别在两个市场开展业务,却不需要履行相应的合规义务。
譬如,为了防止AI技术被用于违法行为,国内的企业在为客户提供服务时都需要进行身份认定,而Heygen却没有设立相应的机制,不仅破坏了行业的成本逻辑,还让这个本就年轻的市场更加脆弱。
一个现象是,瞄准中小商户的流量焦虑,大量投机者利用Heygen来制作数字人,并声称有技术和能力运营数字人直播,但真正开播后,商户收到的却是无尽的违规和封禁。
这个现象背后反映的问题是,数字人产业链严重割裂,部分掌握技术的厂商为了扩大市场份额和影响力,故意放任下游“野蛮生长”。而商户则被部分服务商过度吹嘘数字人能力的话术蒙蔽,成为了恶性竞争的代价。
1、数字人乱象:贴牌、套壳、盗版......
2023年7月,孙旭感受到了餐饮市场的寒意,他频繁地在朋友圈刷到同行关店或转行的消息,剩下的另一部分同行,正为了自救猛烈地推出各种优惠活动。“这个行业淘汰率一直不低,但今年(2023年)明显更高了”,他说。
2023年堪称餐饮业的“死亡之年”。 企查查数据显示,2023年1月到9月,全国餐饮累计吊销99万家,是2022年的4倍。其中仅6月就吊销了18.05万家,包括一些曾经在行业内有一席之地的头部品牌。
眼见市场越来越卷,孙旭想找一些新渠道来为店里引流。直播是他的首选,但一上镜就怯场,另招一名主播又太贵。后来又尝试约了一些本地的小网红来探店,但转化率同样堪忧。
或许是因为算法“洞察”了孙旭的意图,几个数字人视频被推送到了他的手机里。
虽然当时还没出现泰勒斯威夫特的爆款视频,但那些被抛出来的成品已经足够逼真,几乎分辨不出来与真人的区别。这类视频往往遵循同一个套路,在片头让观众猜接下来出现的几个人中谁才是数字人,在片尾揭秘其实都是数字人。
如果追根溯源的话,这些视频确实都由数字人技术制作而成。但推送这些数字人视频到“孙旭们”面前的,却未必是具备全链条能力的公司。
为了降低用户使用门槛,头部数字人公司往往会提供一批公共数字人给不愿意克隆自己形象的用户选择,就像在游戏里选择角色那样。同时,为了让更多人愿意尝试这项新技术,企业往往还会提供一定的免费时长。
这些“福利”为大量不具备底层技术和运营、开发能力的公司提供了钻空子的余地。它们直接以个人的身份在头部企业的官网定制视频,并用来为自己的公司招揽业务,更有甚者选择直接搬运其他公司的视频到自己的引流账号上。
在寻找数字人公司的过程中,孙旭几乎“挑花了眼”,“198元AI虚拟主播数字人”、“17.6元虚拟主播教程”等广告比比皆是。期间他也感到过不对劲,总感觉对方提供的样品中有一些面孔很眼熟,“现在想起来可能是在短视频上刷到过”。
其实不光是用户,头部企业也对市场上的套壳、贴牌乱象颇为头疼。
成立于南京的硅基智能是国内顶尖的数字人厂商之一,与北京的风平智能一同被称为数字人界的“南慕容,北乔峰”。
硅基智能创始人司马华鹏曾在接受财经无忌采访时表示,硅基智能的数字人视频经常被其他人盗用去吸引客户。 这些公司不具备后期运营能力,无法帮助客户取得较好的收益,但很擅长通过营销引流,用破坏市场的超低价来招揽客户。
事实上,数字人行业的乱象已经在一定范围内引起了社会的关注。定焦、自象限、AI技术评论等多家媒体均展开过相关报道。
2、乱象丛生因为数字人“太年轻”?
数字人行业之所以显得乱象丛生,本质上是因为它还“年轻”。
数字人年轻?可能许多从业者不会接受这个看法,如果从手绘数字人起算,这门技术已经发展了接近40年。
但很长的一段时间内,数字人制作只能通过手绘、CG、动作捕捉等手段,成本高昂且智能水平不足,与其说它是数字人,更像是一个没有灵魂的数字皮套。
2018年虽然得益于深度学习算法的进步,数字人制作成本从万元、几十万元降低到了千元级别,但本质上解决的仍是数字人的外形问题,没有形成真正的生产力,因此2019年和2020年数字人创业潮很快就回归了平静。
直到2023年,以ChatGPT为代表的大语言模型带来了赋予数字人“灵魂”的曙光,行业才迎来了它真正的质变。来自清华大学的《数字人研究报告2.0》显示,2025年数字人产业规模有望超过1000亿。
前景广阔的背面是市场缺乏对数字人的共识。
目前,“数字人”的概念非常宽泛,从动画作品里的虚拟角色,到微软小冰,再到通过全息技术“复活”的邓丽君,甚至是让照片“动嘴”,都被装进了数字人的口袋。
消费者除非对数字人进行了深入的研究,否则很容易被卖家“数字人只能这样”“这就是数字人”的话术迷惑,认为这只不过是又一个商业噱头。
年轻带来的第二个问题,是市场也还在适应这项新技术,规则常常发生变化。
2023年5月,抖音发布《抖音关于人工智能生成内容的平台规范暨行业倡议(以下简称数字人行业倡议)》,率先开放AI生成的图片、视频和数字人直播,但同时也意味着数字人要被“管”了。
《倡议》在圈里掀起了不小讨论,作为最容易变现的领域,许多企业都寄希望于用数字人来降本增效。但同时,随着数字人直播间的数量增加,质疑声也越来越多,诸如效果太假、市场混乱、价格不透明等。人们开始关心,在已经信息爆炸的情况下,是否要允许“生育能力超强”的数字人来抢占大家本就已经碎片化的时间。
虽然目前还没有其他平台跟进,但国家层面的立法却从未停下,几乎每个月都能看到新的规范或法规出台。
变换的市场规则考验着上游数字人供应商,即便有心踏实做生意,在团队规模有限的情况下,也很难将服务做扎实。 目前,数字人直播间和账户被封仍是用户反馈最多的问题之一。
3、专业才是数字人唯一的出路
在被封了3次之后,孙旭逐渐意识到,自己似乎被割了韭菜。
最初他对数字人员工很满意,曾经用它连续13个小时卖门店的团购券。虽然过程中数字人对观众的提问置若罔闻,但当时他相信自己已经坐上了新时代的便车,数字人越来越智能只是时间问题。
然而问题很快就出现了,因为被判定为录播,孙旭的直播间迎来了它的第一次封禁。
录播是目前数字人直播最容易踩的坑之一,它只是根据提前录入的脚本循环播放数字人视频,与背靠大模型实时生成内容的数字人有本质区别。这些区别很难用肉眼辨别,但在数据监测后台上却能被一目了然地辨认出来。
“最早一批尝试数字人直播技术的商家,很多是被录播割了韭菜。”数字人代理公司负责人张现说,很多商家此前没做过直播,不熟悉平台规则,但对数字人很感兴趣,花万八千,从代理商那里买到一款录好视频的数字人,但很容易被封”。
除了录播,数字人质量差、口型对不上、交互能力低下、视频质量等问题均有可能导致客户的使用体验下降,甚至封禁。虽然有些公司提供指导服务,会一步步教客户如何解封直播间,但整体来说,仍没有公司能保证不会被封号。
不过也有一些企业确实利用数字人实现了效率翻倍。
硅基智能透露,某酒旅行业头部品牌的数字人直播间内,2023年已经收获了超过10亿的GMV(商品交易总额);某咖啡品牌的单一数字人直播间,仅在单日的5小时内,就收获了85.6万的营收。
为什么有的人能用数字人赚钱,有的人不行?
本质上,数字人仍旧是一款工具,而不是具有主观能动性的人,它所能发挥出的潜力,与使用者对行业的理解程度高度相关。换而言之,只有懂得KnowHow的人,才能用好数字人。
以最基本的交互为例。为了防止大模型幻觉导致数字人在直播间内胡说八道,市场上90%以上的数字人公司使用的都是“关键词匹配”技术。通过关键词来匹配问题和答案,只要触发了关键词,它就能匹配到并反馈给观众。
机械的匹配机制下,数字人直播间往往枯燥乏味。但如果直播间运营商储备了相应的语料库,知道主播说哪些话、怎么安排直播节奏能调动直播间氛围,即便同样基于“关键词匹配”技术,直播效果上也会呈现出较大的差异。
客观来说,数字人直播的门槛其实并不低,它既需要客户对技术有一定了解,能分辨录播与真正的数字人之间的区别,还需要客户对直播行业有基本的常识。
指数起量,打破真人直播的上限,24小时无休……这些词句常被用于介绍数字人的优点。与单独的个体相比,数字人固然在“繁衍能力”和“劳动时长”上有先天优势。但如果放到整个直播大盘中,24小时无休和主播数量爆炸早已经在多年前就成为了现实。
或许,直播平台并不在意屏幕前的那个是数字人还是真人,严密的平台规则和推荐机制已经注定,只有“专业”才是突出重围的杀手锏。
本文作者可以追加内容哦 !