关于字节跳动的阶段性胜利
此文应该是年前最后一篇文章了,提前预祝读者朋友们新年快乐。此篇发布后,直到元宵节结束前我都会休息一段时间。期间暂时没有写作安排。
我在上一篇文章中提到了生成式人工智能在内容创作领域的滥化。在监管条件并不是特别严苛的当下,这其实是可以预见到的,是科技进步的必然。最近字节跳动的视频生成模型又引发了剧烈轰动,所以我想借由这一篇文章,结合这两件事简单聊一聊。
首先想要恭喜字节跳动Seed团队在AI视频生成模型Seedance 2.0的大获成功。这个模型的性能强大雄踞地表,甚至到了一种细思极恐的地步。
我已经在一些平台上,看到了一些用户上传的、依据少量提示词和图片素材,所制作出的足以媲美实拍镜头质感的短视频。由于我本人不使用抖音,也对AI生成视频不是特别热衷(我只喜欢实拍的电影级画面),所以在最近的这一波浪潮中没有亲身实践。但熟悉抖音生态的读者朋友们,或许已经看到了大量由该模型生成的此类视频。它的效果是震撼的。对于很多并不熟悉AIGC(AI Generated Content,人工智能生成内容)的朋友们来说,很多人反馈真假难辨。
说来也巧,我在回到老家之前,和一位朋友吃饭,还聊到了字节。
应该是2月5号的晚上。Seedance 2.0是在2月7日上线的。
(我不知道为什么我身上总能发生这种事,但我只想诚实讲出来。)
他知道我曾经在智能体领域有过一点点创业经历。所以和我讨论一些人工智能的相关问题。他问我,你觉得未来最具希望获得胜利的AI公司是哪一个?
我其实早就想过这个问题,我说我觉得是字节。
他问为什么呢?
我说我的观察很简单,一共有两点。
第一是字节跳动什么都能做。我说的是字面意义上的“什么都能做”。大语言模型、多模态模型、民商用智能体、编程智能体......在大模型领域这个很重要,因为全产业链高于一切。这意味着字节除了基础算力,万事不求人。(并且据我目前的了解来看,字节貌似也已经在扎实推进算力部署方面的投资布局。)
第二是字节对于用户需求和行为动机方面的理解,超越了所有人。字节懂用户,非常、非常、非常懂。并且通过抖音和TikTok生态的多年深耕,积累了全球海量的高质量用户行为数据,可以被用以投入训练。我相信,目前就用户理解这一点而言,字节没有任何对手,并且别人极难赶超。这个优势或来源于张一鸣先生本人的认知,以及他一手打造的字节跳动的企业文化。我愿意相信,字节跳动内部应该沉淀着相当数量的脑神经科学、认知科学,以及心理研究方面的资深从业人员,协助打造着字节跳动独一无二的用户产品优势。
我的朋友补充说,张一鸣先生对于人力投资的重视程度应该也算一个方面。我没有否认,也没有过度强调。我早年间在开始决定个人创业的时候,了解过很多张一鸣先生在人才招募方面的访谈。虽然不能感同身受,但我理解他的求贤若渴。只是我对于“优势”的定义,更多侧重于“我有你没有”,而不是“我们俩都有而我做得更好”。所以我没有把这一点放进去。
我和这位朋友聊天结束的两天后,字节就发布了令人瞠目结舌的视频生成模型Seedance 2.0。也许他们的工作,冥冥之中也在回应着这种长期看好。
它的成功所说明的问题,或者说产生的影响,我的观察也集中在两方面,也诚实地分享出来。
其一是,因为字节跳动的用户理解优势,即使在未来的某一天,大家都能够造出来了AGI,或许人们还是会选择字节的。因为哪怕是一模一样的东西,他们也一定会将它设计得让用户体验起来最舒服。人们或许没有意识到,删除冗余操作、贴合用户行为动机逻辑、同时保持审美和品位的产品,是一种怎样的降维打击,将形成怎样的用户粘性。如果他们有一天真的造出来了AGI,并将它放入了抖音生态当中,而用户们没有一点儿察觉,我觉得是完全有可能的。
因为他们看起来是真的能做到。
我想说明,AI被设计出来,最终还是要服务于人类的生活生产,它不是一种只用于展示的花瓶。造AI是为了让人们用。所以某种程度上,对AI创新保持“产品思维”,或许能够为字节在“AGI的最终胜利究竟花落谁家”的激烈争夺中,形成几乎无法复制的竞争优势。
其二是,多模态生成模型的性能表现和精度,往往说明了AI对于真实物理世界的理解程度,而字节或许已经将这个进度条拖动了比较远。AI最终要变成AGI,就不能只是存在于虚拟对话页面的智能,而是要真正走入客观世界成为生产力(具身智能或机器人是其中一个重要的应用领域)。既然字节能够让他们的AI很好地(在“脑子”里)对动态进行物理模拟生成,我们也应该有足够的信心,让这样的能力迁移到AI对真实物理世界的理解中。这同样成为字节在AGI争夺战中重要的有利因素。
这也许并不只是一个视频生成模型。它有可能代表着一种引擎。
好了,关于对字节这场“阶段性胜利”的总结,我就分享这么多。
最后聊两句生成式人工智能在内容创作领域的滥化与边界问题。
AI大量涌入内容创作领域已经不是什么新鲜事。科技进步下沉到娱乐市场,是群众们喜闻乐见的。凭借着网民们积极的创造性,Seedance 2.0发布短短几天以来,就已经出现了许多包含各界名流人士肖像元素的二创作品;在文章创作领域也是一样。有很多作者会将他们曾经亲手写过的一些文章素材喂给AI,花上一些时间进行微调和风格校正,在满意了之后就只使用AI来生成文章内容(然而这样的作者不乏许多受众)。每当他们想有想写的话题,便只用将话题输入给训练好的AI,并附上几句自己想要表达的观点,便放手让AI生成全文。在生成结束后仅负责少数质量把控和行文排版,就能够发布。
尽管这是许多人坚称的“与生产力进步相匹配的创作方式”,但我个人不会选择这么做。我写的东西还是需要自己一个字一个字敲出来。
原因是,目前的生成式人工智能,本质上仍然无法胜任创造性产出。它的使命是说我们想听的话,同时又不得罪、不冒犯我们。
在这里给不了解AI生成内容原理的朋友们简单做一个解释:现有的生成式人工智能(聊天机器人),本质上是一种基于概率计算的“语句补全器”,它依据自己的训练数据和能够接触到的联网搜索数据,一个字一个字地拼凑出一段“它认为你最想听到”的回复。只不过这样的计算和生成的速度都很快。它并非一种“思考”的结果,而是一种“逻辑拼凑”。
所以这样的原理下,它势必会非常保守、非常平庸、非常调和。它不会冒犯人、不会主动说出任何会引起你疑虑或愤怒的话,甚至只会表现出一种高度的附和,因为它的工作就是顺从。但这样也同时剥夺了真实的情感表达和真实的人性思考。所以现阶段它替代不了人。
但人们浏览内容不是为了听另外一个机器给自己灌心灵鸡汤的,对吗?如果是出于这个目的,随便打开任何一个聊天机器人的对话页面就可以了。
人们浏览内容是为了找到其他正在表达的人。是为了看看有没有人能够说出那些他们也许感觉得到,但不见得能够完整表达清楚的话。是为了寻求共鸣和认同。我愿意提供我的所思所想、所见所闻,而不应该被机器替代。
更何况我怎么可能让AI顶着我的名字发文章。对我的读者也缺乏尊重。我占用了读者朋友们阅读我的内容的时间,我得为这件事负责。
我只表达我个人的倾向。我不评判其他任何人。我想这件事我表达清楚了。
关于AI在内容创作的边界问题。我有一点自己的思考。法律规范与监管制度的出现,一定是落后于科技进步的,这是历史规律。其实也很好理解,人们无法先验地预见到,未存在的事物会带来的各种影响及其程度。也就是历史局限性。这其实不是个简单的想象力高低的问题。
如果不等待科技先进步成为现实,人们就无法观察它的存在会产生的各种真实影响。总得知道需要管什么,才能制定怎么管;反过来讲,如果科技进步还没发生,人们就先出台了东西怎么管,套上了紧箍咒,那么科技进步很大概率也不会发生。因为在一些特定领域,原始的科技进步,某种程度上需要仰仗监管空白下形成的高自由度。这是科技进步与监管配套的辩证法。
内容创作领域的监管配套,其重点应该落在对公民肖像权、名誉、知识产权等方面的保护。我们无法控制人们使用AI工具来创作的内容(至少无法约束动机),所以我的具体建议是:提供创作服务的平台应在用户发布内容前,使用大数据进行审查,并落实风险提示和预警,如弹出“您即将发布的内容包含对他人肖像权的恶意丑化与攻击,可能构成侵权行为,存在法律风险,请谨慎发布”等预警内容。如果用户执意发布,平台方应将其内容列入重点关注灰色名单,一旦被他人举报,或被当事人追究法律责任,平台应配合披露相关数据,形成一系列的标准处置预案(例如下架并封禁账号)并迅速执行。相关侵权行为人也应不予再次准入平台,在必要时甚至报送征信单位。
道理很简单,你的创作内容可以不局限于自己,可以包含其他人,但你就要承担随之而来的风险。自由与风险总是同步集中。做了坏事还能拍拍屁股走人没有后果,世界上没有这种事。
好了,春节前想说的话就这么多。
朋友们节后见。
$荣信文化(SZ301231)$ 、$中文在线(SZ300364)$、 $欢瑞世纪(SZ000892)$
本文作者可以追加内容哦 !