周鸿祎:大模型时代的产业创新|《财经》年度对话2024

finance.sina.com.cn 2024年12月20日 21:19

2024年12月20日,360集团创始人周鸿祎在“《财经》年度对话2024:穿越变局的力量”论坛作主题演讲——大模型时代的产业创新与变革机会。以下为部分发言实录,根据现场速记整理。

周鸿祎:很高兴,我第一次来这个场所发言。因为我理解经济学家,李稻葵老师这样的大学者才有资格发言,我一个搞技术的,很多大词也不懂。刚才李老师在台上委婉地批评我了,我反思了一下,我一年到头就穿一件红衣服,我应该增加消费。其实我衣橱里有50多件红衣服,我的名字老被叫错,老叫周鸿伟,所以我穿红衣服,李老师叫我鸿祎就好。

我分享对大模型的看法,最近有很多争论。

第一, 不知道在座的各位对大模型怎么看,现在有很多争论,有人至今认为这是一个泡沫,也有人认为是一种技术,元宇宙,WEB3喧嚣一时,证明时机不对,谈AI这件事最重要的是有一个认知,说严肃点,有没有信仰,相不相信这件事。

相不相信AI是真智能,突破了原来人工智能的局限性。到底人工智能能影响多少行业,走多远?相信不相信是工业革命,如果是工业革命,这个技术定位很高了,无论做什么行业都可能会改变你的行业。

网上很多人散播焦虑,争论说到底什么岗位最终被AI淘汰,我倒觉得这个还不清楚,因为争论很多。但是有一点未来可能不拥抱AI、不理解AI,不掌握AI的个人和单位可能会被用AI的淘汰。所以有一些企业家,包括成功的企业家,面对新生事物的时候,往往容易刚开始看不清。传统业务太成功了,看不起新出来的技术。因为有这种心态,因为看不起,所以没有仔细研究,也看不懂,有一天想抓机会的时候就看不见了。

其实,国家今年政府报告里讲人工智能+行动,大家提到的打造新质生产力,主要的科技创新是数字化技术,数字化技术今天宏观上恰恰是人工智能。所以,我对人工智能大模型研究,大模型是最好的抓手,打造新质生产力的关键支撑技术。这么说,它给我们每个人赋能,让每个人具有超级能力,也会重新改变所有企业的运作和工作方式,它和计算机互联网一样是一种根本性的技术。

也有人喜欢拿互联网过去成功的经验看AI,互联网和AI非常不一样,最大的不一样在于互联网是一个改变连接关系的东西,改变人和人的连接,改变人和信息的连接,创造了很多商业模式的创新。但是互联网不是那么直接赋能生产力的技术,所以美国一个创始人讲过一个笑话,本来科技发展这么多年能得到一个能飞的汽车,结果我们得到了一个140字的推特。推特当然也很牛。

“AI的生产力属性非常强”

但是和真正的科技进步比起来,AI的生产力属性非常强,比如说AI确实能帮助人们研制新药,破解人的生老病死的秘密,AI确实能从自动驾驶汽车做到无人驾驶,这恐怕是靠互联网做不到的。前两天马云出来讲的话我非常赞同,他说AI比互联网的机会很大。现在更大的机会,不亚于互联网的机会就是大模型的机会。

最近出现哪些新的动向和趋势,技术变化很快,快到什么程度?我用了一个词,我这几年搞大模型的时候,我感觉自己度日如年。有人说你这么痛苦吗?我说度日如年,只要看全世界有多少公司、多少科技人员又研究出来什么新的人工智能突破性技术,一天的进展都看不完。但是我们看一个趋势,跟大模型出来的时候不一样,大模型刚出来的时候大家比较乐观,特别是美国几家公司,觉得我只要有无数算力,只要数据足够多,假以时日足够出来AGI,就是通用人工智能,或者超级人工智能的一个进阶版,那就意味着AI在各个方面全面超越人类,变成宇宙间、无所不懂的神。但是好像现在发现说错了,首先数据不够,互联网能弄的数据已经用完了。第二,可能在算法上碰到了一些障碍,所以难以推出来。有人说这是不是怪事?不一定。

第二,因为GPT方向碰到障碍,人工智能从原来做的快思考模式变成了慢思考模式。快思考慢思考相对来说,简单打一个比喻,好比我问你个问题,你凭自己的经验,自己的快速反应和记忆回答问题,这个问题有的时候经常有错误。人们真正的智力表现是把这个事情反复琢磨,想很多遍,找很多人讨论,这样一个复杂的过程,最后如果写一篇文章现场挥毫一就,恐怕很难写出漂亮的文章,可能一个好文章是慢思考的能力。现在人工智能全面转向这个方向,这几天谷歌发表了一个产品,主要在慢思考和推理上进行突破。

第三个趋势,大家一提人工智能被过去的宣传带歪了,认为只有无所不能才是人工智能。但其实人工智能现在的一个发展趋势,在走向专业化划分的路径,专家专到一定时候一定走专业的,所以谷歌旗下的DeepMind公司,专门设计芯片,做了阿尔法狗下围棋,还得了诺贝尔化学奖。所以我们要反思,要求一个模型写诗作画,解奥数题,给公司编软件,这是我们未来的需求吗?

第四个趋势,代表了两派不同的思想争论。有一派还要做大。马斯克花了很多钱堆10万亿卡的集群,为什么?要训练万亿和10万亿参数的模型。从另外一个方面来看,现在越来越多的大模型,还是叫大模型,小模型这个词不能乱用,但是做这种小参数的大模型,大概10亿量级以下,称为小参数大模型,为什么?大模型要上车,大模型上手机,苹果也做这事情,所以大模型现在在做轻量化。

有人说大模型越做越小,越做越专之后,能力是不是越来越弱?大模型刚开始出来的时候我们对它的认知比较粗浅,觉得越大越好,什么数据都往里灌,什么都让它学,但就跟一个人博览群书,不一定能力很强。人们现在发现模型不用特别大,能力出于知识密度和知识质量。今天给我们一个启发,互联网找到的知识不算什么高能量的知识,很多知识是藏在专业的公司和专家脑子里的。

再一个趋势,跟大家可能有关系,大模型现在从原子弹的生意变成茶叶蛋的生意了。大家不要笑,茶叶蛋大家吃得起,如果都要按造原子弹的决心造企业大模型,大模型跟我跟你可能没什么关系。所以大模型的成本感觉是自由落体,刚出来的时候买一个大模型开5000万都是便宜的,现在大模型有很多开源都可以用,价格是零,相对云厂商,包括算力价格下降了上百倍。目前,国内大模型的厂商,阿里、头条、腾讯都是以低于成本价的价格给大家提供,所以大家可以薅它们的羊毛。

大模型出来一个很重要的趋势,第一次用ChatGPT的时候,虽然感觉很牛,但它是一个聊天机器人,所以聊天机器人跟人对话可以了,但是请回企业,光动嘴不动手,干不了活,这跟企业的关系就很弱了。所以传统软件还是辅助人的工具。

2025年智能体会大行其道,是一套技术,可以把大模型包装成一个可以干活的数字员工,这是通俗的理解。我讲的大模型技术跟很多专家比起来可以忽略不计,大家为什么愿意听我讲,我可以讲得很通俗。让它走下神坛,脱下科技的外衣,每个人真正的使用,不是顶礼膜拜。所以智能体,这么说是大模型在企业、在产业里落地最重要的技术,如果没有智能体,大模型就是一个。总不能天天跟它聊天。

2023年是大模型之年,大家都在秀有什么肌肉,有什么突破。2024年大家已经意识到是大模型专业之年,开始找到场景化落地了。大模型说得很好,但感觉像玩具,不是工具,能作诗不能做事。2025年我预言Agent之年是智能体之年,企业会大量使用和部署智能体,智能体背后还是大模型。

我们可以看到大模型的产业之路怎么发展,明显分出两条路。一条是AGI之路,还是星辰大海,类似曼哈顿计划,人类的恒星,探索探索人类的超级人工智能。卷算力,卷算法,卷数据,参数越做越大,这条路跟大数人没有关系,美国玩这条路的公司就那么几家巨头,中国未来也就是几家巨头能做。

还有一条路,AGI完全平行的路,就是应用之路。放弃打造大模型,万能大模型的之年,最关键的用一个大模型解决一件事,向场景化、专业化、垂直化方向发展。美国内部也有争论,大家意识到英伟达的显卡已经买得很多了,但是并没有充分利用起来,所以现在做应用的时机到了。

这个讲过了,AGI至少100亿美金买显卡。刚训出一个模型,明天友商又训出一个更好的模型,就像西西弗斯推石头一样,停不下来。

为什么走应用之路不用卷数据、卷算力,卷参数的大小,走应用之路关键是围绕你碰到的问题和困难,一个大模型解决一个问题。就像各位招聘年轻人,招聘一个大学生不能要求什么都能干,能开车能直播带货,还能当保姆,这要求有点太高了。他就在文字方面进行培养,这个对培养人的难度就会降低很多。如果是做专业的大模型,意味着模型的数量级可以下降两级数量级,大概十亿的模型能够,意味着什么?不需要一百张卡,一千张卡,大概平常几张卡,单机单卡,企业应用规模不是很大,能够用起来。我想当年发明的超级电脑,并没有带来工业革命,70年代超级电脑被乔布斯做成了PC,才带来真正的信息革命,信息革命走进千家万户,改变了百行千业,把大模型拉下神坛。

很多人问我,用已有的例子比喻大模型,大模型到底是不是语言,是不是电力等等。大家想各种比喻。我后来觉得大模型应该是一种能力,而不是产品。大模型必须要跟一定的产品相结合,我比喻成它像一个电动机,大家买电动机吗?你不买电动机。但是真正每个人又离不开电动机,比如说电牙刷,吹风机,刮胡刀都有电动机,客户要的是刮胡刀和吹风机,不是电动机,这是我很重要的观点,大模型必须找到结合的场景,变成新的产品。

大模型的六大应用方向

我们自己总结的不一定对,因为对于大模型是盲人摸象,每个人从不同的角度讲,大模型的能力做分割。因为各大互联网公司介绍大模型的时候,大家比较容易集中在它的头两层、头三层能力。比如,第一层是文字语言的能力,阅读、写作。第二层是创意能力,大模型产生的视频、音乐、图片,几可乱真,达到人类同样的水平。第三,多模态能力非常重要。大模型不仅理解文字,还能听得懂看得懂,不是看见什么,比如就像我一看见刘建宏,就想起中国足球,这不是一个笑话。但是,大家对大模型的业务能力关注比较少,所以我也想在座的都是企业家、投资家,大家肯定关注大模型跟企业业务结合有很多能力,如何帮助企业更好地处理大数据。我有一句话,大模型会激活今天所有拥有数据的潜力,你想如果大数据像石油一样,直接用很困难,大模型可能像冶炼厂一样,真正把它的价值发挥出来,包括企业里面的知识管理,企业里面业务的再造。还有两个能力:是创新能力和科技能力。

我们建议了六个方向:

第一,人人智能。也就是说AI对人的作用,我觉得还是工具属性,是正向的,所以大模型不是用来淘汰某些人,而是提升每个人的生产力。有了大模型以后,每个人都有可能成为超人。为什么最近国外一直谈一人公司或者小团队比较流行?有了大模型以后,很多人的能力,比如原来刘建宏不会编软件,现在可以让AI替他写代码了。有人不会做宣传,但是现在大模型可以替他写文章了。所以,我们做的纳米AI搜索,帮助个人使用大模型的能力,提高他获得表达的能力,这个市场很大而且可以分得很细致。

第二,万物智能。我们知道万物互联的概念,它不是目的,还是手段。互联之后,大模型有大有小,有强有弱;小模型可以部署在终端上,部署在硬件上。大模型部署在云端或者边缘侧,大小模型合起来可以达到什么目的?不仅这两年苹果手机谈中国的,之前用Siri,那哪叫人工智能?叫人工。有了大模型以后,Siri变成人工智能。万物智能意味着什么,看到所有的硬件以后都有智能。想想很可怕,刘建宏半夜起来打开冰箱,扫地机器人打招呼说不要偷喝啤酒了。因为有大模型之后,有了多模态语言的能力,就意味着你们家所有东西跟你交流,能够识别你的指令。

再举两个例子,比如说苹果和脸书花了很多钱做AR眼镜,到今天也不算成功,苹果的Vision pro也做不下来,到现在眼镜不再跟AR结合,跟AI结合。比如现在做一个眼镜,我见到那个人,凝视它三秒钟,自动告诉我他叫刘建宏。其实我不认识刘建宏,我看桌上的名牌才知道他叫刘建宏。所以在大模型的作用下,原来做不了的虚拟现实和元宇宙,倒有可能变成现实。

第三,数转智改。传统产业的数转智改,通用大模型作为个人生产力提升还是可以的,但是如果大模型真跟企业内部业务紧密结合,真正在企业内部干活,变成数字专家、数字顾问。我觉得通用大模型不行,因为没有你的专业知识,没有行业领域知识,而且还有数据丢失的隐患。所以企业需要的是什么?企业也需要有人能够做营销,做各种图片视频,但是企业最重要的是自己的核心业务需求和业务流程,能够用得上大模型和智能体。所以企业用大模型的关键,我觉得是找场景。因为问题的关键是找到关键的问题,关键的问题是找场景,就是说不要试图去做一个通用、万能大模型,解决企业内部的所有问题,而是在企业内部的业务流程,或者是对外的服务产品体系上,从领导的需求到基层员工的需求里面去找卡点和堵点,能够怎么验证这个卡点和堵点呢?过去我想干,但是我技术干不了的事情,过去想解决但是技术上解决不了的问题。现在有了人工智能,有了大模型就能解决了,一个标志是能提高10倍的体验,提高10倍的效率或者降低10倍的成本,减少10倍的人力。所以我讲为什么大家要学大模型,大模型有的老板说我有钱,你给我搞一套大模型就可以了。有些技术,像云计算、大数据可以这么干,但是人工智能在企业用得好,这个企业从老板到高管到业务骨干,到基层员工都要对AI有一个基本的了解,因为决定AI怎么用,是需要业务进行指导。

我举两个例子,场景分得足够细,这样才知道应该有什么样的专业模型解决问题,也有企业家找我,上来说给我打造一个养猪大模型,我一句话怼回去了,我说解决什么问题?猪有什么痛点和刚需吗?也有企业找我,某省钢铁企业上来说,我们要做一个钢铁大模型,我一直问他我对钢铁一窍不通,你能告诉我钢铁有什么问题,分解了一下,分解了142个场景,不一定是142个模型,至少需要142个智能体。

我是做医美,做教育的,做什么,做体育直播的,请问我们怎么用大模型?我也回答不出来。你自己分解你的业务。

再举个例子,这个例子更简单一点,斯坦福医学院跟创业公司合作,并没有做给人看病。完整的医疗康养大模型,这种概念听得很多,他们找了三个堵点,所有病人看病都是由社区医生,家庭医生发传真,手写情况介绍的方式发到医院,医院每天有一堆人看传真。第二,医院打电话跟病人确定看病的时间,不是你想看就看的。第三,美国有一个挑战,跟保险公司写很好的报告,保险公司才能降低拒赔率,报销报告很重要,这是专业的保险和税务专家在做。所以用了三个大模型做了三个智能体,一个专门解决看传真,多模态的能力意味着人工智能能看懂所有你想给它看的对象。比如说纳米AI搜索,我对着药盒拍一下它就告诉我是什么药、有什么禁忌,一天吃几次药。它视觉能力非常强,读出来之后自动加到数据库,有数百人接传真的队伍,这个人力省出来。第二,跟客户聊天,让客户舒服挺难做到的,数字技术、云合成技术只是打电话,确认几点钟星期几看病,这个没问题。第三也很容易解决,医院里积累了几十万份给保险公司的报告,拿这个报告依葫芦画瓢,给病历写容易通过保险公司赔偿的报告。只要你找好场景找好卡点,大模型今天的能力不需要等到超级人工智能,都能干的。

所以现在美国提一个概念,叫Saas到Saas。比如,这是一个绕口令,人听不懂绕口令,现在多模态能听懂。所以我们知道,原来叫Saas,Saas的全名叫Software as a Server。从原来把软件一次性卖给你,现在装到云上,像用电用水一样每月缴费,这是一项革命。美国人现在谈service as a software,一听觉得很迷惑,我解释一下。我刚才讲德斯坦副医学院的例子,美国软件IT市场1万亿美金正在干,这个数字不一定准确。美国有一个服务市场,用软件无法干的事情,比如有人给你写保险公司的报销报告,过去这件事干不了,但是过几年机器人可能干得了。所以原来不能干的,今天可以成为期待了,意味着人工智能重塑服务市场。过去我们交付的是软件,本质还是交付一个工具,企业买了我的软件之后还得人来用,但是人工智能成熟之后,我们不仅仅是交付大模型,交付的是一个智能体。这个智能体能够像你的数字员工,数字专家,数字顾问一样能干活的,所以它成了服务能力的交付,所以价值的改变,原来是人力用工具创造价值,现在变成AI直接创造价值。商业模式都会改变,因为直接和人对标。所以现在美国的公司疯狂地占领概念,我提供了什么服务可以用AI干,或者我需要原来花很多钱买的服务,能不能用软件替代了,意味着新一轮产业升级,但是这里面不要追求宏大叙事,不要追求一个软件什么都干了,而是找到企业内部的具体场景。

什么是未来产业?比如说自动驾驶、生物制造、元宇宙、区块链,这些企业本身不存在传统企业数改的需求,大模型给它们提供解决问题的能力和工具。比如说从自动驾驶到无人驾驶,原来我们以为会很漫长,特斯拉和华为实现的突破,从家里到单位完全不用手干涉驾驶,为什么这么大的突破?很简单。就因为有了大模型。现在用大模型的范式,把开车的数据记下来,用数据让大模型进行学习和训练,机器能够举一反三,能够模仿人的开车方式。马斯克裁掉了做自动驾驶的很多程序员。找到相应的数据进行训练就可以,只要没出过车祸的车主给马斯克提供很多素材。刚才说的无人机、无人驾驶,没有大模型、AI技术的加持,这个产业无法往下发展。

今年物理奖化学奖诺贝尔奖给了AI科学家,现在是皇冠上的明珠,也是美国最热门的方向,用AI解决科研的工具。科学家或者企业内部的科研机构的科研人员不用大模型做工具,不会用大模型提供解决问题的范式和能力,科研成果肯定比不上用大模型的团队。举一个简单的例子,大模型最重要的作用不是写文章,是什么?给它一个验证过的序列,序列的知识足够多的时候,序列是什么样的规律它掌握了,虽然无法描述,但是它可以预言序列。为什么现在科学应用到这个能力?生物学把细胞构成看成一个序列,把基因看成一个序列,基因本来也是序列,把蛋白质看成一个序列只要能把它序列化,大模型都有机会处理。这一块我不懂,这都是道听途说,供大家做参考。所以,第四个方向是发挥大模型的序列预测能力,赋能自动驾驶、具身智能等未来产业。第五个方向是,打造科研新范式,AI For Science将成为推动社会发展的重要驱动力。

第六,大模型的安全。未来这么多的环境下都用到大模型,大模型的安全比历史上所有数字化技术安全带来的挑战都更大。如果训练大模型的时候,你的数据被污染了,会产生什么后果,不知道。大模型会产生幻觉,很多人抱怨。幻觉是大模型与生俱来的能力,说明它很智能。因为世界上第一个产生幻觉的生物是谁?是人。所以大模型的幻觉有时候很重要,在创新能力和头脑的激荡的时候、在开药方的时候、写保险单子的时候。美国出来一个笑话,有一个律师拿GPT写状子,GPT伪造了三个不存在的法律条文,连网址都有,这个律师没有检查就直接上法庭了,结果可想而知。

大模型还有很多,如果你用了大模型以后,对员工好一点,因为过去只有黑客才能攻击一个系统,但是大模型能跟人对话。这么说,刘建宏你的办公室前台小秘书没事跟大模型聊天,就能说服它反水。现在没有大模型能够幸免,只要耐心跟它讲足够多的话就可以PUA他。以大模型对付大模型的安全是一个效果,也是长期需要努力的范畴。

结束之前,将再次强调,大模型讲得庸俗一点,不是中心化的电力,就是一个去中心化的电动机。斯坦福有一个教授最近写了一本书,蒸汽机到电动机为什么花了30年才迎来革命,这个故事真的很有趣。因为原来用蒸汽机的时候,每个工厂一个蒸汽机作为能源的动力输出给工厂所有需要动力的地方,输出动力围绕蒸汽机为核心环布四周。把蒸汽机换成电动机,没有带来工业革命,没有效率的提升和成本降低。什么时候成为革命?大模型可以把电动机做小做便宜的时候,奇迹就发生了。大家不再买一个大的电动机驱动所有的电力,是在每个需要的地方都买一个电动机,就是所谓的中心驱动变成单元驱动,这改变了很多工厂的格局,改变了它的流程、改变了它的管理体系,所以这个故事有两个道理。

斯坦福教授想表达的是当你用AI的时候,刚开始模拟你现在的管理岗位、管理流程,把数字人替换物理生物员工,但是未来随着你用的数字人、大模型越来越多,可能整个的企业管理模式、业务流程就会随之转变,这个对绝大多数企业来说还相距甚远,很多也还没有用上大模型。我想借这个机会说,大模型的趋势已经出现了,用不着30年,我们用了三年大模型做得很便宜很小,能力很强,而且可以私有部署,可以自己定制,干吗不多弄几个大模型呢?



追加内容

本文作者可以追加内容哦 !