周鸿祎;大模型时代的产业创新|《财经》年度对话2024
finance.sina.com.cn 2024年12月20日 21:19
2024年12月20日,360集团创始人周鸿祎在“《财经》年度对话2024:穿越变局的力量”论坛作主题演讲——大模型时代的产业创新与变革机会。以下为部分发言实录,根据现场速记整理。
周鸿祎:很高兴,我第一次来这个场所发言。因为我理解经济学家,李稻葵老师这样的大学者才有资格发言,我一个搞技术的,很多大词也不懂。刚才李老师在台上委婉地批评我了,我反思了一下,我一年到头就穿一件红衣服,我应该增加消费。其实我衣橱里有50多件红衣服,我的名字老被叫错,老叫周鸿伟,所以我穿红衣服,李老师叫我鸿祎就好。
我分享对大模型的看法,最近有很多争论。
第一, 不知道在座的各位对大模型怎么看,现在有很多争论,有人至今认为这是一个泡沫,也有人认为是一种技术,元宇宙,WEB3喧嚣一时,证明时机不对,谈AI这件事最重要的是有一个认知,说严肃点,有没有信仰,相不相信这件事。
相不相信AI是真智能,突破了原来人工智能的局限性。到底人工智能能影响多少行业,走多远?相信不相信是工业革命,如果是工业革命,这个技术定位很高了,无论做什么行业都可能会改变你的行业。
网上很多人散播焦虑,争论说到底什么岗位最终被AI淘汰,我倒觉得这个还不清楚,因为争论很多。但是有一点未来可能不拥抱AI、不理解AI,不掌握AI的个人和单位可能会被用AI的淘汰。所以有一些企业家,包括成功的企业家,面对新生事物的时候,往往容易刚开始看不清。传统业务太成功了,看不起新出来的技术。因为有这种心态,因为看不起,所以没有仔细研究,也看不懂,有一天想抓机会的时候就看不见了。
其实,国家今年政府报告里讲人工智能+行动,大家提到的打造新质生产力,主要的科技创新是数字化技术,数字化技术今天宏观上恰恰是人工智能。所以,我对人工智能大模型研究,大模型是最好的抓手,打造新质生产力的关键支撑技术。这么说,它给我们每个人赋能,让每个人具有超级能力,也会重新改变所有企业的运作和工作方式,它和计算机互联网一样是一种根本性的技术。
也有人喜欢拿互联网过去成功的经验看AI,互联网和AI非常不一样,最大的不一样在于互联网是一个改变连接关系的东西,改变人和人的连接,改变人和信息的连接,创造了很多商业模式的创新。但是互联网不是那么直接赋能生产力的技术,所以美国一个创始人讲过一个笑话,本来科技发展这么多年能得到一个能飞的汽车,结果我们得到了一个140字的推特。推特当然也很牛。
“AI的生产力属性非常强”
但是和真正的科技进步比起来,AI的生产力属性非常强,比如说AI确实能帮助人们研制新药,破解人的生老病死的秘密,AI确实能从自动驾驶汽车做到无人驾驶,这恐怕是靠互联网做不到的。前两天马云出来讲的话我非常赞同,他说AI比互联网的机会很大。现在更大的机会,不亚于互联网的机会就是大模型的机会。
最近出现哪些新的动向和趋势,技术变化很快,快到什么程度?我用了一个词,我这几年搞大模型的时候,我感觉自己度日如年。有人说你这么痛苦吗?我说度日如年,只要看全世界有多少公司、多少科技人员又研究出来什么新的人工智能突破性技术,一天的进展都看不完。但是我们看一个趋势,跟大模型出来的时候不一样,大模型刚出来的时候大家比较乐观,特别是美国几家公司,觉得我只要有无数算力,只要数据足够多,假以时日足够出来AGI,就是通用人工智能,或者超级人工智能的一个进阶版,那就意味着AI在各个方面全面超越人类,变成宇宙间、无所不懂的神。但是好像现在发现说错了,首先数据不够,互联网能弄的数据已经用完了。第二,可能在算法上碰到了一些障碍,所以难以推出来。有人说这是不是怪事?不一定。
第二,因为GPT方向碰到障碍,人工智能从原来做的快思考模式变成了慢思考模式。快思考慢思考相对来说,简单打一个比喻,好比我问你个问题,你凭自己的经验,自己的快速反应和记忆回答问题,这个问题有的时候经常有错误。人们真正的智力表现是把这个事情反复琢磨,想很多遍,找很多人讨论,这样一个复杂的过程,最后如果写一篇文章现场挥毫一就,恐怕很难写出漂亮的文章,可能一个好文章是慢思考的能力。现在人工智能全面转向这个方向,这几天谷歌发表了一个产品,主要在慢思考和推理上进行突破。
第三个趋势,大家一提人工智能被过去的宣传带歪了,认为只有无所不能才是人工智能。但其实人工智能现在的一个发展趋势,在走向专业化划分的路径,专家专到一定时候一定走专业的,所以谷歌旗下的DeepMind公司,专门设计芯片,做了阿尔法狗下围棋,还得了诺贝尔化学奖。所以我们要反思,要求一个模型写诗作画,解奥数题,给公司编软件,这是我们未来的需求吗?
第四个趋势,代表了两派不同的思想争论。有一派还要做大。马斯克花了很多钱堆10万亿卡的集群,为什么?要训练万亿和10万亿参数的模型。从另外一个方面来看,现在越来越多的大模型,还是叫大模型,小模型这个词不能乱用,但是做这种小参数的大模型,大概10亿量级以下,称为小参数大模型,为什么?大模型要上车,大模型上手机,苹果也做这事情,所以大模型现在在做轻量化。
有人说大模型越做越小,越做越专之后,能力是不是越来越弱?大模型刚开始出来的时候我们对它的认知比较粗浅,觉得越大越好,什么数据都往里灌,什么都让它学,但就跟一个人博览群书,不一定能力很强。人们现在发现模型不用特别大,能力出于知识密度和知识质量。今天给我们一个启发,互联网找到的知识不算什么高能量的知识,很多知识是藏在专业的公司和专家脑子里的。
再一个趋势,跟大家可能有关系,大模型现在从原子弹的生意变成茶叶蛋的生意了。大家不要笑,茶叶蛋大家吃得起,如果都要按造原子弹的决心造企业大模型,大模型跟我跟你可能没什么关系。所以大模型的成本感觉是自由落体,刚出来的时候买一个大模型开5000万都是便宜的,现在大模型有很多开源都可以用,价格是零,相对云厂商,包括算力价格下降了上百倍。目前,国内大模型的厂商,阿里、头条、腾讯都是以低于成本价的价格给大家提供,所以大家可以薅它们的羊毛。
大模型出来一个很重要的趋势,第一次用ChatGPT的时候,虽然感觉很牛,但它是一个聊天机器人,所以聊天机器人跟人对话可以了,但是请回企业,光动嘴不动手,干不了活,这跟企业的关系就很弱了。所以传统软件还是辅助人的工具。
2025年智能体会大行其道,是一套技术,可以把大模型包装成一个可以干活的数字员工,这是通俗的理解。我讲的大模型技术跟很多专家比起来可以忽略不计,大家为什么愿意听我讲,我可以讲得很通俗。让它走下神坛,脱下科技的外衣,每个人真正的使用,不是顶礼膜拜。所以智能体,这么说是大模型在企业、在产业里落地最重要的技术,如果没有智能体,大模型就是一个。总不能天天跟它聊天。
2023年是大模型之年,大家都在秀有什么肌肉,有什么突破。2024年大家已经意识到是大模型专业之年,开始找到场景化落地了。大模型说得很好,但感觉像玩具,不是工具,能作诗不能做事。2025年我预言Agent之年是智能体之年,企业会大量使用和部署智能体,智能体背后还是大模型。
我们可以看到大模型的产业之路怎么发展,明显分出两条路。一条是AGI之路,还是星辰大海,类似曼哈顿计划,人类的恒星,探索探索人类的超级人工智能。卷算力,卷算法,卷数据,参数越做越大,这条路跟大数人没有关系,美国玩这条路的公司就那么几家巨头,中国未来也就是几家巨头能做。
还有一条路,AGI完全平行的路,就是应用之路。放弃打造大模型,万能大模型的之年,最关键的用一个大模型解决一件事,向场景化、专业化、垂直化方向发展。美国内部也有争论,大家意识到英伟达的显卡已经买得很多了,但是并没有充分利用起来,所以现在做应用的时机到了。
这个讲过了,AGI至少100亿美金买显卡。刚训出一个模型,明天友商又训出一个更好的模型,就像西西弗斯推石头一样,停不下来。
为什么走应用之路不用卷数据、卷算力,卷参数的大小,走应用之路关键是围绕你碰到的问题和困难,一个大模型解决一个问题。就像各位招聘年轻人,招聘一个大学生不能要求什么都能干,能开车能直播带货,还能当保姆,这要求有点太高了。他就在文字方面进行培养,这个对培养人的难度就会降低很多。如果是做专业的大模型,意味着模型的数量级可以下降两级数量级,大概十亿的模型能够,意味着什么?不需要一百张卡,一千张卡,大概平常几张卡,单机单卡,企业应用规模不是很大,能够用起来。我想当年发明的超级电脑,并没有带来工业革命,70年代超级电脑被乔布斯做成了PC,才带来真正的信息革命,信息革命走进千家万户,改变了百行千业,把大模型拉下神坛。
很多人问我,用已有的例子比喻大模型,大模型到底是不是语言,是不是电力等等。大家想各种比喻。我后来觉得大模型应该是一种能力,而不是产品。大模型必须要跟一定的产品相结合,我比喻成它像一个电动机,大家买电动机吗?你不买电动机。但是真正每个人又离不开电动机,比如说电牙刷,吹风机,刮胡刀都有电动机,客户要的是刮胡刀和吹风机,不是电动机,这是我很重要的观点,大模型必须找到结合的场景,变成新的产品。
本文作者可以追加内容哦 !