周鸿祎:大模型时代的产业创新|《财经》年度对话2024
finance.sina.com.cn 2024年12月20日 21:19
2024年12月20日,360集团创始人周鸿祎在“《财经》年度对话2024:穿越变局的力量”论坛作主题演讲——大模型时代的产业创新与变革机会。以下为部分发言实录,根据现场速记整理。
周鸿祎:很高兴,我第一次来这个场所发言。因为我理解经济学家,李稻葵老师这样的大学者才有资格发言,我一个搞技术的,很多大词也不懂。刚才李老师在台上委婉地批评我了,我反思了一下,我一年到头就穿一件红衣服,我应该增加消费。其实我衣橱里有50多件红衣服,我的名字老被叫错,老叫周鸿伟,所以我穿红衣服,李老师叫我鸿祎就好。
我分享对大模型的看法,最近有很多争论。
第一, 不知道在座的各位对大模型怎么看,现在有很多争论,有人至今认为这是一个泡沫,也有人认为是一种技术,元宇宙,WEB3喧嚣一时,证明时机不对,谈AI这件事最重要的是有一个认知,说严肃点,有没有信仰,相不相信这件事。
相不相信AI是真智能,突破了原来人工智能的局限性。到底人工智能能影响多少行业,走多远?相信不相信是工业革命,如果是工业革命,这个技术定位很高了,无论做什么行业都可能会改变你的行业。
网上很多人散播焦虑,争论说到底什么岗位最终被AI淘汰,我倒觉得这个还不清楚,因为争论很多。但是有一点未来可能不拥抱AI、不理解AI,不掌握AI的个人和单位可能会被用AI的淘汰。所以有一些企业家,包括成功的企业家,面对新生事物的时候,往往容易刚开始看不清。传统业务太成功了,看不起新出来的技术。因为有这种心态,因为看不起,所以没有仔细研究,也看不懂,有一天想抓机会的时候就看不见了。
其实,国家今年政府报告里讲人工智能+行动,大家提到的打造新质生产力,主要的科技创新是数字化技术,数字化技术今天宏观上恰恰是人工智能。所以,我对人工智能大模型研究,大模型是最好的抓手,打造新质生产力的关键支撑技术。这么说,它给我们每个人赋能,让每个人具有超级能力,也会重新改变所有企业的运作和工作方式,它和计算机互联网一样是一种根本性的技术。
也有人喜欢拿互联网过去成功的经验看AI,互联网和AI非常不一样,最大的不一样在于互联网是一个改变连接关系的东西,改变人和人的连接,改变人和信息的连接,创造了很多商业模式的创新。但是互联网不是那么直接赋能生产力的技术,所以美国一个创始人讲过一个笑话,本来科技发展这么多年能得到一个能飞的汽车,结果我们得到了一个140字的推特。推特当然也很牛。
“AI的生产力属性非常强”
但是和真正的科技进步比起来,AI的生产力属性非常强,比如说AI确实能帮助人们研制新药,破解人的生老病死的秘密,AI确实能从自动驾驶汽车做到无人驾驶,这恐怕是靠互联网做不到的。前两天马云出来讲的话我非常赞同,他说AI比互联网的机会很大。现在更大的机会,不亚于互联网的机会就是大模型的机会。
最近出现哪些新的动向和趋势,技术变化很快,快到什么程度?我用了一个词,我这几年搞大模型的时候,我感觉自己度日如年。有人说你这么痛苦吗?我说度日如年,只要看全世界有多少公司、多少科技人员又研究出来什么新的人工智能突破性技术,一天的进展都看不完。但是我们看一个趋势,跟大模型出来的时候不一样,大模型刚出来的时候大家比较乐观,特别是美国几家公司,觉得我只要有无数算力,只要数据足够多,假以时日足够出来AGI,就是通用人工智能,或者超级人工智能的一个进阶版,那就意味着AI在各个方面全面超越人类,变成宇宙间、无所不懂的神。但是好像现在发现说错了,首先数据不够,互联网能弄的数据已经用完了。第二,可能在算法上碰到了一些障碍,所以难以推出来。有人说这是不是怪事?不一定。
第二,因为GPT方向碰到障碍,人工智能从原来做的快思考模式变成了慢思考模式。快思考慢思考相对来说,简单打一个比喻,好比我问你个问题,你凭自己的经验,自己的快速反应和记忆回答问题,这个问题有的时候经常有错误。人们真正的智力表现是把这个事情反复琢磨,想很多遍,找很多人讨论,这样一个复杂的过程,最后如果写一篇文章现场挥毫一就,恐怕很难写出漂亮的文章,可能一个好文章是慢思考的能力。现在人工智能全面转向这个方向,这几天谷歌发表了一个产品,主要在慢思考和推理上进行突破。
第三个趋势,大家一提人工智能被过去的宣传带歪了,认为只有无所不能才是人工智能。但其实人工智能现在的一个发展趋势,在走向专业化划分的路径,专家专到一定时候一定走专业的,所以谷歌旗下的DeepMind公司,专门设计芯片,做了阿尔法狗下围棋,还得了诺贝尔化学奖。所以我们要反思,要求一个模型写诗作画,解奥数题,给公司编软件,这是我们未来的需求吗?
第四个趋势,代表了两派不同的思想争论。有一派还要做大。马斯克花了很多钱堆10万亿卡的集群,为什么?要训练万亿和10万亿参数的模型。从另外一个方面来看,现在越来越多的大模型,还是叫大模型,小模型这个词不能乱用,但是做这种小参数的大模型,大概10亿量级以下,称为小参数大模型,为什么?大模型要上车,大模型上手机,苹果也做这事情,所以大模型现在在做轻量化。
有人说大模型越做越小,越做越专之后,能力是不是越来越弱?大模型刚开始出来的时候我们对它的认知比较粗浅,觉得越大越好,什么数据都往里灌,什么都让它学,但就跟一个人博览群书,不一定能力很强。人们现在发现模型不用特别大,能力出于知识密度和知识质量。今天给我们一个启发,互联网找到的知识不算什么高能量的知识,很多知识是藏在专业的公司和专家脑子里的。
再一个趋势,跟大家可能有关系,大模型现在从原子弹的生意变成茶叶蛋的生意了。大家不要笑,茶叶蛋大家吃得起,如果都要按造原子弹的决心造企业大模型,大模型跟我跟你可能没什么关系。所以大模型的成本感觉是自由落体,刚出来的时候买一个大模型开5000万都是便宜的,现在大模型有很多开源都可以用,价格是零,相对云厂商,包括算力价格下降了上百倍。目前,国内大模型的厂商,阿里、头条、腾讯都是以低于成本价的价格给大家提供,所以大家可以薅它们的羊毛。
大模型出来一个很重要的趋势,第一次用ChatGPT的时候,虽然感觉很牛,但它是一个聊天机器人,所以聊天机器人跟人对话可以了,但是请回企业,光动嘴不动手,干不了活,这跟企业的关系就很弱了。所以传统软件还是辅助人的工具。
2025年智能体会大行其道,是一套技术,可以把大模型包装成一个可以干活的数字员工,这是通俗的理解。我讲的大模型技术跟很多专家比起来可以忽略不计,大家为什么愿意听我讲,我可以讲得很通俗。让它走下神坛,脱下科技的外衣,每个人真正的使用,不是顶礼膜拜。所以智能体,这么说是大模型在企业、在产业里落地最重要的技术,如果没有智能体,大模型就是一个。总不能天天跟它聊天。
2023年是大模型之年,大家都在秀有什么肌肉,有什么突破。2024年大家已经意识到是大模型专业之年,开始找到场景化落地了。大模型说得很好,但感觉像玩具,不是工具,能作诗不能做事。2025年我预言Agent之年是智能体之年,企业会大量使用和部署智能体,智能体背后还是大模型。
我们可以看到大模型的产业之路怎么发展,明显分出两条路。一条是AGI之路,还是星辰大海,类似曼哈顿计划,人类的恒星,探索探索人类的超级人工智能。卷算力,卷算法,卷数据,参数越做越大,这条路跟大数人没有关系,美国玩这条路的公司就那么几家巨头,中国未来也就是几家巨头能做。
还有一条路,AGI完全平行的路,就是应用之路。放弃打造大模型,万能大模型的之年,最关键的用一个大模型解决一件事,向场景化、专业化、垂直化方向发展。美国内部也有争论,大家意识到英伟达的显卡已经买得很多了,但是并没有充分利用起来,所以现在做应用的时机到了。
这个讲过了,AGI至少100亿美金买显卡。刚训出一个模型,明天友商又训出一个更好的模型,就像西西弗斯推石头一样,停不下来。
为什么走应用之路不用卷数据、卷算力,卷参数的大小,走应用之路关键是围绕你碰到的问题和困难,一个大模型解决一个问题。就像各位招聘年轻人,招聘一个大学生不能要求什么都能干,能开车能直播带货,还能当保姆,这要求有点太高了。他就在文字方面进行培养,这个对培养人的难度就会降低很多。如果是做专业的大模型,意味着模型的数量级可以下降两级数量级,大概十亿的模型能够,意味着什么?不需要一百张卡,一千张卡,大概平常几张卡,单机单卡,企业应用规模不是很大,能够用起来。我想当年发明的超级电脑,并没有带来工业革命,70年代超级电脑被乔布斯做成了PC,才带来真正的信息革命,信息革命走进千家万户,改变了百行千业,把大模型拉下神坛。
很多人问我,用已有的例子比喻大模型,大模型到底是不是语言,是不是电力等等。大家想各种比喻。我后来觉得大模型应该是一种能力,而不是产品。大模型必须要跟一定的产品相结合,我比喻成它像一个电动机,大家买电动机吗?你不买电动机。但是真正每个人又离不开电动机,比如说电牙刷,吹风机,刮胡刀都有电动机,客户要的是刮胡刀和吹风机,不是电动机,这是我很重要的观点,大模型必须找到结合的场景,变成新的产品。
大模型的六大应用方向
我们自己总结的不一定对,因为对于大模型是盲人摸象,每个人从不同的角度讲,大模型的能力做分割。因为各大互联网公司介绍大模型的时候,大家比较容易集中在它的头两层、头三层能力。比如,第一层是文字语言的能力,阅读、写作。第二层是创意能力,大模型产生的视频、音乐、图片,几可乱真,达到人类同样的水平。第三,多模态能力非常重要。大模型不仅理解文字,还能听得懂看得懂,不是看见什么,比如就像我一看见刘建宏,就想起中国足球,这不是一个笑话。但是,大家对大模型的业务能力关注比较少,所以我也想在座的都是企业家、投资家,大家肯定关注大模型跟企业业务结合有很多能力,如何帮助企业更好地处理大数据。我有一句话,大模型会激活今天所有拥有数据的潜力,你想如果大数据像石油一样,直接用很困难,大模型可能像冶炼厂一样,真正把它的价值发挥出来,包括企业里面的知识管理,企业里面业务的再造。还有两个能力:是创新能力和科技能力。
我们建议了六个方向:
第一,人人智能。也就是说AI对人的作用,我觉得还是工具属性,是正向的,所以大模型不是用来淘汰某些人,而是提升每个人的生产力。有了大模型以后,每个人都有可能成为超人。为什么最近国外一直谈一人公司或者小团队比较流行?有了大模型以后,很多人的能力,比如原来刘建宏不会编软件,现在可以让AI替他写代码了。有人不会做宣传,但是现在大模型可以替他写文章了。所以,我们做的纳米AI搜索,帮助个人使用大模型的能力,提高他获得表达的能力,这个市场很大而且可以分得很细致。
第二,万物智能。我们知道万物互联的概念,它不是目的,还是手段。互联之后,大模型有大有小,有强有弱;小模型可以部署在终端上,部署在硬件上。大模型部署在云端或者边缘侧,大小模型合起来可以达到什么目的?不仅这两年苹果手机谈中国的,之前用Siri,那哪叫人工智能?叫人工。有了大模型以后,Siri变成人工智能。万物智能意味着什么,看到所有的硬件以后都有智能。想想很可怕,刘建宏半夜起来打开冰箱,扫地机器人打招呼说不要偷喝啤酒了。因为有大模型之后,有了多模态语言的能力,就意味着你们家所有东西跟你交流,能够识别你的指令。
再举两个例子,比如说苹果和脸书花了很多钱做AR眼镜,到今天也不算成功,苹果的Vision pro也做不下来,到现在眼镜不再跟AR结合,跟AI结合。比如现在做一个眼镜,我见到那个人,凝视它三秒钟,自动告诉我他叫刘建宏。其实我不认识刘建宏,我看桌上的名牌才知道他叫刘建宏。所以在大模型的作用下,原来做不了的虚拟现实和元宇宙,倒有可能变成现实。
第三,数转智改。传统产业的数转智改,通用大模型作为个人生产力提升还是可以的,但是如果大模型真跟企业内部业务紧密结合,真正在企业内部干活,变成数字专家、数字顾问。我觉得通用大模型不行,因为没有你的专业知识,没有行业领域知识,而且还有数据丢失的隐患。所以企业需要的是什么?企业也需要有人能够做营销,做各种图片视频,但是企业最重要的是自己的核心业务需求和业务流程,能够用得上大模型和智能体。所以企业用大模型的关键,我觉得是找场景。因为问题的关键是找到关键的问题,关键的问题是找场景,就是说不要试图去做一个通用、万能大模型,解决企业内部的所有问题,而是在企业内部的业务流程,或者是对外的服务产品体系上,从领导的需求到基层员工的需求里面去找卡点和堵点,能够怎么验证这个卡点和堵点呢?过去我想干,但是我技术干不了的事情,过去想解决但是技术上解决不了的问题。现在有了人工智能,有了大模型就能解决了,一个标志是能提高10倍的体验,提高10倍的效率或者降低10倍的成本,减少10倍的人力。所以我讲为什么大家要学大模型,大模型有的老板说我有钱,你给我搞一套大模型就可以了。有些技术,像云计算、大数据可以这么干,但是人工智能在企业用得好,这个企业从老板到高管到业务骨干,到基层员工都要对AI有一个基本的了解,因为决定AI怎么用,是需要业务进行指导。
我举两个例子,场景分得足够细,这样才知道应该有什么样的专业模型解决问题,也有企业家找我,上来说给我打造一个养猪大模型,我一句话怼回去了,我说解决什么问题?猪有什么痛点和刚需吗?也有企业找我,某省钢铁企业上来说,我们要做一个钢铁大模型,我一直问他我对钢铁一窍不通,你能告诉我钢铁有什么问题,分解了一下,分解了142个场景,不一定是142个模型,至少需要142个智能体。
我是做医美,做教育的,做什么,做体育直播的,请问我们怎么用大模型?我也回答不出来。你自己分解你的业务。
再举个例子,这个例子更简单一点,斯坦福医学院跟创业公司合作,并没有做给人看病。完整的医疗康养大模型,这种概念听得很多,他们找了三个堵点,所有病人看病都是由社区医生,家庭医生发传真,手写情况介绍的方式发到医院,医院每天有一堆人看传真。第二,医院打电话跟病人确定看病的时间,不是你想看就看的。第三,美国有一个挑战,跟保险公司写很好的报告,保险公司才能降低拒赔率,报销报告很重要,这是专业的保险和税务专家在做。所以用了三个大模型做了三个智能体,一个专门解决看传真,多模态的能力意味着人工智能能看懂所有你想给它看的对象。比如说纳米AI搜索,我对着药盒拍一下它就告诉我是什么药、有什么禁忌,一天吃几次药。它视觉能力非常强,读出来之后自动加到数据库,有数百人接传真的队伍,这个人力省出来。第二,跟客户聊天,让客户舒服挺难做到的,数字技术、云合成技术只是打电话,确认几点钟星期几看病,这个没问题。第三也很容易解决,医院里积累了几十万份给保险公司的报告,拿这个报告依葫芦画瓢,给病历写容易通过保险公司赔偿的报告。只要你找好场景找好卡点,大模型今天的能力不需要等到超级人工智能,都能干的。
本文作者可以追加内容哦 !