上海人工智能实验室领军科学家、上海创智学院副院长乔宇,在2025中国信通院深度观察报告会华东分会场上解读了大模型的“上半时”,预测了大模型的“下半时”。

大模型,从“小而美”开始

在新一轮人工智能的发展浪潮中,深度学习方法无疑起到了核心的推动作用。

自2010年起,深度神经网络迎来了重要的技术突破,这一时期,科研工作者们主要集中在构建针对特定任务的专用模型上,这些“小模型”能够高效地完成如人脸识别、物体检测及智能交通等领域的具体工作,但它们的功能相对单一,专注于解决某一类问题。

“在最初的10年我们最重要是在端到端做专用模型,也就是大家现在说的很多小模型,它只会干一件事情。”乔宇说。

随着时光步入2020年,人工智能领域迎来了一个转折点——GPT-3的问世。作为大模型的里程碑式成果,GPT-3不仅展示了通过扩展模型规模(包括参数数量和训练数据量)来实现所谓的“智能涌现”的可能性,而且为通向通用人工智能(AGI)开辟了一条全新的路径。

“当我扩大模型的规模,包括参数规模、训练数据规模的时候,这个模型就具有了‘智能涌现’能力,所谓‘智能涌现’在我看来就是训练的时候不会的任务,在测试的时候你Promote一下它好像什么都会做了。”乔宇表示。

通用人工智能,这个曾经在学术界缺乏统一定义的概念,在过去多年间鲜少被提及,主要是因为当时的技术条件尚未成熟,无法支撑起对于真正意义上的人工智能的整体实现。

传统观念中的AI往往是将人类的认知能力分解为视觉、语言、听觉等多个独立模块分别进行模拟,而真正的AGI应当是一个有机的整体,它能够像人一样综合运用各种感官和认知能力来理解和应对复杂的世界。

“AGI并不是新词汇,大家想起来在5年前、10年前我们很少谈这个词,主要两个原因:一是学术上对AGI并没有绝对明确的统一定义;二是那时候我们并没有实现AGI大家公认技术路线。”乔宇补充道。

GPT-3的出现以及随后ChatGPT对公众的广泛推广,标志着我们正逐步接近这一理想状态,同时也引起了产业界与政府部门的高度关注。“这件事情背后重要性就开辟了一条发展通用人工智能AGI的重要路线。”

“大力出奇迹”的模型路线还将延续

在新一轮人工智能发展的浪潮中,乔宇指出两大趋势将深刻影响未来的AI技术路径。

首先,随着“Scaling Law”(规模法则)的持续推进,即通过增加模型规模和算力投入来实现性能提升的大模型路线,将继续引领行业发展。“大力出奇迹”的理念使得模型越大、算力越多,效果就越好。“这条路线还会再延续。”

但是,乔宇也强调了这条路线面临的挑战:“这么大的算力不仅意味着巨大的经济投入,其能耗问题同样不容忽视。”他进一步解释道,“随着模型规模的不断扩大,能源消耗成为制约其可持续发展的重要因素。因此,如何在保持高性能的同时降耗,成为了亟待解决的问题。”

第二个趋势是关于大模型的可信性和安全性。乔宇提到,“大模型的可信、安全以及可解释性一直没有得到很好的解决。”尽管大模型在多种任务上表现出色,但在实际应用中,它们往往显得“通而不专”,即在外行看来像内行,但内行使用时却发现其表现并不稳定,难以作为可靠的生产力工具。

“现在大模型往往是通而不专,外行看起来像内行,内行用起来又像外行不能很稳定应用影响落地。”这一现象限制了大模型在专业领域的广泛应用。

针对上述挑战,乔宇认为,两条路线之间并非竞争或替代的关系,而是互补共生。“我们不是要回到传统的逻辑、符号计算去代替大模型,而是利用这些传统技术所研发出来的模型和能力,来解决大模型当前发展中的瓶颈。”他提出,结合传统技术与大模型的优势,将是未来AI发展的重要路径。“我认为两条路线的结合是未来重要发展路径。”

“具身智能“将是未来重要的增长点

乔宇指出,多模态模型之后,具身智能将成为未来重要的增长点。具身智能的发展不仅仅是多模态大模型的延伸,更是通过与人形机器人等物理智能体的结合,帮助我们解决现实世界生产生活中的各种问题,从而大大拓宽通用人工智能(AGI)技术的应用边界。

乔宇进一步解释了人工智能发展路径的独特性:“我们可以看到,人工智能的发展是从语言到多模态再到具身,而生命智能的发展实际上走了一条相反的路线。”

乔宇提出了一个引人深思的问题:“为什么我们现在的人工智能发展路径与生物智能的发展路径恰好相反?”

他认为,核心要素在于数据。“数据和算力是驱动人工智能发展的重要因素,我们现在能够掌握的大规模、高质量数据最多的是文本,这得益于互联网的发展。”

他解释道,“其次是图像和视频,虽然数据量很大,但分布不均匀,质量参差不齐,因此相对而言要差一些。至于具身智能,由于受制于传感器等技术限制,数据获取更加困难。”

乔宇强调,数据的储备量和可获取程度在很大程度上决定了当前人工智能发展的技术路线。“正是因为我们拥有丰富的文本数据,使得自然语言处理取得了显著进展;而随着图像和视频数据的质量不断提升,多模态模型也逐渐崭露头角。”

然而,具身智能的发展仍面临诸多挑战,如传感器技术和数据采集的局限性,这些都需要进一步突破。

展望未来,乔宇认为,具身智能将是人工智能发展的下一个重要阶段。“通过将AI与物理智能体相结合,我们可以创造出更加智能化的机器人,它们不仅能够在复杂的环境中自主行动,还能与人类进行有效的互动和协作。”

最后,乔宇表示,这不仅是技术的进步,更是对人类社会生产力的一次革命。“我们期待着具身智能能够为各个领域带来更多的创新和变革,推动人工智能进入一个全新的时代。”

追加内容

本文作者可以追加内容哦 !