北京大学计算机学院教授、北京智源人工智能研究院院长 黄铁军

人工智能这个概念自1956年提出以后,经历了将近70年的发展历程,也衍生出符号主义、连接主义和行为主义三大流派,最终走向类脑的目标。

经过六七十年的发展,人工智能发展出三条技术路线。

第一条是符号主义,也就是把智能形式化、符号化、算法化和软件化。这也是人工智能最早也是最主要的技术路线,虽然有一定效果,但并没有真正成功。

第二条路线是连接主义,或者叫神经网络学派,它的理念是人的智能不可能用一种形式化的方法表达出来,于是就构造了一个神经系统,并且训练它,这样智能就被做出来了。

第三条是行为主义。这个学派认为智能来源于主体与环境的互动,地球上本来没有智能,后来产生了有机物,有机物跟环境互动产生了细胞,才产生了后来的神经元,才有了智能。

人工智能的发展进入到20世纪80年代之后,就进入了所谓的学习期,这个学习期包含了神经网络和现在流行的深度学习。其中比较重要的是1985年提出的BP神经网络模型,到了2006年,Geoffrey Hinton在《Science》发表了关于深度神经网络的论文,包含神经网络和机器学习的深度学习开始登场。

深度学习与数据和算力结合,开始产生信息模型。在2012年至2018年之间,模型成为了AI研究和产业的中心。这之后,随着被用于训练参数(数据)的提升,具备规模大、涌现性和通用性特点的大模型,正式出现了。

通向AGI

到了现在,业界普遍认同人工智能接下来的发展,将会从通用人工智能(GAI)走向人工通用智能(AGI),或者说超人智能、强人工智能。

真正引起业界关注的大模型是OpenAI的ChatGPT。OpenAI一直定位于以人工通用智能(AGI)为最终目标,并保持开放合作,并且提出了广泛造福社会、关注长远安全问题、引领技术研究、保持合作意愿等四大原则。在2015年至2018年之间,OpenAI通过布局视觉/多模态、语言、语音、强化学习、多智体技术、机械控制、安全与可解释性等领域,一直在探索可能的AGI路径。到了2019年,OpenAI开始聚焦大模型。

OpenAI的ChatGPT的基本原理,是依托海量训练数据,大规模算力,及强大基础语言模型。发展到GPT3.5时,形成领先优势。此时被用于训练的参数已经达到了1750亿,“涌现”出强大的智能表现,具备人类“无中生有”的原创能力。2022年11月,生成式AI颠覆世界的时代正式开始,而此时,GPT-5也已在研发之中。

大模型时代

大模型已成为全球竞争热点,一个大模型时代已经到来。

1994年网景(NetscapeNavigator)浏览器的出现,使大众上网变成了可能,互联网时代才真正到来。到2007年苹果推出iPhone手机,大量智能手机应用程序出现,移动互联网时代才真正到来。而2022年11月30日,OpenAI面向公众开放ChatGPT服务,人工智能从技术圈走向全民讨论,迎来了人工智能的网景/iPhone时刻。

大模型具备三个特点:规模大,需达到百亿参数级别;涌现性,能够产生预料之外的新能力;通用性,不限于专门问题或者领域。由于这三个特点的存在,以ChatGPT为例,ChatGPT采用“人类反馈的强化学习(RLHF)”方法,这使得ChatGPT能够理解和遵循人类指令,输出符合人类偏好的内容,这种特点使它适用于广大的应用领域。

GPT知识空间里,参数达到数百亿规模的复杂系统涌现现象“融会贯通”,虽然尚不可解释,但是确实存在。ChatGPT在多项考试中表现超过人类水平,具备能够根据纯文字说明,具备生成图像或草图的整合能力,也拥有高等数学/复杂数学问题求解的数学能力。GPT-4则大幅降低幻觉率,而据估算,当幻觉率达到5%以内,接近人类水平(保守),就可作为大模型规模商用落地的基准幻觉率。

人工智能生态包括基础软硬件、基础模型和创新应用三个层次。人工智能基础模型能够支撑赋智经济与社会各类应用,也将带动基础软硬件智算体系的发展。

从当前的产业现状来看,超大规模智能模型生态在全球屈指可数,其原因是受制于应用、数据量、算力、算法等因素。谷歌由于掌握核心专利、搜索引擎积累的海量数据、通过Android能够更好地服务移动用户等原因,而走在了前列。当成为大模型标志,接受了微软投资之后,OpenAI也脱颖而出。谁会是世界上大模型第三强呢?恐怕接下来比拼的就是生态,因此,人工智能之争最终是生态之争。

对于CIO们来说,2000年以前是信息(Information)时代,2020年以前是网络(Internet)时代,而2020年以后就属于智能(Intelligence)时代了。因此,CIO们接下来需要关注两个人工智能的重大转变,首先是从信息智能到实体智能,其次是从“静态融通”到“动态涌现”,未来有望通过类脑智能实现真正的AGI。

今天,ChatGPT有强大的智能,影响深远。未来3年,除了语言,大模型正在迅速扩展视觉、听觉、具身、行动等通用智能,影响将更大。未来10年,智力革命已经打响,就像工业革命解放体力,就像电力革命解决能源流通,智力革命将是全新生态的构建,开源开放生态终将胜利。未来20年,ChatGPT是数据驱动的静态智能,未来是时空环境驱动的具体智能,智能载体不是今天的人工神经网络,而是类脑的脉冲神经网络。到2045年,还会出现结构仿脑、功能类脑、性能超脑的超人“电子大脑”。

追加内容

本文作者可以追加内容哦 !