$中科曙光(SH603019)$  21世纪经济报道记者孔海丽 北京报道


“人工智能有60多年的历史,大模型有6年的历史,也就占整个人工智能的发展历史的1/10,但这1/10才是真正的革命,AI认知智能、机器智能开始有真正的突破。”7月9日,智源人工智能研究院理事长、北京大学教授黄铁军在2024(第二十三届)中国互联网大会上表示,本轮以ChatGPT大模型为代表的人工智能热潮,真正将“智能”推上了新的高度。


黄铁军认为,大模型开启了一个新的时代:“能够把数据转换成智能,让智力资源像水、电资源一样流通,并且服务于社会的时代。”


“大模型”是人工智能的最新进程

“大模型是一个大型的人工神经网络,人工智能底层逻辑的突破路线,就是化用人类由大量神经元连接在一起的神经网络的概念。”黄铁军详细阐述了大模型实现智能的路径。


“生物的智能,是指我们适应环境的能力,它是对环境的某种表达和凝练,或者是映射,智能都是有具体意义的,就是人在什么环境下,具有什么样的行为,遇到挑战应该怎么去应对。”他以生物智能类比指出,人工智能的本质就是知道下一步应该作出正确的选择,实现高质量的预测。


回顾人工智能技术发展,黄铁军认为,2013年出现的词向量技术为transformer架构打下了基础。他解释说,词向量技术将语言中的每个词、每个概念都用高维向量位置来表示,这个位置决定了每个词跟其他词之间的关系。人工智能的语义是由词向量直接表示出来的。黄铁军以“人的本质是一切社会关系的总和”类比表示,对人工智能来说,理解一个词就是在大量的语料中理解词与词之间的关系。


在黄铁军看来,ChatGPT是大模型中最有代表性的,它不是个单纯的翻译模型,而是一个统计海量语料的语义模型,所以GPT需要巨大的算力维护,这就涉及大模型的三个特征。


一是其规模大,需要海量的数据喂养;二是涌现性,随着模型的规模不断变大,产生出许多预料之外的能力,比如原来只能做一些语言的摘要理解、翻译,而现在可以代替编程,可以做数学题,可以做逻辑推理,可以有人类常识等等;三是通用性,并不限于专门问题或领域。“这是一个大型神经网络经过海量数据训练之后自发产生的能力,这些能力并不是人类设计出来的,是大模型自身从海量的数据中学到并掌握,然后具备的能力。”黄铁军说。


“所以这是一次革命,不是靠人工灌输出来的,而是通过海量数据训练能够掌握的学习能力,并且随着规模的扩大,能力越来越强。”黄铁军表示。


大模型加速“智力时代”来临

“大模型不仅是一个产品,更是意味着一个新的时代,这个时代能够把数据转换成智能,或者是更准确地讲转化成智力,并为全社会服务。”黄铁军表示,“智力资源”的流通,会成为既定的产业趋势,他持有乐观预测,认为“2030年之前每个人都能以较低的成本使用“智力资源”,就像用电、用网一样方便。”


黄铁军分析,界定新时代的到来应该以智力基础设施为标志,而非原先提到的信息化、网络化、数字化这些信息基础设施、网络基础设施、算力基础设施。


对于人工智能大模型的未来发展路线,黄铁军认为,未来3年,大模型将扩展到视觉、听觉、具身、行动等通用智能,规模变大,尺寸变小,成为具身智能的“大脑”,普通语言升级为科学语言,人工智能将解决重大科学问题;未来10年,人类全面进入智力时代,就像工业革命解放体力、电力革命解决能源流通,以智力为核心的科技、经济、社会生态构建完成;未来20年,行为主义(强化学习)和类脑智能(彻底连接主义)发挥更大作用。

追加内容

本文作者可以追加内容哦 !