大家好,我是富荣福锦混合的基金经理毛运宏。

 

当机器人出现在各大卫视跨年晚会,越来越多的出现在我们视野中,大家开始憧憬机器人进入工厂打工,进入家庭做家务甚至去外太空建设人类的第二家园的各种未来场景。确实,从需求端看,具身智能机器人的未来是数万亿的产业,是星辰大海。

 

不过,我们好像很少从供给端看这个产业,去思考人工智能这项技术的能力边界是否包含着我们所憧憬的星辰大海万亿产业,具身智能技术是否能够发展到让机器人好用到足以改变社会生产曲线的地步。

 

在此次专题连载中,我们希望通过对技术底层的探索来给出我们的回答,更准确地说,给出我们关于具身智能机器人的未来的目前看起来较为合理的版本。(内容可能涉及以下著作所提到的事实或者观点:《AI 3.0》梅拉妮·米歇尔,《数学之美》,吴军;以及以下人士的公开采访和演讲:陈建宇(星动纪元创始人),Sergey Levine (Physical Intelligence) ),我们可能不会对技术细节作太多展开,也不敢保证对所有技术细节的讲述都是准确的,我们会将注意力更多集中在技术的底层逻辑上。

 

 

第一章:“智能”的开始——感知机与手写数字

 

体感上,站在高速行驶的火车车厢中往前方打一束光和站在地上静止不动同时往前方打一束光,前者的速度应该更大,也应该更快地运动完同样的一段距离,但后来科学家发现这两束光的速度实际上是相同的,光速和光源的初速度无关,而是一个常数。

 

基于此,爱因斯坦提出狭义相对论,严密地推导出了宇宙中有静止质量的物体的速度上限就是真空中的光速这一结论,高屋建瓴地发现了宇宙中的速度边界。

 

而相对论的创见和贡献远不止于此,我想指出的是,很多时候我们怀着纯粹的好奇心探索一件事情的边界的过程往往会大大加深我们对于这件事情的理解,从而得到重要的阶段性结论。

 

这也是我想要探索具身智能技术的能力边界的出发点,而且,技术的边界内是否存在着足够大的产业未来也是投资上一个绕不开且需要不断修正的课题。

 

我想,我们的这一段旅程可以从感知机开始。

 

试想一下,如何让机器识别人类手写的数字呢?

 

比如说手写的数字6,每个人的写法有差异,就连同一个人每一次写出来的数字6也不是完全一样的,我们很难用编程写下规则的方式去告诉机器什么样的图形是人类写出来的6,什么样的不是。

 

20世纪50年代,美国的计算机科学家弗兰克·罗森布拉特提出了感知机的概念和理论基础并且在1960年建造了名为Mark I的可以通过试错来学习的机器,开创了机器学习的新范式。

 

让我们来看看感知机是如何识别手写数字6的:


首先,我们把一张图片划分成18x19,也就是342个格子,或者其他足够多的格子数都可以,只要数量多到让每一个格子看起来就是一个单纯的像素就可以。

 

然后我们规定在黑白图像中纯白色格子的像素强度是255 ,纯黑色格子的像素强度是0(从晶体管的角度,为了方便理解我们可以理解成8根晶体管排列起来就可以表示0-255这256个数字,因为在二进制中最大的8位数是十进制的255,而计算机是二进制)。

 

于是,这个用于识别手写数字的感知机就有了342个输入,每一个输入是对应格子的像素强度。我们再用随机数生成器生成342个权重值对应给每一个输入,以及一个阈值,这个感知机没有任何对于其需要执行的任务的明确的规则描述,只有一套算法逻辑,即:当每一个输入值乘以其对应的权重得到的数值累加的和大于阈值时,它便输出1,表示这是一个数字6,否则便输出0,表示这不是一个数字6。

 

由于权重值和阈值一开始都是随机生成的,所以这个感知机会识别错。紧接着,我们用标注好的样本进行监督学习,也就是告诉感知机它哪张图识别对了,哪张图识别错了,为了方便理解,我们可以简单理解成:如果识别对了就不调整权重值和阈值,如果识别错了就自行调整权重值和阈值,直到识别正确。(这个自行调整的算法叫做反向传播算法,也是人工智能的算法基础,我们会在下一章介绍,这里我们暂且假设并且接受这一套算法是有效且成熟的即可。)

 

通过反向传播,权重值会集中在数字6的边缘区域,而在这个图片的四个角的白域的格子的权重值在训练后会变得很小或者说接近0,否则的话,这些区域的输入值本来就很大,如果再乘以一个很大的权重值,那么得数累加起来就会“轻易地”超过阈值,而其他手写数字的图片也会同样有这些白色的“共性区域”,也就意味着如果这些区域的权重值很大,那么无论面对什么数字感知机都会输出1从而认为那是一个6。

 

换句话说,这个感知机要能正确识别出6,必然要对6这个数字的边缘的区域(也正是6和其他数字不同的特征区域)异常敏感,那些区域的一点点的灰度都能通过乘以一个很大的权重从而得到一个显著的乘积,而对6这个数字和其他任何数字都共有的共同区域异常不敏感,那些区域无论多高的像素强度都得不到感知机的关注,从而得到的乘积等于0或者接近0。

 

至此,感知机的逻辑和架构基本成型,人工智能靠反向传播调参数(权重值)来训练和学习的方式从此奠定。

 

我理解,现在的人工智能之所以常常被人说成是黑盒,可能就是因为我们不习惯这种不是直接求出确切的权重值,而是让算法自己去寻找更合适的权重值的解决问题的方法,但我想这并不是严格意义上的黑盒,毕竟我们是很清楚它每一步都在做什么的。

 

计算机只是通过不断比对自己的输出和真实答案,从而反向传播不断修改或者说优化自己的权重参数,使得算法能够更加贴近人类手写一个数字的习惯和特征,以及人类认为怎样的特征能够将一个图形定义为数字6,尽管那样的特征人类自己并不能很好地用语言表达出来。

 

值得一提的是,提出感知机概念的罗森布拉特不仅是一位计算机科学家,还是一位心理学家和神经科学家,他提出感知机的架构也受到了人类大脑神经元运作方式的启发,这是一次伟大的触类旁通,就像现在我们发现机器人的预训练质量和数量能够提升其在垂类任务上的表现上限一样,似乎碳基和硅基生物确实存在不少的成长相似度,这也让我们对于人工智能和具身智能的能力边界产生了更浓厚的好奇。

 

下一章,我将尝试介绍反向传播算法,从数学的角度解构人工智能,我认为那将是我们探索这个边界的重要一步。

 

注:1.富荣福锦混合成立于2018年3月16日,于2021年4月19日增加存托凭证投资范围和投资策略,R4(中高风险)。基金经理任职期:胡长虹(2018.03.16-2018.11.26)、邓宇翔(2018.03.30-2024.06.24)、李天翔(2024.06.07-2025.02.19)、李延峥(2024.08.28-2025.11.18)、毛运宏(2025.05.29-至今)。

2.基金经理关注方向仅以当前市场情况判断,不必然代表当前或未来的投资方向。

风险提示:1、本材料中的信息均来源于我们认为可靠的已公开资料,但本公司及研究人员对这些信息的准确性和完整性不作任何保证,也不保证本材料所包含的信息或建议在本材料发出后不会发生任何变更,且本材料仅反映发布时的资料、观点和预测,可能在随后会作出调整。2、材料中的资料、观点和预测等仅供参考,在任何时候均不构成对任何人的个人推荐。市场有风险,投资需谨慎。3、基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,基金的过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩并不构成本基金业绩表现的保证。基金管理人不保证基金一定盈利,也不保证最低收益。基金管理人提醒投资人基金投资的“买者自负”原则,投资人在投资基金前应认真阅读《基金合同》、《招募说明书》和《产品资料概要》等基金法律文件,全面认识基金产品的风险收益特征,在了解产品情况及听取销售机构适当性意见的基础上,根据自身的风险承受能力、投资期限和投资目标,对基金投资作出独立决策,选择合适的基金产品。在做出投资决策后,基金运营状况与基金净值变化引致的投资风险,由投资人自行负担。我国基金运作时间较短,不能反映证券市场发展的所有阶段。4、文中提及行业仅为市场行情分析与逻辑解读,不代表基金管理人和基金目前或未来的投资方向。

追加内容

本文作者可以追加内容哦 !