一、发布通用机器人模型 RVT - 2
2024 年 12 月 30 日,英伟达正式推出通用机器人模型 RVT - 2。该模型具备诸多显著特性:
性能显著提升
相较于第一代 RVT,RVT - 2 在训练效率和推理速度上实现了大幅飞跃。在相同的计算资源条件下,训练效率提升至原来的 6 倍,每天处理样本数量从 240 万(2.4M)增加到 1600 万(16M);推理速度加快 2 倍,从 11.6 帧每秒(fps)提升至 20.6 帧每秒(fps)。
学习能力增强
RVT - 2 展现出强大的学习能力,仅需 10 次任务演示,就能完成如捡起和插入插头等复杂的高精度操作。这一特性与以往相比,极大地减少了对大量训练数据和长时间训练的依赖,显著提高了机器人的学习效率和灵活性,使其能够更迅速地适应新的任务和环境。
技术优化升级
在技术层面,RVT - 2 采用多阶段推理管道、凸上采样技术等先进技术,并对网络参数进行了合理调整。这些优化措施在训练和推理速度、内存使用等方面带来了显著的改善。
二、计划推出 Jetson Thor 平台
据外媒报道,英伟达预计于 2025 年上半年正式推出下一代专为人形机器人打造的小型计算机 ——Jetson Thor 平台。该平台优势明显:
运算性能强大
Jetson Thor 平台基于英伟达 Blackwell 架构构建,在 AI 性能方面,能够提供每秒 800 万亿次的 8 位浮点运算能力。这使其可以顺畅运行支持人形机器人的多模态 AI 模型,其中包括英伟达同期推出的 Project GROOT Foundation 模型。
交互能力出色
该平台具备出色的交互能力,能够与人类和其他机器进行安全、自然的交互,同时还能简化机器人的设计与集成流程,为机器人的应用提供了更多便利。
技术架构先进
Jetson Thor 的片上系统集成了基于英伟达 Blackwell 架构的 GPU,并配备一个 Transformer 引擎,拥有 128GB 的 VRAM 和 LPDDR6 内存,支持 FP8 浮点运算。其性能表现卓越,高达 1000 INT8 TOPS 或 500 FP16 TFLOPS,在处理人形机器人所需的视觉、语音、动作控制等复杂任务时表现优异。
应用场景广泛
Jetson Thor 平台的应用场景十分广泛,涵盖服务行业、制造业、医疗健康等多个领域。例如在医疗健康领域,它可以帮助医疗机器人处理复杂的医疗数据,辅助医生进行更精准的诊断;在制造业中,能够使智能机器人更高效地完成生产和装配任务。
利好机器人板块,利好建设工业、克劳斯。
$建设工业(SZ002265)$$克劳斯(SH600579)$
本文作者可以追加内容哦 !