豆包发布视频生成实验模型“VideoWorld”。据介绍,不同于Sora、DALL-E、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,仅通过“视觉信息”即可认知世界,也就是说,VideoWorld可通过浏览视频数据,让机器掌握推理、规划和决策等复杂能力。团队实验发现,仅300M参数量下,VideoWorld已取得可观的模型表现。
目前,该项目代码与模型已开源。
2025-02-10 18:28:55
作者更新了以下内容
中科创达与抖音豆包存在合作关系。具体来说,中科创达与字节跳动旗下的火山引擎达成深度合作,共同建立了联合实验室,旨在推动大模型的科研成果在车端和智能硬件端的转化和应用12。此外,双方还在模型联合开发、终端硬件适配等方面进行了合作,并在北大医院落地了基于豆包的AI问诊机器人34。
合作的具体内容和形式
联合实验室:中科创达与火山引擎共建联合实验室,赋能端侧智能12。
模型联合开发:双方从模型联合开发的合作伙伴关系可能发展到全品类硬件模组合作3。
终端硬件适配:中科创达参与字节云端模型在终端的硬件适配,未来可能在字节纯端侧模型中参与度更高3。
落地应用:中科创达参与了基于豆包的AI问诊机器人在北大医院的落地应用34。
追加内容
本文作者可以追加内容哦 !