$视觉中国(SZ000681)$ 这还是稳稳的 5连板了
出重大利好了
截至目前,豆包大模型日均tokens使用量超过4万亿,发布7个月以来增长超过33倍。
在今日的火山引擎Force原动力大会上,豆包又发布了视觉理解模型,具备更强的内容识别、理解和推理、视觉描述等能力。火山引擎总裁谭待宣布,豆包视觉理解模型价格降至0.003元/千Tokens,比行业平均价格降低85%。
另外,字节豆包新一代视频生成大模型将明年1月正式发布。此外,抖音旗下图片和视频生成工具即梦AI,展示了新一代图片生成模型和动态海报功能。
从字节今日的种种新动态来看,其仍旧维持着在生成式AI领域的“饱和式”策略。
在今天之前,字节豆包大模型家族已包括了通用大语言、语音合成和识别、图片及视频等不同模态的生成式AI模型,但仍缺少具有视觉能力的可交互多模态大模型;并且,字节豆包之前已经以智能体耳机、智能玩偶、台灯为切入点,在AI硬件端开始布局,但同样受限于交互多模态模型的缺失,AI硬件产品仍只能实现语音层级交互。
从一定程度上来说,今日豆包发布的视觉理解模型,补上了“豆包全家桶”在视觉交互上的这一短板。
追加内容
本文作者可以追加内容哦 !