9月19日,阿里国际AI团队发布多模态大模型Ovis,该模型可应用在数学推理问答、物体识别、文本提取和复杂任务决策等方面。目前,Ovis 1.0、1.5的数据、模型、训练和推理代码都已全部开源,可复现;Ovis1.6系列中的Ovis1.6-Gemma2-9B也已开源权重。
此外,中国科学院地理科学与资源研究所于今日在北京举行新闻发布会,正式发布全球首个多模态地理科学大模型“坤元”(Sigma Geography),旨在推动地理学与人工智能深度融合。
目前,“坤元”已支撑发表Nature子刊、The innovation、Earths Future等高水平学术论文10余篇。未来,研发团队将推进地图大模型与地理推理机研发,以期让地理科学语言大模型读懂地图;还将打造地理科研协作大平台,以期让每个科学家和科研团队都可以拥有专属的地理大模型,并能够与数百万科学家通过共享数据、模型、研究思路等方式协同工作。
据中国科学院地理科学与资源研究所副所长、研究员苏奋振介绍,目前“坤元”正处于试用阶段,在既定的三个阶段研发完成后,还将从支撑科研转向支撑行业,它也可以成为普通用户的地理老师和旅游向导。
西部证券认为,交互型多模态大模型是AI发展过程中的又一个重要里程碑,打破了传统模型在单一数据类型上的局限性,开创了一种更智能的交互方式。大模型的终极形态,是让人机交互进化到最原始、最简单的形态,在未来和电脑、手机等直接说话交流或许就是最主要的交互方式。交互模式的简化,会极大降低AI的使用门槛,所以交互型多模态大模型带来的这种更加直观、傻瓜的交互,有望带来大模型应用更大面积的普及。
本文作者可以追加内容哦 !