近期,OpenAI和谷歌分别推出了他们的最新AI模型,展现了各自在人工智能技术上的最新进展。

2月16日,OpenAI介绍了其首个视频AI模型Sora,这款模型可以根据文本指令生成最长60秒的高质量视频,并能够依据文字提示进行视频内容的调整。

与此同时,谷歌(GOOG.US)也宣布了其新一代多模态模型Gemini Pro 1.5的发布,该模型具有突破性的能力,能够处理达到100万Tokens的复杂上下文。

多模态进程加速

业内分析认为,继可生成图文的ChatGPT之后,Sora的发布迎合了业内对多模态大模型的期待。该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。

中信证券指出,谷歌模型更新围绕底层算法层面,尤其是模型的视频多模态方面进行展开,维持多模态与成本降低将是今年AI算法发展最核心的两个主线的判断。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,仍然持续看好AI多模态层面机会。

前不久,《2024数字科技前沿应用趋势》报告中提出:高性能计算、量子计算、云计算和边缘计算这“四大计算”融合,正催生全新的计算范式;通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台, AI治理将引领我们踏上更智慧、更安全的未来。

并且,多模态AI的到来将会加速超大规模预训练模型的出现,很可能改变信息产业格局,即基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于大模型的AGI时代。

毫无疑问,多模态AI是人工智能发展进程中的“里程碑”,预示AGI将加速到未来千行百业将颠覆式变革。而要全面打开生成式AI的想象力,就要依托多模态大模型,将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。

微美全息拓宽AGI智能应用前景

资料显示,AI视觉前锋企业微美全息(WIMI.US),看好生成式人工智能技术的发展,已经投入多模态大模型的研发,前瞻性地预见到一些市场趋势带来的技术需求,将全面拥抱AGI时代来临。

实际上,微美全息已将自研AI技术广泛应用于各环节,目光聚焦于AI视频生成领域,有望大幅降低短视频等内容创作门槛,广泛赋能内容创意表达,在视频、游戏、直播等领域已经积极布局相关文生视频应用。微美全息积极布局人工智能带来的可能的技术创新,争取培育和孵化出第二增长曲线,通过产业价值反哺AI发展。

另外,算力是发展通用人工智能的重要支撑,微美全息不断投入AI算力、海量数据来取得更好的模型效果,可以应用的场景非常丰富,可以发挥无穷无尽的想象力。

在按照“摩尔定律”加速推进芯片的基础上,微美全息摸索出适合自己的AGI科技创新路径,开发更具性价比的AI芯片、智能计算AI模型技术,加快多模态模型架构创新和算力合成技术创新。未来。微美全息还会进一步加快AI人才和算力资源的集中度,这样才能更有利于AGI的创新。

结尾

大模型驱动的AI具有极为广阔的应用前景,有望为众多行业带来强大的赋能效应。需要关注的,2024年国内外厂商有望发布更加复杂的多模态大模型,实现文本、语音、图像以及音视频等多模态数据的复杂处理和交互。

无疑,随着Sora多模态的出现,AI发展的步伐将进一步加快。而得益于这些优势,多模态人工智能的布局已成为全球新一轮引领性趋势。甚至可以说,通用人工智能大模型时代正在到来!

追加内容

本文作者可以追加内容哦 !