$岩山科技(SZ002195)$  岩山科技的投资概念非常多,先扒一下YAN模型。

       在当今的人工智能领域,大型语言模型正成为研究和商业应用的热点。这些模型以其惊人的语言理解和生成能力改变了技术景观。目前,市场上主流的大型语言模型包括OpenAI的GPT系列、Meta的LLaMa系列和Google的PaLM系列,它们都基于一种被称为Transformer的架构。Transformer架构由于其独特的自注意力机制,能够高效处理长距离的依赖关系,因此在自然语言处理(NLP)领域取得了巨大成功。

岩芯数智最近发布的YAN大模型代表了AI领域的一次重要创新,它采用了非Transformer架构,旨在解决现有Transformer模型面临的一系列挑战,如高算力消耗、训练和推理效率低下等问题。YAN模型的开发创造了这一全新的架构,期望它能成为AI领域的一项基础设施,并推动开发者生态的建设。在AI算力发展方向上看要么沿着Transformer架构跟在发达公司后面拾人牙慧,要么沿着非Transformer架构另辟蹊径做第一个吃螃蟹的大胆创新。

        岩芯数智刘凡平相信,一定会有一个新的架构出现,来替代Transformer架构,这也遵循了客观规律。

《Attention is All You Need》作者Aidan Gomez今年4月曾抛出类似的观点,这个世界需要比Transformer更好的架构,我们所有人都希望它能被某种新架构所取代,将我们带到一个新的性能高原。现在,我们使用了过多的计算资源,也做了很多无用的计算。

2024-12-24 06:58:53 作者更新了以下内容

为什么说传统Transformer架构大模型并不是AGI的最优解呢?刘凡平解释道,虽然市面上大部分模型都具备理解表达能力,但几乎还没有选择遗忘和自主学习的能力。

“选择遗忘”指向的是AI模型的动态筛选、更新信息的能力,使其和人类大脑一样,在真实的物理世界中保持活跃的状态。

而群体智能单元大模型兼具这3项核心能力,底层逻辑更类人脑,也更接近AGI。

2024-12-24 08:31:07 作者更新了以下内容

岩芯数智CEO刘凡平用蚂蚁群、狼群、大雁群的生存法则,来类比Yan1.3群体智能单元大模型去中心化的工作原理。

论如何激发机器智能的群体智能,岩芯数智方面认为需要同时满足以下3点:

1、搭载了具备自主学习能力的若干智能单元;

2、这些分散的智能单元,可以通过环境感知、自我组织和互动协作,共同解决复杂问题;

3、并且要在不断变化的环境中,实现整体智能提升。

追加内容

本文作者可以追加内容哦 !