一、Kimi:无损长文本处理能力全球领先

Moonshot AI 于 2023 年 3 月创立,推出 Kimi 智能助手,能够处理长达 200 万字的上下文,是全球领先的大模型服务。Kimi 的强大功能包括专业翻译、法律分析、发票整理和 API 文档理解,备受用户好评。与即将上线的 GPT-4.5 Turbo 相比,Kimi 的长文本处理能力高出约 10 倍。

Kimi 智能助手启动 200 万字无损上下文内测

大模型的内存大小,即支持长文本技术,可以影响其处理海量文件的效率。在技术上,参数量决定了模型计算的复杂程度,而长文本技术则决定了模型的内存大小。这两者共同影响着模型的应用效果。支持更长的上下文意味着模型有更大的内存,进而使得其应用更加广泛和深入,比如市场分析、处理法务合同、信息抽取、角色扮演等。Kimi Chat以创新网络结构和工程优化的方式,在千亿参数下实现了无损的长程注意力机制,不依赖损害性能的"捷径"方案。

Kimi 能够快速分析总结出英伟达的财报历史

Kimi 根据 500 份简历筛选候选人信息

Kimi是一款智能助手,能够进行智能检索、分析和总结长文本。它使用千亿级大模型,支持在答案生成过程中引入互联网上搜索得到的多篇资料作为上下文,从而提供更直接、更准确的答案。Kimi的长文本处理能力得益于其大模型支持的长上下文窗口,确保信息损失最低。举例来说,用户可以命令Kimi搜索并对比两家同领域上市公司的最新财报数据,Kimi将直接生成对比表格,省去了大量的资料查找时间。Kimi的强大能力使其能够在各种应用场景中高效完成深度分析和处理任务,如市场研究、法务合同处理、信息提取和角色扮演等。这种长文本处理能力是Kimi的重要特点,使其成为一款极具价值的智能助手。

Kimi 能够快速分析对比上市公司财报数据

Kimi智能助手的多轮交互和超长指令遵循能力是其核心优势之一。用户反馈表明,Kimi在多轮对话中能够始终遵循用户指令,理解其需求。同时,Kimi也能够遵循复杂指令,即使这些指令长度长达几千、上万字。这种能力使得Kimi在处理复杂任务时更加可靠和高效。

近期,Kimi的流量增长超出预期,已经采取了紧急措施进行扩容。根据Similarweb的数据,Kimi网页版的日活跃用户数已连续数日超过20万,峰值日活跃用户数达到34.6万,周活跃数据环比增长了45%。公司在月之暗面发布情况说明中表示,从2024年3月20日9:30开始观测到Kimi系统流量持续异常增高,增长趋势超出了公司对资源的预期规划。由此导致从3月20日10:00开始,有较多的SaaS客户持续遇到"429:engine is overloaded"的异常问题。为此,公司向用户表示诚挚的歉意,并已经采取了多项应急措施,包括增加了5次扩容工作。推理资源也会继续进行扩容,以应对不断增加的用户量。此外,公司还设计了一套更有效的SaaS流量优先级策略,以确保付费用户的调用稳定。预计该策略将在3月25日之前完成并上线。

总之,Kimi智能助手在多轮交互和超长指令遵循能力方面表现出色。公司积极采取措施以满足用户需求,并向用户致以诚挚的歉意。

Kimi 访问量激增

月之暗面团队是顶尖算法工程人才聚集之地,创始团队成员参与多个大模型研发。团队创始人杨植麟,毕业于清华大学计算机科学与技术系,博士就读于卡内基梅隆大学语言技术研究所,学术引用量超过2万次。团队涵盖自然语言处理、计算机视觉、强化学习、基础设施等领域的新生代人才,核心成员参与了Google Gemini、Google Bard、盘古NLP、悟道等大模型的研发,其关键技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。

建议关注:润泽科技(Kimi+算力)、福昕软件(Kimi+文档处理)、金山办公(Kimi+办公套 件)、万兴科技(Kimi+视频创意)、金蝶国际(Kimi+企业管理)、彩讯股份(Kimi+邮箱)、 拓尔思(Kimi+公文写作)、华宇软件/通达海(Kimi+法律文件)等。

二、阶跃星辰:发布万亿参数 MoE 大模型预览版

阶跃星辰是一家成立于2023年4月的通用大模型创业公司,于2024年3月23日在上海举行的2024全球开发者先锋大会上正式亮相。创始人兼CEO姜大昕博士发布了Step系列大模型,其中Step-1V表现突出,具有千亿参数多模态能力,能准确描述并理解图像中的文字、数据、图表等信息,支持内容创作、逻辑推理、数据分析、视频理解等任务。Step-1V在中国大型模型评估平台“司南”(OpenCompass)中排名第一,性能与GPT-4V媲美。此外,大会还推出了Step-2的万亿参数MoE语言大模型预览版,采用MoE架构,专注于深度智能探索,并向部分合作伙伴提供API接口。这次发布展示了阶跃星辰的核心技术实力和对通用人工智能的执着探索。

Step-1V 的优势

阶跃星辰是由姜大昕博士创立的公司,他曾担任微软全球副总裁和微软亚洲互联网工程院首席科学家。核心团队包括朱亦博博士和焦斌星博士,他们分别负责系统和数据方面的工作。姜大昕博士是自然语言处理领域的知名专家,拥有丰富的研究和工程经验。朱亦博博士在系统建设和管理方面有丰富经验,焦斌星博士在数据挖掘和自然语言处理方面有专长。

阶跃星辰致力于攀登Scaling Law,通过在算力、数据、算法和系统四方面的布局来实现这一目标。公司注重积极储备算力资源,通过自建机房和租用算力来实现算力的保障,并投资上海智能算力科技有限公司。在系统方面,他们具备建设和管理单集群超过万卡规模的实践经验,并且在训练千亿模型时,有效算力输出率达到了57%。

阶跃星辰的数据团队核心成员来自必应搜索引擎,拥有全球各种语言和地区的服务经验,并对高质量的互联网语料分布有深入了解。他们还建立了强大的数据处理和知识图谱流水线,来支持模型的训练和应用。

在算法方面,阶跃星辰的团队不仅能够掌握各种架构,如万亿参数的MoE架构,还对大模型的发展有深刻的认识和洞察力。

阶跃星辰团队在算力、数据、算法和系统这四大要素上有全面的布局,以实现Scaling Law的目标。

上海智能算力科技有限公司股权结构

阶跃星辰认为,通向人工智能通用人工智能(AGI)的道路上,多模态理解和生成的统一是不可或缺的。模型的演化经历了"单模态->多模态->世界模型"三个阶段。在早期阶段,语言、视觉和声音等各个模态独立发展,学习如何更好地表示这些模态。当前阶段则是各种模态走向融合,它们可以映射到同一个空间进行表示。尽管多种模态开始走向融合,但仍存在一个问题:理解模型和生成模型的发展是分开的。这导致理解模型具有强大的理解能力但生成能力较弱(如GPT-4V),或者生成模型的生成能力强但理解能力较弱(如Sora)。因此,必须将理解和生成统一在一个模型中,实现多模态理解和生成的统一,这是通向AGI的必经之路。在未来,统一的理解和生成模型还可以进一步与具身智能结合,形成一个世界模型。在这个基础上,加入复杂任务的规划能力和抽象概念的归纳能力,我们真正实现了AGI的阶段。

通往 AGI 的路径方向

阶跃推出两款面向C端用户的AI应用产品:1、跃问(StepChat)是免费的AI聊天机器人,主要功能包括对话聊天、图片理解、文档总结、网页分析、在线搜索等,定位为个人效率助手。2、冒泡鸭是免费的AI开放世界平台,提供覆盖拟人、工具、内容、游戏、娱乐等多领域的智能体,设定十亿种剧情和角色,用户可进行多场景角色扮演体验。冒泡鸭AI具备超长上下文记忆和实时联网搜索能力,实现深度理解用户意图,提供即时、准确、个性化的回复和选择。

个人效率助手—跃问 与 AI 开放世界平台—冒泡鸭

建议关注:云赛智联(阶跃星辰+算力)、万兴科技(阶跃星辰+应用)等部分内容来源公众H;查查研报

#Kimi爆火后,大厂开始角逐长文本##Kimi爆火!一度宕机,说明了什么?##Kimi概念股爆火,行情持续性几何?#$云赛智联(SH600602)$$万兴科技(SZ300624)$

作者声明:内容来源于网络
追加内容

本文作者可以追加内容哦 !