DeepSeek创始人赚的第一桶金
DeepSeek的火爆,让其创始人梁文锋也走进大众视野。
春节到来,梁文锋的行踪备受关注。记者从其初中班主任容老师获悉,目前梁文锋已回到吴川,还于1月27日下午与旧时同学好友一起踢足球。
另据南方都市报,DeepSeek的创始人梁文锋是位80后,来自广东湛江吴川。2002年,他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。
梁文锋的高中同学兼好友陈先生表示,读书的时候,梁文锋就经常做课题实验,学习刻苦,也热爱足球。大学时期,梁文锋读的AI工程专业前景并不明朗,但他很有前瞻的眼光。“完全是白手起家,创业以来还做过全自动绣花机等产品,不断探索总结溯源。”
陈先生还表示,“梁文锋的衣着打扮和为人处世都非常低调,淳朴有善心,此前以个人名义捐了很多钱。看到他火了很开心,前几天我给他发信息祝贺,他还说会回吴川过年,但今年要躲起来。”
深圳梦注意到,在校期间,梁文锋对金融市场产生了浓厚的兴趣,2008年全球金融危机之际,他带领团队探索机器学习技术在全自动量化交易中的应用潜力。
梁文锋决定量化投资,但这个决定并不容易,毕竟当时量化还是个新事物,很多人不相信量化可以赚钱。
梁文锋苦熬了2年,2010年,沪深300股指期货推出,量化投资迎来了春天。据公开信息显示,梁文锋团队正是乘上这股东风,很快自营资金超过 5 亿元。
这应该是他毕业后赚到的第一桶金,为他后来的创业打下了物质基础。
(深圳梦注:由中证指数公司编制的沪深300指数于2005年4月8日正式发布。沪深300指数以2004年12月31日为基日,基日点位1000点·沪深300指数是由上海和深圳证券市场中选取300只A股作为样本,其中沪市有179只,深市121只样本选择标准为规模大,流动性好的股票。沪深300指数样本覆盖了沪深市场六成左右的市值,具有良好的市场代表性。
作为一种商品,沪深300股指期货是以沪深300指数作为标的物的期货品种,在2010年4月16日由中国金融期货交易所推出。)

2015年,梁文峰与浙大校友共同创立幻方量化,立志打造中国的顶级量化对冲基金。他们将数学与人工智能深度融合,开启了量化投资的创新之旅。
2016年,幻方量化上线首笔AI驱动的实盘交易,随后全面实现交易策略AI化。这一创新举措使旗下基金回报率远超同期沪深300指数,推动公司管理规模快速增长,2021年突破千亿元大关,跻身国内量化私募“四大天王”行列。
随着业务拓展,AI交易策略对算力的需求急剧增加。为解决这一难题,梁文峰展现出非凡的前瞻性和魄力,从2019年开始大规模布局AI算力。当年投资2亿元建成“萤火一号”AI算力集群,搭载1100块GPU算卡,在特斯拉提出Dojo超算概念时便已一步。英伟达A100芯片发布后,他又迅速成为亚太地区首批获取者。
2021年,投资10亿元打造的“萤火二号”上线,搭载1万张A100算卡,算力惊人,相当于76万台个人电脑,占地面积超过10个篮球场。在当时AI大模型尚未爆发的情况下,如此大规模的算力投入被外界视为疯狂之举,但这恰恰体现了梁文峰对AI未来发展的坚定信念和长远布局。
2017年,谷歌提出Transformer架构,OpenAI基于此架构成功推出ChatGPT,引爆AI大模型时代。多数企业选择跟随OpenAI的步伐,而梁文峰带领的团队却另辟蹊径。
2023年,幻方量化成立子公司“深度求索”(DeepSeek),进军通用人工智能领域。尽管团队规模仅有139人,远不及OpenAI的1200人,但他们凭借创新精神和扎实技术,在大模型研发上取得了惊人突破。
2024年5月发布的DeepSeekV2,凭借创新的MLA(多头潜在注意力机制)和DeepSeekMoE(混合专家模型)架构,实现了高性价比的训练和推理,API定价仅为GPT-4 Turbo的百分之一,引发行业价格战,推动了算力普惠。2024年12月推出的DeepSeek-V3更是震撼全球,在多个基准测试中性能超越顶级开源模型,与GPT-4o等顶级闭源模型不相上下,而研发成本不到后者的二十分之一。这一成果不仅打破了中国AI企业依赖模仿的刻板印象,更以首创精神让中国在全球AI竞争中占据一席之地。
梁文锋和他的DeepSeek还在继续求索。
就在1月20日,DeepSeek正式发布DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。DeepSeek称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型开源给社区,允许用户借此训练其他模型。
1月27日,据AI社区Hugging Face,DeepSeek发布分别名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。
DeepSeek的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%
最近DeepSeek得到全世界认可,各个企业马不停蹄地在春节官宣与之合作。仅2025年2月以来,包括腾讯云、360、华为云等大厂相继宣布牵手DeepSeek。此外,微软、英伟达、亚马逊、英特尔、AMD等科技巨头也已于近日上线DeepSeek模型服务。腾讯云2月2日发文宣布,DeepSeek-R1大模型可一键部署至腾讯云「HAI」上。
本文作者可以追加内容哦 !