梁文锋,2025《自然》十大人物

当《自然》年度十大人物榜单新鲜出炉,一个名字让求是园的荣光再度闪耀——浙江大学校友、DeepSeek创始人梁文锋。从实验室里埋首求索的青年学子,到屹立AI浪潮之巅的开拓者,他用一场始于好奇、成于坚守的技术远征,将“浙大智慧”与“中国突破”刻在了全球人工智能的发展图谱上。

一、求是沃土:埋下技术信仰的种子

梁文锋的技术初心,始于求是园的浸润与滋养。2007年,他从浙江大学电子信息工程专业本科毕业,三年后再度斩获信息与通信工程硕士学位。在信息与电子工程学院的求学时光里,严谨的学术训练为他筑牢了算法与计算机视觉的坚实根基,而浙大“求是创新”的精神内核,更塑造了他追求本质、笃信长期的行事风格。

学生时代的他,已在毕业论文中聚焦视频目标跟踪算法设计,展现出超越同龄人的专注力。多年后回顾这段经历,梁文锋坦言:“浙大教会我的,不仅是解题的方法,更是面对未知时‘啃硬骨头’的勇气。”这种深入骨髓的探索精神,为他日后的AI攻坚埋下了最初的种子。

二、破局之举:用“买钢琴”的魄力破解瓶颈

在AI产业尚未迎来爆发期的年代,一次源于纯粹好奇的决策,成为梁文锋职业生涯的关键转折。他斥资购入上万张英伟达GPU显卡,只为探索这些芯片在前沿研究中的无限可能。面对外界的疑问,他给出了一个充满温度的比喻:“就像家里买钢琴,一是买得起,二是有一群迫不及待想弹奏的人。”

这份看似随性的“尝试”,实则是对技术趋势的精准预判。这些显卡,最终成为破解中国大语言模型发展瓶颈的“关键钥匙”,为日后DeepSeek的算力基础埋下伏笔。这份不随波逐流的判断力,正是浙大“不唯书、不唯上、只唯实”治学理念的生动实践。

三、R1横空出世:以“中国成本”重塑AI格局

2023年,梁文锋创立DeepSeek;2025年1月,具有里程碑意义的AI推理模型R1震撼发布。这款模型以“卓越性能+极致成本”的双重优势,迅速在国际AI界引发震动,彻底打破了外界对大模型研发“高门槛、高成本”的固有认知。

2025年9月,DeepSeek团队的研究成果登上《自然》封面——题为《DeepSeek-R1通过强化学习激励大语言模型推理》的论文,首次向世界完整公开了R1模型的构建逻辑、训练全流程及成本细节:仅29.4万美元的训练费用,叠加基础模型600万美元的投入,总成本远低于同类模型数千万美元的常态。

作为首个经受同行评审的大型语言模型工作(D. Guo et al. Nature 645, 633–638; 2025),这份毫无保留的“技术配方”,为全球AI研究者提供了可复现、可借鉴的范本,彰显了中国科技企业的开放格局。

四、人才之道:让创新在自由中生长

如同梁文锋自身的成长轨迹,DeepSeek在人才选拔上始终着眼长远,更重潜能而非资历。公司内部刻意淡化层级,鼓励团队自主探索,这种“给年轻人试错空间”的管理哲学,正是他在浙大求学时“学术自由、思想碰撞”氛围的延续。

在梁文锋眼中,每一位团队成员都是“技术远征的同行者”。这种尊重人才、释放活力的理念,让DeepSeek凝聚了一批顶尖AI人才,成为推动技术持续突破的核心动力。

五、求是回响:以纯粹之心照亮未知

梁文锋的入选,是浙江大学“求是创新”精神的生动注脚。这条征途上,写满了浙大人共有的特质:

  • 是追求极致的专业精神——对技术细节的反复锤炼,对模型机理的深刻洞察;

  • 是笃定坚守的长期主义——在无人问津的领域埋首深耕,在时间长河里静待花开;

  • 是扎根现实的沉稳与仰望星空的胆魄,是破解瓶颈的智慧与开放共享的格局。

对梁文锋与DeepSeek而言,眼前的成就并非终点,而是推动AI从“跟随”走向“原创”的关键路标。这份超越功利的纯粹追求,恰是追寻科学之光的起点——那束照亮未知、驱散迷雾的光,曾在求是园点亮,如今正透过DeepSeek的技术突破,照亮全球AI的未来征途。

致敬每一位在无人区播种、于攻坚处破局的浙大人。你们的每一步探索,都在定义未来的气象!

《DeepSeek-R1通过强化学习激励大语言模型推理》附件下载链接: DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning