成为 AI 研究者意味着什么?如果回到 2015 年,我会毫不犹豫地描绘出一幅光鲜图景:追逐前沿技术、打造酷炫模型、拿着高薪、收获广泛认可。但历经十一年沉淀,从本科实验室的好奇探索到英伟达的职场深耕,我才明白,这条道路远比想象中复杂 —— 它充满了未发表的论文、自我怀疑的深夜,以及无数次在 “随大流” 与 “随本心” 间的挣扎。
这不是一篇成功学指南,而是我用十一年时光换来的经验碎片与反思。希望这些文字,能为正在 AI 路上摸索的你,拨开一点眼前的迷雾。
2015-2017:在探索中确认初心,那些 “低效” 的时光都算数
2015 年,深度学习正以摧枯拉朽之势重塑 AI 领域。CNN 与 RNN 在各类基准测试中屡创佳绩,那种 “让机器从原始数据中自主学习决策” 的魔力,让我瞬间着迷。比起课堂上的理论知识,拆解word2vec的 C/C++ 实现、探索语言模型的内在机制,更让我沉浸。
我人生第一个 “顿悟时刻” 源于一次偶然的 RNN 实验:我发现用拼音作为中文输入的 token,效果竟远超传统分词。但当时的我对 “科研周期” 毫无概念,这个充满潜力的发现最终和其他几个项目一样无疾而终,只留下一篇无人问津的 arXiv 预印本和一堆零散的实验代码。
日本三菱电机的暑期实习,成了我科研路上的第一个转折点。在那里,我看到了两种截然不同的研究员风格:一种擅长头脑风暴,能用精准的逻辑说服他人;另一种则在工程实现上精益求精。我发现自己更偏向前者 —— 只有真正理解一个想法的底层逻辑,我才有持续推进的动力。这让我坚定了攻读博士学位的决心。
但当准备申请材料时,现实给了我沉重一击:我的论文发表数为零。看着身边同龄人早已手握二作、共同一作,我陷入了深深的自我怀疑,觉得自己荒废了最关键的几年。
反思:多年后我才明白,本科那些看似 “低效” 的探索时光,最大的价值是帮我确认了志向所在。科研是一场长达十几年的马拉松,起跑速度无关紧要,能否坚持跑完全程才是关键。本科是容错率极高的探索窗口,一旦进入博士阶段或工业界,系统会倒逼你 “产出” 而非 “洞察”,此时再想找回初心,难度会大得多。
2017-2019:筑牢工程根基,学会 “说服世界” 的科研表达
意识到论文产出的匮乏后,本科最后一年我加入了微软亚洲研究院(MSRA)的目标检测组。那是当时最热门的赛道,身边的队友个个都是顶尖玩家 —— 他们能每周追踪最新 arXiv 动态,一眼识破数据漏洞,甚至能随口背出 ResNet 的特征图维度。
在这里,导师教会了我至关重要的一课:工程能力是科研想法的基石。为了搞定 Faster R-CNN 的复杂实现,我被迫养成了严谨的工程习惯,甚至学会了手写 CUDA kernel 来加速框架不支持的 GPU 操作。虽然实习结束时仍未发表论文,但我已经攒够了冲击顶刊的工程底气。
带着这些技能,我开启了在加拿大的博士生涯。第一个核心项目是开发大规模图节点嵌入训练的多 GPU 系统。经过三个月与编译器漏洞、CUDA 错误的反复博弈,我终于找到将十亿级参数分散在多个 GPU 上的方法 —— 本质上是数据并行与模型并行的创新结合。
但让系统跑起来只是成功了一半。写论文时,我犯了新手最常见的错误:把论文当成 “流水账”,只罗列 “我做了什么”,却不懂如何构建 “为什么这必须发生” 的逻辑论证。导师重写了整篇论文的引言,重新架构了叙事逻辑,而我最初竟以为只是简单的语法修改,甚至在慌乱中覆盖了他的修改版本。最后我们熬了无数个通宵校准逻辑,才在截止日期前提交。几个月后,这篇论文被 WWW 顶会录用。
反思:高效的科研从来不是靠天赋,而是靠专业性。把代码库想象成观测未知宇宙的天文台,只有经过高精度校准、配备完善的实验记录,才能区分 1% 的性能提升是真实信号还是噪音,让科研从 “瞎猜” 变成 “精测”。而一篇优秀的论文,核心是尊重读者 —— 要将研究与领域共同面临的困境关联,否则再惊艳的结果,也只是无人关心的答案。
2019-2020:在稀疏反馈中求生,建立自己的 “能量补给系统”
“博士需要能够独立完成一个项目,这比你目前为止做到的都要难。” 第一篇论文录用后,导师的话让我隐隐不安,但彼时的我天真地以为,只要复刻之前的模式就能顺利前行。
现实很快给了我教训。我先是尝试从语言模型中提取知识图谱,和合作者在零下 20 度的寒冬深夜手动标注数据,结果论文因不懂 “向社区推销新任务” 而被拒;疫情爆发后转向药物联用研究,跑了上百个版本的生物图谱实验,最终还是难逃拒信的命运。
接二连三的失败让我陷入自我怀疑,再加上疫情导致的社交隔离、室友搬走,我成了孤独的 “科研孤岛”—— 英语和中文能力双双退化,甚至开始质疑自己是否适合科研。
为了走出困境,我开始建立不依赖论文录用的正向反馈循环:花数月编写一万多行代码的软件库,在功能实现、性能优化中收获确定的成就感;拿起相机走遍蒙特利尔的角落,在捕捉瞬间美好中缓解科研压力;更意外的是,乌克兰室友的出现成了我的 “自我救赎”—— 我们靠着破碎的英语和维基百科交流,在异国美食与文化碰撞中,找到了久违的快乐。
反思:学术界的奖励信号既稀疏又随机,这对心理是残酷的折磨。研究员必须建立自己的 “能量补给系统”,它可以是读懂硬核论文的成就感,可以是能看到进展的业余爱好,也可以是日常生活的微小喜悦。这段经历也让我真正理解了 “独立研究员” 的核心 —— 不是蛮力执行,而是战略决策:这个问题有影响力吗?有现成数据集吗?评测方式经得起推敲吗?错误的战略判断,会让一整个学期的努力付诸东流。
2021-2023:回归基础原理,找到属于自己的研究节奏
2021 年元旦,我回到中国与家人团聚,也和合作者回到了同一时区。我们从失败的药物研究项目中,打捞起一个名为 “单向传播” 的未验证想法。直觉告诉我们这个方向可行,但缺乏理论支撑让项目举步维艰。
当全世界都在追逐最新的 arXiv 预印本时,我做了一件导师眼中 “疯狂” 的事:埋首数学教材,为假设寻找底层依据。当我终于发现,我们的传播方法等价于图推理必备、而现有 GNN 无法解决的路径问题解时,那种醍醐灌顶的通透感,驱动着我们没日没夜完善实现。最终,这个想法变成了我的第一篇 NeurIPS 论文。
这次成功让我领悟到:最宝贵的见解往往来自经受时间考验的基本原理,而非昙花一现的热点。博士开题时,我重读了《人工智能:现代方法》和《几何深度学习》,发现当前推理模型的泛化能力极差,许多模型只是 “背诵模式”,甚至不如几十年前的经典算法 —— 这让我看到了无限的研究可能。
这段时间,我还遇到了博士期间最好的合作伙伴 —— 一位图机器学习博主(我最初的很多知识都来自他的文章)。我们共同提出一个简单却深刻的问题:为什么经典短路算法只需写一次就能适配所有图,而神经模型每换图就得重练?这个疑问催生了最早的 “图基础模型” 之一,那段时光是读博期间最快乐的日子 —— 我们不是在刷榜,而是在赋予神经网络经典算法般的优雅。
反思:每个人都有适合自己的研究节奏,追逐热点不适合我,深入思考习以为常的事物才让我乐在其中。做 “一流的自己”,远比做 “二流的别人” 容易。而所谓的 “高产期”,背后是稳固的代码库和高效复用 —— 现代机器学习研究 70% 是工程,30% 是发明,当基础架构就绪,新点子的测试是从 70 分起步,而非从零开始。
2023-2024:站在人生十字路口,在迷茫中锚定方向
读博最后一年,在经历三年实习申请屡败屡战后,我终于拿到了 Google 的 offer。湾区的激烈竞争与加拿大的宁静学术生活形成鲜明对比,也让我见识到工业界协作的 “双刃剑”—— 既能通过杠杆扩大影响力,也会因产出不足被快速淘汰。导师教我的 “永远带着具体行动项离开会议”,成了我在工业界的生存准则。
毕业临近,我站在了学术界与工业界的十字路口。和许多对科研抱有热情的博士一样,我申请了上百所高校的教职,反复打磨 Research Statement 到能梦中背诵,但一整天筋疲力尽的面试后,前辈的话让我清醒:年轻教授的核心工作不是科研,而是筹款、管理行政琐事,学术自由只是筹款成功后的 “奖品”。
转战工业界的道路同样坎坷。我推掉多个软件工程师 offer,孤注一掷申请研究员岗位,却遭遇 2024 年裁员潮与招聘冻结,所有面试石沉大海。O1 签证的担保门槛,成了许多公司不愿跨越的鸿沟。就在我濒临绝望时,英伟达的面试机会来了 —— 我知道这是最后的希望。
28 岁生日那天,我收到了英伟达的研究员 offer,20 岁时的梦想终于照进现实。回望过去才发现,那些看似零散的经历早已串联成桥:为第一个项目写的 CUDA kernel、疫情期间开发的获奖软件库、对推理领域的执着探索,恰好契合了英伟达的需求。
反思:学术界的光环背后,是鲜为人知的琐碎磨损。“研究员” 和 “教授” 是两种职业:前者追随好奇心解谜,后者运营 “学术初创公司”。找工作时的挫败感难以避免,但良性市场需要 “拒绝” 来实现最优匹配。保持积极心态不仅是自我调节,更是向招聘团队传递 “准备好迎接挑战” 的信号。
2025:拥抱工业界的 “全栈现实”,重新定义研究员的价值
2025 年,我正式加入英伟达,开启 LLM 后训练领域的研究工作。这次转变让我深刻体会到学界与业界的本质差异:学术界靠影响力和筹款探索未知,工业界靠产品化和营收放大已知;在这里,研究员与工程师的界限变得模糊 —— 基础架构拖后腿就亲自优化,工程难题无方案就转化为研究课题,而这种 “全栈能力”,是大学课程从未教过的。
AI 行业的经济逻辑也已剧变:以前软件公司最大的成本是工程师,现在则是 GPU—— 顶级实验室人均年 GPU 成本高达数百万甚至上千万美元,这催生了 “人可睡、GPU 不可闲” 的残酷运营逻辑,我们仿佛成了永不停歇的机器操作者。
更戏剧化的是,AI 工具的普及正在重塑人才市场。Cursor、Claude Code 等工具让初级岗位大幅缩水,公司门槛普遍提高到博士级别。残酷的现实是:AI Agent 辅助下,一名资深工程师能完成过去一群初级工程师的工作,单纯的知识积累与技能产出正在贬值。
即便身为专业研究员,我也面临知识迭代的压力 —— 曾用来证明 LLM 泛化能力薄弱的经典例子,不到一年就被新模型攻破。我意识到,头脑风暴、写代码、做分析这些 “过程性工作” 终将被 AI 接手,留给人类的,是设定目标的品味、感受世界的本心,以及承担责任的肩膀。
结语:所有散落的点滴,终会在未来连成线
十一年 AI 科研路,我最大的感悟是:通往研究员的道路从非直线,前方的迷雾与变数远超想象。但请相信,在这场真诚的旅途中,没有真正的冤枉路 —— 每一次失败、每一点好奇心、每一次挣扎与坚持,都在构筑你最终立足的土地。
AI 行业的变化越来越快,技术迭代的周期越来越短,但有些东西永远不会过时:对未知的好奇、解决问题的执着、以及在迷茫中坚守本心的勇气。
愿你继续前行,保持好奇。那些当下看似无关的经历,终会在你看不见的未来,串联成属于自己的人生轨迹。