2026 年,神经科学领域迎来里程碑式突破:加州大学旧金山分校的研究团队提出全新机器学习算法 CellTransformer,仅用数小时就完成了 5 只小鼠的大脑图谱绘制,不仅精准复现 1000 多个已知脑区,还发现了从未被标注的新脑区。这项发表于《自然・通讯》的成果,彻底改变了延续百年的脑图谱绘制模式,为人类大脑研究、疾病治疗乃至多器官探索开辟了全新路径。
一、百年脑图谱绘制:手工操作的局限与困境
大脑图谱是理解大脑结构与功能的基础,但其绘制曾是一项耗时耗力且充满主观性的工作。自该领域诞生以来,科学家们一直依赖手工方式 —— 在脑部图像上用铅笔勾勒区域边界,连接相关功能区,整个过程往往需要数年甚至数十年。
2020 年发布的艾伦小鼠脑通用坐标框架,堪称手工绘制的巅峰之作。它基于 1675 只小鼠的脑部数据,涵盖 1000 多个脑区、43 个皮质区域及层级、329 个皮质下结构,分辨率达 10 微米,为神经科学研究提供了重要参考。但即便如此,手工绘制的弊端依然突出:
-
主观性强:脑区划分依赖科学家的经验判断,宾夕法尼亚州立大学医学院神经解剖学家金永洙曾透露,向资深专家请教绘制技巧时,得到的答案只有 “这都是我脑子里的”;
-
效率极低:绘制一幅高精度脑图谱需要整合上千只动物的数据,耗费大量人力物力,无法快速应对大规模研究需求;
-
精细度不足:难以捕捉脑区内部更细分的亚区,无法满足对大脑功能的深度探索。
这些局限,让脑科学研究长期受限于 “图谱滞后于需求” 的困境,直到 CellTransformer 的出现才被彻底打破。
二、CellTransformer:Transformer 架构的跨界创新,让细胞 “自己说话”
CellTransformer 的核心突破,在于将自然语言处理领域的 Transformer 架构,成功跨界应用于神经科学,通过自监督学习让细胞 “自我归类”,最终自动生成脑图谱。其工作原理巧妙且高效,可概括为四大关键步骤:
1. 细胞 “邻域” 划定:兼顾空间与分子特征
研究人员为每个细胞划定 “邻域”—— 以该细胞为中心,一定微米距离内的所有细胞均被纳入观察范围。这样的设计让模型既能捕捉细胞之间的空间位置关系,又能分析它们在分子层面(基因表达)的差异,实现 “空间 + 分子” 的双重维度分析。
2. 细胞 “token 化”:借鉴语言模型的交互逻辑
在邻域中,每个细胞被当作一个 “token”(类似语言模型中的 “词语”),通过 Transformer 的自注意力机制,让细胞之间实现 “信息交流”。模型会自动学习哪些细胞之间的关系更重要,哪些邻居对当前细胞的身份定位影响更大,无需人工预设规则。
3. 自监督训练:遮罩预测 + 反复迭代
训练采用 “遮罩预测” 的自监督方式:随机选中一个细胞,遮蔽其基因表达信息,仅保留细胞类型标签,让模型根据周围邻居的特征,反推该细胞原本的基因表达分布。预测错误后模型自动更新参数,重复数百万次迭代,直到能精准预测细胞特征。
4. 向量聚类:脑区 “自动浮现”
模型为每个细胞提取 “邻域表示向量”,将所有细胞的向量拼接后,通过 k-means 等聚类算法分析,脑区会自动划分出来 —— 已知功能区自然对齐,细分亚区和新脑区也会随之浮现。整个过程无需人工标注脑区标签,完全由数据驱动,避免了主观偏差。
值得一提的是,CellTransformer 不存在 AI 常见的 “幻觉” 问题,因为它是基于细胞实际特征进行分组,而非生成全新的虚假结构,这为其在科研领域的应用奠定了可靠性基础。
三、四大核心成果:效率、精度、新发现全面突破
研究团队在包含 5 只小鼠、1040 万个细胞(每个细胞含数百个基因)的 ABC-WMB 数据集上测试后,CellTransformer 展现出四大颠覆性成果,性能远超传统方法:
1. 效率飙升:数小时完成百年级工作
传统方法绘制一幅小鼠脑图谱需要整合上千只动物数据、耗费数年时间,而 CellTransformer 仅用几小时,就完成了 5 只小鼠的全脑空间组织建模,处理规模达百万级细胞,效率提升上万倍。
2. 精度极高:完美对齐已知脑区
CellTransformer 能定义 25 到 1300 个神经区域,在完全不使用脑区标签的情况下,高度对齐艾伦小鼠脑通用坐标框架的已知解剖结构和功能分区,连皮层中的层级结构都能精准复现。例如在海马体分区识别中,其划分的亚区边界与过往研究完全一致。
3. 发现新脑区:破解长期科学谜题
这是最令人振奋的成果。CellTransformer 不仅拆分出已知脑区的细分亚区,还发现了从未被系统标注的新脑区:
-
尾壳核(纹状体的小鼠对应区域)被证实并非单一脑区,而是由多个网格状交错的亚区组成,这解释了其为何能同时参与运动、奖赏、大脑管理等截然不同的功能;
-
脑干中脑网状核(负责启动运动的小众研究区域)被识别出 4 个新脑区,每个新脑区都有丰富的细胞类型和特定激活基因,部分细胞类型此前被认为仅存在于大脑其他区域。
4. 跨动物适配:具备规模化应用潜力
CellTransformer 并非 “小鼠特供”,能成功整合多动物、异质性数据集。在包含 1 个冠状切片和 4 个矢状切片的 5 只动物样本中,模型生成的亚区高度一致,证明其可适配不同动物的脑图谱绘制,为后续跨物种研究提供了可能。
四、未来展望:从鼠脑到人脑,从神经科学到多器官探索
CellTransformer 的价值远不止于绘制小鼠脑图谱,其应用前景覆盖多个前沿领域,有望引发连锁式的科研突破:
1. 人类大脑图谱:未来可期的终极目标
小鼠大脑约有 1 亿个细胞,而人类大脑细胞数量达 1700 亿个,目前因缺乏足够的人类脑部数据,CellTransformer 暂未应用于人脑。但研究团队信心十足,负责人 Reza Abbasi-Asl 表示,一旦获得足够数据,该算法完全有能力应对人类大脑的复杂度,绘制出高精度人类脑图谱。这将为阿尔茨海默病、帕金森病等神经退行性疾病的研究提供关键工具,帮助科学家定位致病区域、开发精准疗法。
2. 多器官扩展:从大脑到全身组织
CellTransformer 的算法具有组织通用性,可脱离神经科学领域,应用于肾脏、肝脏等其他器官,甚至病理组织。例如通过分析健康肾脏与糖尿病肾脏的细胞图谱差异,帮助科学家找到疾病进展的关键机制;对癌组织的细胞分析,可能为肿瘤分型、药物靶点发现提供新思路。
3. 脑功能探索:精细亚区的功能解码
新发现的脑区和亚区,为探索大脑功能提供了全新靶点。科学家可基于 CellTransformer 绘制的精细图谱,将行为、功能与具体细胞区域对应,破解此前无法解释的大脑功能分工谜题,推动认知科学、神经科学的深度发展。
从人类科学家手工绘制百年,到 AI 几小时完成并发现新脑区,CellTransformer 的出现不仅是技术的跨界创新,更标志着脑科学研究进入 “数据驱动” 的新时代。随着算法的持续优化和数据的不断积累,AI 绘制人类脑图谱、解码大脑终极奥秘的那一天,已不再遥远。


