写在最前边:
这项发表于 Nature Neuroscience 的研究,其核心意义并不在于简单比较中国人与欧美人群谁的脑发育更早或更晚,而在于系统性地构建了覆盖全生命周期的中国人群脑结构正常参考数据。
这种本土化的参考体系,有助于减少直接套用欧美常模所带来的系统性偏差,为神经系统疾病的个体化诊断、风险评估、预后预测和疗效监测提供更贴近临床实际的量化基础。
先说说各家媒体都很感兴趣的一个点,从这项研究数据中发现,中国人群的神经发育里程碑峰值年龄(1.2-8.9岁)晚于欧洲/北美人群,这里边到底为什么会有这种差异?
先说我的一点个人看法。
这种差异性的原因,可能有生活方式,环境,教育,以及遗传方面的因素相关,但我觉得造成这种差异也可能是在样本数量和年龄分布差异上造成的。实际上是不是有这个峰值差异性,或者说是峰值差异有多大,其实现在并不能确定。
在看这次具体的研究内容之前,要来看这张图。

这个图,来自于自 2022 年发表于《Nature》的一项里程碑式研究,由英国剑桥大学、美国宾夕法尼亚大学等多机构合作完成。研究整合了全球上百个独立影像队列,覆盖从胎儿中晚期、新生儿、儿童、青春期到百岁老年的全生命周期,通过统一建模构建了人类脑结构随年龄变化的「参考曲线」。图中用同一坐标系同时展示了灰质体积、白质体积、皮层厚度、皮层表面积、脑室体积等关键脑结构指标,并将这些变化与非影像学的生物学里程碑以及常见精神神经疾病的典型发病年龄窗口进行对照。
从上图我们可以看出,皮质区灰质总体积从孕中期开始快速增长,在5.9岁时体积达到峰值,随后近乎线性下降。白质总体积从孕中期到儿童早期迅速增加,在28.7岁时达到峰值,随后在50岁后加速下降。这表明幼儿期是人脑发育的关键时期。
可以说这是人类有史以来,最大规模的神经影像学研究,为神经科学研究提供了重要的参考资源。
但这个研究好是好,但有问题,问题来自于哪里呢?
Even this large MRI dataset was biased towards European and North American populations and European ancestry groups within those populations. This bias is unfortunately common in many clinical and scientific references, including anthropometric growth charts and benchmark genetic datasets, representing an inequity that must be addressed by the global scientific community.
即便是这样一个规模庞大的 MRI 数据集,其样本构成仍然明显偏向欧洲和北美人群,以及这些人群中具有欧洲祖源的个体。这种偏倚在许多临床和科学参考体系中并不罕见,包括人体测量学的生长曲线和常用的基准遗传数据集在内,反映出一种亟需由全球科学界共同正视并加以解决的不公平现象。
这不是我说的,这是论文研究团队自己在正文里写的。
所以你用欧美的数据,放在中国来用,就会出现水土不服的情况,而且确实临床会出现这个问题。
所以才有了今天要跟大家解读的这篇文章。

这项研究由天坛医院牵头,整合全国105个研究中心,收集包括港澳台在内覆盖全国的近2.8万例高质量磁共振影像数据开展研究,其中包括2.4万余名覆盖从儿童到老年全生命周期的健康人群,3900余名涵盖阿尔茨海默病、帕金森病、脑小血管病、多发性硬化等多种神经系统疾病患者,以确保脑结构参考标准对全体中国人的适用性,同时更能精准捕捉大脑从发育、成熟、到衰老的动态变化规律,在一定程度上解决了传统标准无法区分生理性衰老与病理性改变的难题。
于是根据对这2.4万的核磁数据进行分析,加之对比2022 年的发表的欧美数据,研究团队得到了以下的数据对比图。

这张图定量展示了中国健康人群不同脑结构指标在生命周期中的峰值年龄,并将其与既有的欧洲/北美(ENA)脑结构参考值进行对比。结果显示,皮质灰质体积(GMV)在中国人群中于 7.1 岁达到峰值,皮质下灰质体积(sGMV)于 18.4 岁达峰,白质体积(WMV)则在 37.6 岁达到最大值;随后三者均呈现出近似线性的下降趋势。相较之下,ENA 参考曲线中对应结构的峰值年龄分别为 5.9 岁、14.4 岁和 28.7 岁。由此可见,中国人群中 GMV、sGMV 和 WMV 的峰值年龄分别延迟约 1.2 年、4.0 年和 8.9 年。
可以说,对比欧美的大脑发育里程碑曲线,这是一条来自于中国的数据的大脑发育里程碑曲线。
那为什么要特别关注GMV、sGMV 和 WMV呢?
简单解释下这三项数据背后的意义。
皮质灰质体积GMV 主要反映的是大脑皮层中神经元胞体、树突和突触的总体体量,是儿童期脑发育中最直观的结构指标之一。GMV 在生命早期快速增长,主要源于神经元体积扩展、突触大量生成以及皮层层化的完成;随后,随着突触修剪、神经回路精细化以及皮层厚度下降,GMV 开始回落。因此,GMV 的峰值通常出现在儿童期或学龄前后,其生物学意义并不是「功能最强」,而是从数量扩增向结构优化转折的时间点。
皮质下灰质体积sGMV 指的是位于大脑皮层下方的灰质结构体积,主要包括基底节、丘脑、杏仁核、海马等核团,这些结构在运动调控、情绪加工、学习记忆和奖励系统中发挥关键作用。与皮层相比,皮质下结构的成熟过程更为缓慢,且高度依赖青春期及其后的激素变化和神经调控重塑。因此,sGMV 的峰值通常出现在青春期后期或青年早期,反映的是情绪—动机—认知调控系统的结构成熟节点。
白质体积WMV 反映的是大脑中轴突及其髓鞘化程度,本质上对应的是脑区之间长程连接的数量与质量。白质发育以髓鞘化为核心,其进程持续时间最长,往往贯穿青春期并延续至成年中期,与信息传递效率、认知整合能力和执行功能密切相关。与灰质不同,白质体积在成年后仍可持续增加,峰值出现在较晚阶段,随后才随衰老逐步下降。
那这个差异是怎么形成的呢?
首先,要确定这两个数据来源的人群是不一样的,一个是来自于北美和欧洲,另一个是来自于中国的多个省份。所以遗传背景肯定是有差异的,同时生活方式,环境和教育背景等多种因素都可能包含在里边。
但还有一点不可否认的,是样本之间的差异。
研究团队得到的峰值并不是一个直接测量值,而是模型推断结果,其位置可能受数据结构影响。
比如我们对比两者研究样本量和年龄分布就能看出来很大的区别。
先看2022年的研究数据。

这张图展示了 2022 年发表于《Nature》的 brain charts 研究中,用于构建全生命周期脑结构参考曲线的 MRI 数据整体构成。研究共整合了来自全球 100 余个独立影像队列的数据,覆盖 101,457 名参与者、共 123,984 次结构性 MRI 扫描,年龄范围从胎儿中晚期(受孕后约 115 天)一直延伸至 100 岁以上的高龄人群。横轴中的每一个箱线/小提琴图代表一个具体研究队列,纵轴表示该队列所覆盖的年龄分布,颜色深浅反映样本量大小(对数尺度)

这张图展示的是本研究用于建立中国人群脑结构常模的健康对照(HC)样本年龄分布,总计纳入 24,061 名健康个体。横轴为年龄、纵轴为样本数量,整体覆盖 4–85 岁。
对比两个图就能发现两个问题。
第一,样本数量是量级上的差异。2022 年 brain charts 研究整合了十万量级的受试者与十万量级的结构 MRI 扫描,并由上百个队列共同支撑;而中国这项研究用于构建常模的健康样本为 24,061 人。
第二,就是年龄分布不均,国内的这项研究最突出的是18–25 岁出现一个陡峭的主峰(青年早期样本高度集中),同时在中老年阶段(约45–65 岁)也形成了较为连续、数量可观的覆盖;相比之下,儿童早期(0–4 岁完全缺失)以及青春期过渡段(约10–18 岁)样本相对稀疏。
而这种差异,会直接对最终的分析数据造成影响。
GMV 的变化主要发生在生命早期,尤其是婴幼儿和儿童阶段增长最快。如果样本中 0–4 岁完全缺失,模型就无法用真实数据确定这一段最陡的上升曲线,只能从 4 岁以后向前外推。在这种情况下,GMV 的峰值更容易被推到儿童期样本相对充足的年龄段,因此出现 1–2 年左右的峰值后移是很常见、也比较温和的一种影响。
sGMV 的关键变化窗口通常在 青春期及其过渡阶段(约 10–18 岁)。当这一年龄段样本较少、而 18–25 岁样本高度集中时,模型在寻找最高点时会更依赖后者这个数据更密、噪声更小的区间,从而把峰值推到青年早期。这种结构性偏移往往能造成 数年量级的峰值延迟,对 sGMV 的影响明显大于 GMV。
WMV 的发育最为缓慢,曲线通常呈现出 长时间的平台期,峰值本身就不尖锐、位置不稳定。当样本在 中老年阶段(如 45–65 岁)较为密集,而 25–40 岁相对不足时,平台期的「峰值很容易被中年高密度数据牵引,从而出现 较大幅度的峰值后移,甚至达到接近十年的量级。这也是为什么 WMV 往往是受年龄分布影响最大的指标。
所以,对比欧美的数据,中国目前的峰值数据偏后,很可能是样本本身带来的影响。
实际上研究团队也认识到了这两个问题。在论文中,作者也承认缺少 2 岁以下婴儿数据,这一对脑结构快速变化最敏感的年龄段缺失,可能会对早期轨迹拟合产生影响。同时也强调样本稀疏的年龄段拟合置信度下降,并指出这种缺口可能会 bias fitting trajectories,且与 ENA 的差异在皮层厚度上尤其明显。
同时作者还做了峰值敏感性分析,对 18 岁以下样本做重采样(208–2,084),发现当样本量 <1,000 时,峰值年龄对样本量敏感;当样本量 >1,000 后,峰值估计才稳定。
但怎么说呢,饭要一口一口吃,路也要一步一步的走。
未来随着队列越来越多,越来越大,我们也可以从2万人做到10万,20万的量级,同时年龄值分布也会越来越均匀,我们也会得到更加精准的中国人大脑发育的里程碑,到时候同样的样本量和接近的年龄分布上来对比中国和欧美的数据可能更加有意义一些。
不过低龄队列,0–1 岁、1–2 岁、2–4 岁,尤其是从ENA里这个受孕后115天的队列是真不好做……
参考
- ^https://doi.org/10.1038/s41586-022-04554-y
- ^Zhuo, Z. , Chai, L., Wang, Y. et al. Charting brain morphology in international healthy and neurological populations. Nat Neurosci (2025). https://doi.org/10.1038/s41593-025-02144-5✅
(99+ 封私信 / 3 条消息) 研究发现中国人大脑发育约 38 岁达顶峰,峰值和老化均比西方人晚,为何会出现这种差异?有哪些科学依据? - 知乎