Menu
首页基因学苑行业资讯

Nature | 619,372人大规模遗传分析:绘制人类循环代谢物全景遗传调控图谱

2026-06-08编辑:RiboNext

619,372人大规模遗传分析:绘制人类循环代谢物全景遗传调控图谱

循环代谢物作为机体代谢状态的直接分子表征,是连接基因组变异、细胞功能、环境暴露与复杂疾病的核心中间表型。系统解析循环代谢物的遗传调控架构,不仅能够揭示代谢稳态的维持机制,更能为疾病病理生理过程、生物标志物开发与药物靶点筛选提供直接的遗传学证据。然而,过往代谢性状基因组研究普遍受限于样本量不足、变异频谱覆盖不全,以及对低频与罕见变异的解析能力薄弱,导致半数以上代谢性状的遗传力未能充分阐释,大量功能性遗传位点仍未被发现,同时广泛存在的水平多效性也使得传统孟德尔随机化因果推断存在偏倚风险。近期发表于《Nature》的这项里程碑研究,联合爱沙尼亚生物库与英国生物库两大人群队列,在619,372名个体中对249项核磁共振检测的循环代谢性状开展全基因组关联荟萃分析,首次实现从常见变异到低频变异的全覆盖解析,构建出迄今规模最大、精度最高、维度最全的人类代谢物遗传调控图谱,发现数万条全新遗传关联信号,系统阐明低频功能变异的关键贡献,并通过共定位分析与顺式孟德尔随机化框架,精准解析代谢物与疾病之间的真实因果关系,为代谢疾病机制阐释、风险预测与靶向治疗开发奠定全新基础。

图片

超大样本代谢GWAS与空前规模的新遗传位点发现

本研究整合爱沙尼亚生物库185,352人与英国生物库434,020人,覆盖欧洲、南亚、非洲、东亚、中东、美洲六大遗传祖先群体,在统一质控、归一化与技术偏差校正后,对涵盖氨基酸、脂质、脂蛋白、糖代谢、酮体、炎症及流体平衡等249项循环代谢指标开展全基因组关联分析与固定效应荟萃分析,最终在全人群中鉴定出88,127个高置信度位点-代谢物关联,对应8,398个独立先导变异,无论是位点数量还是解析深度均实现跨越式提升。在欧洲人群荟萃分析中,研究单独鉴定出86,886个关联信号与8,260个独立位点,其中7,790个为全新未报道位点,不同代谢物的新位点占比从27%85%不等,乳酸等以往研究较少覆盖的代谢物更是实现近85%的全新发现。与已有研究相比,本研究的关联信号提升超过十倍,对前人报道位点的重复率高达93%,且效应方向高度一致。遗传力分析显示,249项代谢性状的遗传力介于2.8%19.5%之间,中位遗传力为10.2%,位点数量与遗传解释度呈现显著线性关系,证明超大样本量真正实现代谢遗传结构的深度解析。

图片

已知的和新的代谢性状遗传关联

低频变异的突出贡献:更高功能性、更强因果可解释性

过往代谢组遗传学研究高度依赖常见变异,而本研究依托高精度基因型填补与大样本优势,系统纳入低频变异(0.1%≤MAF<1%)与罕见变异(MAF<0.1%),变异总数最高可达9600万,远超同类研究。统计精细定位结果显示,在高置信度因果变异集合中,19.4%来自低频变异,这些低频变异中错义突变与剪接变异的比例高达23.1%,是常见变异(11.5%)的近两倍,表明低频变异更可能直接改变蛋白质序列或剪切功能,具备更强的机制可解释性。研究在多个关键代谢调控基因上鉴定出具有重大效应的低频功能突变,包括与脂类代谢相关的PCSK9ABCA1ANGPTL4,与芳香族氨基酸相关的PAH,与组氨酸相关的HAL,以及支链氨基酸代谢通路中的BCKDHABCKDK等。尤为重要的是,本研究首次在单一分析框架内同时捕获常见调控变异与低频功能变异,完整覆盖支链氨基酸分解代谢通路全部六个关键编码基因,清晰揭示只有超大样本才能完整解析核心代谢通路的多层次遗传架构。

图片

BCAA分解代谢途径中低频变异关联

多效性模式与跨维度共定位:从代谢位点到疾病机制的系统解码

大样本与高密度代谢谱使得本研究能够系统解析遗传变异的多效性模式。研究发现,部分位点呈现广泛多效性,例如GCKR错义变异可同时关联229项代谢物,成为全身代谢调控的核心枢纽;而更多位点呈现通路特异性多效性,如HMGCR区域变异主要调控脂质与脂蛋白谱。为进一步将代谢遗传信号与疾病、分子表型相连,研究开展跨亿级表型的大规模共定位分析,将代谢信号与FinnGenUKBBMVP三大生物库的疾病表型、eQTLsQTLpQTL数据整合,最终构建出包含93万余次共定位事件的遗传调控网络。其中最具突破性的发现是,在GP6GRK5ZFPM2三个基因位点,研究首次建立清晰的生物学链条:遗传变异通过调控血小板活化,导致血浆乳酸水平上升,最终增加肺栓塞与深静脉血栓风险,并明确指出乳酸并非致病驱动因子,而是血小板活化的替代性生物标志物,从而澄清长期流行病学观察中乳酸与血栓关联的因果迷雾。

顺式孟德尔随机化校正因果推断:颠覆关键代谢物与疾病的传统认知

鉴于传统孟德尔随机化易受水平多效性、连锁不平衡与反向因果干扰,可能产生误导性结论,本研究引入顺式孟德尔随机化(cis-MR)分析框架,仅使用目标基因顺式区域的遗传变异作为工具变量,最大限度降低偏倚,提升因果推断可靠性。针对流行病学与代谢领域高度关注的支链氨基酸BCAA2型糖尿病的关系,传统全基因组MR提示BCAA升高与2型糖尿病风险上升相关,而基于BCAT2DBTPPM1K等支链氨基酸分解代谢核心基因的顺式MR分析则显示完全零效应。研究据此得出明确结论:通过抑制BCKDK以降低BCAA水平的干预策略,无法降低II型糖尿病风险,直接为该靶点的临床转化提供关键遗传学劝阻证据。与此同时,研究精准复现LDL‑C与冠心病、空腹血糖与II型糖尿病的已知因果关系,并区分HMGCRLDLRPCSK9不同降脂靶点对II型糖尿病风险的差异效应,证明顺式MR框架可显著提升药物靶点评估的可靠性与临床转化价值。

图片

顺式孟德尔随机化药物靶标评价

开启代谢精准医学与药物研发的全新范式

这项覆盖61万人、249项代谢指标、全等位基因频谱的超大规模研究,构建了迄今为止最全面、最精准、最具临床转化价值的人类循环代谢物遗传调控资源库。研究不仅极大提升代谢性状的遗传力解释比例,揭示低频功能变异的关键作用,更建立起一套能够有效规避多效性偏倚、可靠推断代谢物与疾病因果关系的分析体系。研究结果澄清多项长期争议的科学问题,为II型糖尿病、心血管疾病、血栓栓塞性疾病等复杂疾病提供一批高置信度生物标志物与潜在药物靶点,其分析范式可直接推广至蛋白质组、表观组等其他分子表型研究。该成果标志着人类代谢遗传学正式进入百万人群、多谱系、全频谱、高因果精度的新时代,为精准代谢疾病预防、早期筛查与靶向治疗提供前所未有的遗传学支撑。

原文链接:https://doi.org/10.1038/s41586-026-10532-5