人类基因组中绝大多数疾病易感变异位于非编码区域,这使得从遗传位点到致病机制的解读长期面临巨大挑战。循环蛋白质作为连接基因型与表型的关键功能中介,能够直接反映遗传变异对细胞与组织功能的下游影响,是破解复杂疾病遗传机制的重要突破口。然而,既往蛋白质基因组研究大多局限于较小样本、单一队列,且过度依赖邻近基因的顺式调控分析,对远距离反式调控、多组织交叉调控、蛋白质多效性及其与疾病的真实因果关联缺乏系统、稳健的解析。近期发表于《Cell》的这项重磅研究,完成了迄今为止全球最大规模的多队列蛋白质基因组整合荟萃分析,覆盖38个国际队列、多达78,664名受试者与1,161种血浆蛋白,系统鉴定了超过24,000个高置信度蛋白质数量性状位点,同时包含邻近调控的顺式位点与远距离调控的反式位点,并通过机器学习精准分配效应基因,全面解析了调控循环蛋白质水平的核心通路、细胞类型与组织来源,最终建立起蛋白质与疾病之间的稳健因果关联,为疾病机制解析、药物靶点发现与老药新用提供了前所未有的遗传学证据与全新研究范式。

这项研究突破了传统蛋白质基因组研究的多重局限,不再局限于局部顺式调控信号,而是首次在超大样本中系统性解析顺式与反式双重调控网络,让非编码变异通过蛋白质影响疾病的完整路径得以清晰呈现。研究整合了来自欧洲、亚洲、美洲等多个人群队列的基因组与蛋白质组数据,通过统一的质控、荟萃分析与贝叶斯精细定位,构建了迄今最完整、最可靠的人类血浆蛋白质遗传调控图谱,为理解蛋白质水平的遗传决定机制提供了高精度、广谱性的基础资源。

大规模蛋白质数量性状位点的全景鉴定与核心特征
研究基于38个队列近8万人的样本规模,对1,161种血浆蛋白质开展全基因组蛋白质数量性状位点定位,在严格的统计阈值下共鉴定出14,690个变异,并通过贝叶斯精细定位得到24,738个独立可信的蛋白质数量性状位点,其中顺式位点5,040个,反式位点高达19,698个,覆盖超过94%的检测蛋白质。这些位点中超过八成被定义为高置信度信号,表现为跨队列效应方向一致、统计显著性强、异质性极低,其中数千个位点属于国际上首次报道。研究进一步发现,不同蛋白质的遗传调控模式呈现高度异质性,部分蛋白质主要受顺式位点调控,可解释近半数表达变异,而另一些蛋白质则几乎完全由反式位点主导,个别蛋白质的反式位点解释度甚至超过60%,远高于顺式位点的贡献。这一发现颠覆了以往以顺式调控为核心的认知,证明远距离反式调控是循环蛋白质组的关键遗传调控形式。研究还证实,这些遗传效应在不同血统人群中表现出显著的可重复性,为跨人群推广应用提供了坚实支持。
基于SCALLOP和UKBB的荟萃分析精细定位蛋白质数量性状位点
反式调控网络:通路、细胞类型与跨器官通讯的全局解析
由于反式位点远离目标蛋白编码基因,其效应基因的准确识别一直是领域难题。本研究通过整合生物学先验知识与机器学习模型,成功为超过半数的反式位点分配了中高置信度的效应基因,进而系统解析了调控循环蛋白质组的核心生物学通路与细胞类型。研究发现,天冬酰胺N-连接糖基化是最显著富集的调控通路,广泛参与140余种血浆蛋白质的调控,通过影响分泌蛋白的折叠、运输、稳定性与半衰期,成为决定循环蛋白质水平的共性机制。除此之外,血小板活化、胆固醇代谢、细胞因子受体互作等通路也频繁富集,反映出血液稳态、免疫调控与代谢平衡是遗传调控的重点方向。在细胞与组织层面,效应基因显著富集于肝细胞、免疫细胞、内皮细胞、肺泡Ⅱ型细胞等特定类型,其中肝脏作为核心分泌器官,参与多数循环蛋白质的远程调控,而免疫细胞则主要调控细胞因子与炎症相关蛋白。部分蛋白质可被多种细胞类型协同调控,清晰揭示了跨器官通讯在维持血浆蛋白质稳态中的关键作用。这部分结果首次在人类群体水平完整绘制了循环蛋白质的远程调控网络,让从基因组到蛋白质组的功能传导路径变得可解读、可预测。

鉴定效应基因揭示了参与血浆蛋白调控的主要通路和细胞类型
多效性模式与疾病遗传机制的全新解读
近半数蛋白质数量性状位点呈现多效性,可同时影响多个蛋白质或多种疾病表型。研究将这些多效性位点分为分子多效性、表型多效性与非特异性多效性三类,其中反式位点的多效性强度是顺式位点的四倍以上。分子多效性位点主要作用于蛋白质复合物、配体‑受体对或同一通路成员,反映组织内部的协同调控程序;表型多效性位点则通过改变循环蛋白质水平,同时影响多种复杂疾病,为解读GWAS位点的隐藏机制提供关键线索。例如,痤疮风险位点通过调控角质化相关蛋白质发挥作用,类风湿关节炎、银屑病等自身免疫病则共享同一TYK2反式调控信号。研究进一步发现,多效性效应基因高度富集于肝细胞,印证了肝脏在全身代谢与免疫稳态中的核心地位。这些结果说明,循环蛋白质组不仅是疾病的标志物,更是遗传变异发挥系统性效应的功能载体,为理解复杂疾病的共享遗传机制提供了全新视角。

分子层面与全基因组范围内的多效性
顺式与反式调控的因果效应差异:重塑疾病因果推断范式
研究系统对比了基于顺式位点与反式位点的孟德尔随机化因果推断结果,发现在近百个蛋白质‑疾病关联中,两者的效应方向与强度并非完全一致,部分甚至呈现相反信号,提示仅依靠顺式位点进行因果推断可能产生偏差。例如,骨硬化蛋白与骨折风险的关联在顺式分析中显著存在,但在反式分析中则无效应,说明顺式位点可能捕获局部调控效应,而反式位点更能反映生理状态下全身水平的真实影响。同时,研究对比了遗传因果推断与观察性流行病学结果,发现两者重合度极低,仅有不到四分之一的信号同时得到两类证据支持,直接证明遗传因果证据在生物标志物与药物靶点评估中的不可替代性。研究还鉴定出一批同时获得遗传、前瞻性观察与横断面分析一致支持的高置信度蛋白质‑疾病对,其中血浆弗林蛋白酶与高血压、心肌梗死、房颤的关联最为突出,为心血管疾病干预提供了全新靶点。
蛋白质‑疾病精准关联与药物重定位的突破性发现
基于UBKK的大规模因果推断,研究将蛋白质数量性状位点、疾病GWAS与蛋白质组图谱进行联合解析,成功实现疾病机制解读与药物重定位。研究发现,超过90%的疾病蛋白质标志物特征,均可显著富集于特定多效性反式位点,说明循环蛋白质特征能够直接反映组织内部的疾病驱动过程。最具转化价值的是,研究基于TYK2位点的反式调控模式,明确提出TYK2抑制剂可从已获批的银屑病适应症,拓展至类风湿关节炎与自身免疫性甲状腺疾病,其遗传信号、蛋白质特征与疾病风险完全共线,为临床试验设计提供了直接遗传学支持。此外,研究还鉴定出多个可用于疾病早筛与亚型分型的蛋白质标志物,其遗传稳定性高、跨人群可重复,具备极强的临床转化潜力。

rans-pQTL增强作用能够解释未来的生物标志物特征
研究意义:开启蛋白质组驱动的精准医学新时代
这项全球最大规模的多队列蛋白质基因组研究,构建了完整的人类血浆蛋白质遗传调控资源,将蛋白质基因组学从单一顺式调控推进到顺式‑反式全景解析的新阶段,不仅系统回答了非编码遗传变异如何通过蛋白质影响疾病表型这一核心科学问题,更为疾病机制解析、药物靶点发现、生物标志物开发与老药新用提供了高精度、可落地的遗传学工具。研究建立的多队列整合分析框架可广泛推广至其他代谢、免疫、肿瘤相关蛋白质组研究,为跨人群、跨疾病的精准医学研究提供通用范式。随着研究成果的公开释放,人类对蛋白质组遗传调控与疾病机制的理解将迈入更系统、更精准、更贴近临床应用的全新阶段。
原文链接:https://doi.org/10.1016/j.cell.2026.03.049