2025年7月18日,安徽农业大学王晓波,中国农业科学院作物科学研究所邱丽娟、李英慧共同通讯在Advanced Science上发表了题为GmSop20 Functions as a Key Coordinator of the Oil-To-Protein Ratio in Soybean Seeds的研究论文,该研究通过全基因组和全转录组关联分析,鉴定出大豆 20号染色体上的GmSop20 基因是调控种子油蛋白比的关键因子。遗传分析显示其驯化选择等位基因在中美栽培品种中占主导,能使油蛋白比从野生种的 0.35 提升至栽培种的0.47,敲除该基因则降至0.19,过表达可升至0.64。机制上,GmSop20通过直接激活GmSWEET10a的表达,促进糖从种皮向胚运输,从而增强油脂积累。该发现揭示了GmSop20作为核心调控因子的作用,为精准调控大豆油蛋白比的育种提供了重要靶点和理论依据。
大豆是全球最重要的作物之一,提供了约 69% 的植物蛋白和 28% 的植物油,其产量需在 2050 年翻倍才能满足人口增长需求。在大豆驯化过程中,种子油蛋白比(油含量 / 蛋白含量)显著提高,但这一关键农艺性状的核心遗传调控因子一直不明确。
油和蛋白是大豆种子的核心营养成分,且通常呈负相关(油高则蛋白低,反之亦然),这给育种带来挑战 —— 如何精准调控两者比例以满足不同需求(如高油用于榨油,高蛋白用于饲料)。因此,解析油蛋白比的遗传机制对大豆品质改良具有重要理论与应用价值。
识别调控大豆种子油蛋白比的关键基因,阐明其作用机制及驯化选择过程,为定向改良大豆营养成分提供靶点。
为解决上述问题,研究团队采用了多维度整合分析策略:
关联分析:通过全基因组关联分析(GWAS)和全转录组关联分析(TWAS),对 1228 份栽培大豆在 2 个地点(安徽合肥、河北石家庄)连续 3 年的油、蛋白含量表型数据进行关联,定位关键基因。
遗传多样性分析:对比野生大豆(G. soja)、地方品种和栽培品种中目标基因的等位基因频率,解析驯化选择信号。
功能验证:利用 CRISPR/Cas9 构建基因敲除突变体,以及过表达株系,通过表型测定验证基因功能。
分子机制研究:结合 RNA-seq(差异表达基因分析)、DAP-seq(全基因组结合位点分析)、EMSA(体外结合实验)、酵母单杂交(Y1H)等技术,解析基因调控网络。
GWAS 和 TWAS 联合分析发现,20 号染色体上的GmSop20基因是调控大豆种子油和蛋白含量的核心位点。该基因位于一个 39.1 kb 的连锁不平衡区间内,其第 2 外显子的比例与油含量呈正相关、与蛋白含量呈负相关,提示其可能通过转录或剪切调控影响油蛋白比。
图1鉴定与大豆籽油和蛋白质相关的主要 QTL GmSop20
遗传多样性分析显示,GmSop20 存在 3 种单倍型,其中GmSop20c(驯化选择等位基因)经过强烈人工选择,在我国北方和美国的栽培品种中占主导地位。
该等位基因使油蛋白比从野生种的 0.35 显著提升至栽培种的 0.47;
从野生大豆(G. soja)到地方品种再到栽培种,GmSop20c的频率从 10.85% 升至 60.47%,最终达 91.23%,证实其在驯化和育种中的关键作用。
图2 GmSop20对栽培大豆种子油和蛋白质含量的等位基因影响
图3 GmSop20不同单倍型的进化和地理分布
通过基因编辑和过表达实验,明确 GmSop20 对油蛋白比的调控效应:
敲除 GmSop20:油蛋白比从野生型的 0.24 降至 0.19(蛋白含量升高,油含量降低);
过表达 GmSop20:油蛋白比从野生型的 0.57 升至 0.64(油含量升高,蛋白含量降低);
关键特征:敲除和过表达株系的总油 + 蛋白含量基本稳定(约 60%),表明 GmSop20 主要调控两者的比例而非总量。
图4 GmSop20和GmSop07对种子油和蛋白质含量的影响
GmSop20 编码 C2H2 型锌指转录因子,其作用机制为:
直接激活靶基因:通过 DAP-seq 鉴定到 GmSop20 可结合 GmSWEET10a/b 的启动子,EMSA 和 Y1H 实验进一步证实其直接激活这两个基因的表达;
糖运输调控:GmSWEET10a/b 是糖转运蛋白,负责将糖从种皮运输到胚。GmSop20 通过增强其表达,促进胚中碳源积累,优先用于油合成(而非蛋白),从而提高油蛋白比;
等位基因差异:驯化等位基因 GmSop20c比原始等位基因 GmSop20^CACT 更稳定(蛋白稳定性更高),激活 GmSWEET10a/b 的能力更强。
图5 GmSop20促进GmSWEET10a和GmSWEET10b的表达
图6 GmSop20 促进糖从种皮到胚胎的运输
GmSWEET10a 是已报道的驯化基因(其启动子 9 bp 缺失被选择),本研究发现:
GmSop20 与 GmSWEET10a 的驯化等位基因被协同选择,在 90% 以上的栽培种中同时存在;
两者共同作用时,GmSWEET10a 的表达量、油含量及油蛋白比提升效果显著优于单一基因,形成 “上游调控因子 – 下游转运蛋白” 的协同调控网络。
图7 GmSop20介导了一种新的人工选择事件来调控GmSWEET10a的表达
图8 GmSop20通过增强GmSWEET10a/b的表达来调节种子油和蛋白质含量的机制示意图
该研究首次鉴定出 GmSop20 作为大豆种子油蛋白比的关键协调因子,阐明其通过激活 GmSWEET10a/b 促进糖运输、调控油积累的分子机制,并揭示其与 GmSWEET10a 的协同驯化过程。
这一发现为大豆品质改良提供了精准靶点:通过编辑 GmSop20 或其调控模块,可定向调整油蛋白比(如高油品种或高蛋白品种),满足食品工业、饲料等不同领域的需求。同时,“双驯化基因协同作用” 的模式为解析作物复杂性状的遗传机制提供了新视角。