蛋白表达优化的关键策略


一、引言

在生命科学研究和生物制药开发中,高效、可重复的重组蛋白表达是许多实验的基础。无论是结构与功能研究、抗体制备,还是工业化生产,都需要针对不同蛋白的特性,通过多方面的策略全面优化表达水平和质量。蛋白表达优化既包括基因层面的设计,也涵盖载体与宿主的选择、培养条件与诱导方案的调整,还需关注蛋白折叠与溶解、下游纯化等环节的协同配合。本文将从基因设计、载体构建、宿主体系、培养与诱导条件、标签与融合策略、折叠与溶解、发酵与规模化生产、以及纯化与分析等多个维度,详述蛋白表达优化的关键策略,为科研与工程实践提供参考。


二、基因层面的设计与优化

2.1 密码子优化

由于不同生物对同一氨基酸的密码子偏好存在差异,原始来源基因(如人源或其他真核生物基因)在经典大肠杆菌体系中表达时常常出现表达量低、蛋白折叠不良等问题。因此,针对目标宿主进行密码子优化已成为基因设计的首要环节。通过分析目标宿主(如大肠杆菌、酵母、哺乳动物细胞)中高丰度基因的密码子使用频率,将原始序列中的低频密码子替换为宿主偏好密码子,可以显著提高翻译效率和蛋白产量。此外,合理调控基因总体GC含量、避免严重的mRNA二级结构区段,也有助于增强转录和翻译水平。

2.2 mRNA二级结构与稳定性

mRNA在转录后会形成各种二级结构。如果目标序列在核糖体结合位点(Shine–Dalgarno序列)或起始密码子附近形成稳定的发夹结构,将阻碍核糖体装配,降低翻译效率。通过软件预测 mRNA 二级结构,将起始区附近的强二级结构打散、降低局部GC含量,可加速核糖体进入并提高起始效率。此外,去除潜在的剪接位点、隐蔽剪接位点以及不必要的重复序列,也可提高 mRNA 的稳定性与翻译延续性,从而提升蛋白表达。

2.3 序列标签与融合片段

在基因设计过程中,往往需要在 N 端或 C 端添加融合标签,以便后续检测或纯化。常见的融合标签包括小分子标签(如 His-tag)、荧光蛋白(如 GFP)或亲和标签(如 GST、MBP)等。这些标签不仅方便亲和层析纯化、免疫印迹等实验,也有助于提升蛋白在宿主细胞中的可溶性与折叠效率。不过,不同标签对蛋白结构的影响不尽相同,需要结合目标蛋白特性进行筛选与设计。若需获得最终产物不含标签,可在标签与目标蛋白之间插入可切割的酶切位点(如 TEV、HRV3C 等),方便硫酸铵沉淀后进行酶切去除。标签序列设计时应尽量避免引入额外的二级结构或剪接位点,以免影响 mRNA 翻译和蛋白折叠。


三、载体与启动子选择

3.1 质粒载体骨架

强大而稳定的质粒载体是高效表达的基础。常见的表达载体通常包含:高拷贝数复制起点、抗生素抗性基因、灵活的多克隆位点(MCS)以及适合目标宿主的启动子和终止子等。对于大肠杆菌体系而言,应优先选择具备高拷贝复制起点(如 pUC、pBR322 衍生)的载体,可在宿主中形成更多的模板分子,提供更多翻译机会;而在哺乳动物细胞体系中,则需选择含有强启动子(如 CMV、EF-1α 或 SV40 等)的质粒,以确保高强度转录。

3.2 启动子和调控元件

启动子是影响转录效率的关键,常用的强启动子有大肠杆菌中的 T7 启动子(配合 T7 RNA 聚合酶表达体系)和真核哺乳动物中的 CMV 启动子。以大肠杆菌为例,T7 启动子依赖于 BL21(DE3)等含有 T7 RNA 聚合酶基因的宿主菌株,可实现诱导式高水平表达;若选择真核表达,如 HEK293 或 CHO 细胞,则 CMV 启动子可产生很高的转录水平。除此之外,还可在启动子上下游添加增强子、稳定子(如 WPRE)等元件,通过提升mRNA 稳定性或加强转录活性,进一步推动目标基因表达。

3.3 多顺反子与 IRES/MCS 设计

在需要共表达多个亚基(如抗体轻链与重链)或多个功能域时,可采用多顺反子设计,将不同基因串联于同一载体中,并在中间插入 IRES 序列实现多基因共表达,或为每个基因分别配备独立启动子。这样既可确保各个亚基在同一细胞内同步表达,也可避免共转染时份子比例失衡的问题。在哺乳动物抗体表达场景中,针对抗体轻链与重链的最佳质粒比例,可先按 1:1 作为预设,然后结合具体细胞系与表达效果进行进一步微调。


四、宿主体系与表达条件

4.1 原核表达体系(大肠杆菌)

大肠杆菌表达体系具备培养周期短、成本低、表达效率高的优点,但对真核蛋白的翻译后修饰能力有限。常用宿主菌株包括 BL21(DE3)、Rosetta(含 tRNA 补充)、Origami(放宽二硫键形成)等。若目标蛋白含有稀有密码子,可选择含有 tRNA 质粒的 Rosetta 或 CodonPlus 菌株;若需在胞质中形成二硫键桥,则 Origami 系列因氧化环境更易形成二硫键而更适合。与此同时,还可利用诱导温度(如从 37 ℃ 降至 16–25 ℃)或降低诱导剂浓度等方法,减缓蛋白翻译速率,有助于提高蛋白可溶性。

4.2 真核表达体系(昆虫与哺乳动物细胞)

对于需要复杂折叠、糖基化或膜定位的真核蛋白,一般选用昆虫细胞(虫杆病毒表达系统)或哺乳动物细胞(如 HEK293、CHO、293F/293E 细胞)。昆虫细胞体系成本适中、具备部分真核翻译后修饰能力,适合分泌蛋白和复杂蛋白表达;哺乳动物体系则提供最接近天然的翻译后修饰环境,能产生功能更为稳定、活性更高的蛋白,适用于疫苗抗原、抗体药物等高价值蛋白质生产。在选择具体细胞系时,应综合考量表达产量、翻译后修饰需求和成本效益等因素。例如,对于快速获得可溶性膜蛋白,可使用专业优化的细胞表达系统,并结合流式筛选或荧光显微镜评估表达效果。

4.3 培养基与培养条件

培养基配方对细胞生长和蛋白表达至关重要。大肠杆菌常用 LB、2×YT、TB 或 SOB 培养基,其中 TB(Terrific Broth)因含有更丰富的碳源和氮源,可在后期达到更高密度,有利于产量提升。对于哺乳动物细胞,常用的有 DMEM、RPMI 1640、FreeStyle™ 293 Expression Medium 或 ExpiCHO™ Expression Medium 等专用高密度无血清培养基。培养温度、pH 值和溶氧水平也需仔细优化:大肠杆菌在 37 ℃ 生长快、分裂迅速,但可溶性蛋白易形成包涵体;将温度降低至 16–25 ℃ 有助于改善可溶性表达。哺乳动物细胞常在 37 ℃、5% CO₂ 条件下培养,但在蛋白表达高峰期可适当降低温度(如 30–32 ℃),以延长表达时间并减少蛋白降解。


五、诱导与表达时间优化

5.1 诱导剂选择与浓度优化

在诱导型表达体系中(如大肠杆菌的 T7 启动子-IPTG 体系、哺乳动物细胞的四环素感受系统),诱导剂的种类与加入时间对表达水平影响明显。大肠杆菌中常用 IPTG 进行诱导,一般在 OD₆₀₀ 达到 0.6–0.8 时加入 IPTG;若 IPTG 浓度过高(如 ≥ 1 mM),会导致细胞应激过大并产生过量包涵体,可适当将诱导浓度降低至 0.1–0.5 mM 或使用乳糖进行渐进诱导以平衡生长与表达。哺乳动物细胞中,若使用四环素转录调控系统,可按厂商建议的诱导剂量进行添加,并结合表达检测(如荧光或定量 PCR)调整最佳诱导浓度。

5.2 诱导时间与温度梯度

蛋白表达往往具有时间与温度依赖性。以大肠杆菌为例,37 ℃ 快速诱导可在 3–4 h 内获得大量蛋白,但可溶性往往较差;若在 16–20 ℃ 缓慢诱导,可将诱导时间延长至 12–16 h,以获得更多可溶性蛋白。哺乳动物细胞通常在诱导后 48–72 h 达到表达高峰;但若温度从 37 ℃ 降至 30 ℃,可延长表达窗口并提高蛋白质量,尤其适用于需要复杂折叠和后修饰的蛋白。在任何体系中,建议在小规模摇瓶试验中设置不同诱导温度(如 16、20、25、30、37 ℃)和诱导时间(4 h、8 h、12 h、24 h、48 h),并结合 SDS-PAGE、Western blot 或活性测定等方法进行对比,快速筛选最佳诱导条件。


六、融合标签与可溶性增强策略

6.1 常见融合标签

为了增强可溶性和纯化方便,研究人员常在目标蛋白 N 端或 C 端融合标签。常见的可溶性增强标签包括 MBP(麦芽糖结合蛋白)、GST(谷胱甘肽 S-转移酶)以及 NusA 等,这些标签可作为“折叠伴侣”,帮助靶蛋白在大肠杆菌菌体中保持可溶状态。荧光蛋白(如 GFP、mCherry)也可用于直接监测表达水平和定位。小分子亲和标签(如 His-tag、Strep-tag)因其在柱层析中具有高亲和力,便于一步纯化,但对可溶性增强作用有限。对于复杂蛋白(如全长抗体、膜蛋白),可尝试将其融合至更大的可溶性伴侣,并在融合标签与靶蛋白之间插入可切除酶切位点,以保证纯化后最终产物的功能正确性。

6.2 分泌信号肽与细胞定位

对于需要在胞外环境或胞内特定胞器中进行折叠与二硫键修饰的蛋白,可在 N 端添加真核分泌信号肽(如 Igκ 链信号肽、原癌基因信号肽),将蛋白分泌至培养上清,从而避免胞内降解并简化纯化流程。在哺乳动物表达体系中,分泌表达往往能带来更高的产量与质量,并能获得接近天然折叠状态的重组蛋白。信号肽的选择要兼顾表达细胞系与蛋白特性,不同信号肽的效率差异较大,建议先行进行小规模筛选试验。


七、蛋白折叠与可溶性

7.1 温度与诱导速度平衡

如前所述,降低诱导温度有助于减缓翻译速率,让缓慢折叠蛋白有更多机会正确折叠。在大肠杆菌中,将诱导温度从 37 ℃ 降至 16–20 ℃,并延长诱导时间至 12 h 以上,可显著减少包涵体形成,提高可溶性产率。若蛋白仍以包涵体形式沉积,可尝试加入化学助剂(如甘油、甘氨酸、氨基酸混合物)或共表达分子伴侣(如 GroEL/ES、DnaK/DnaJ/GrpE 等),进一步促进折叠。

7.2 包涵体蛋白的可溶化与重折叠

当目标蛋白大量以包涵体形式沉积时,可收集包涵体、进行洗涤去除非特异蛋白杂质,并在高浓度变性剂(如 6–8 M 尿素或 6 M 盐酸胍)中溶解,随后采用梯度稀释或透析方式进行折叠缓冲液重折叠。折叠过程中常加入 L-精氨酸、还原/氧化型谷胱甘肽(GSH/GSSG)等,帮助形成正确的二硫键。重折叠效率受蛋白本身特性影响较大,需结合透析温度、pH、盐浓度和稀释速度等参数进行微调。


八、发酵与规模化生产

8.1 批式与联营批发酵策略

在大规模蛋白生产中,发酵工艺是提高产量与降低成本的关键。常见发酵模式包括批式(Batch)、阶梯式(Fed-batch)和连续式(Continuous)。对于表达量中等或易形成包涵体的蛋白,可选择批式发酵,操作简便;若目标蛋白需高产量且耗糖量较大,联营批模式可通过在线补料(如碳源、氮源、金属离子)维持菌体高密度并延长表达时间,从而大幅提升蛋白产量。在哺乳动物细胞发酵中,细胞密度与产量密切相关,可通过优化补料策略(如葡萄糖、谷氨酰胺补充)和细胞培养参数(溶氧、pH)实现更高产量。

8.2 温度与通气速率控制

发酵过程需精确控制温度与溶氧,以平衡细胞生长与蛋白表达。对易降解或复杂折叠蛋白,可在进入表达阶段后适当降低温度(如从 37 ℃ 降至 20–25 ℃),延长表达时间并减少降解;同时,通过提高溶氧供给或增加搅拌速率,保证高密度培养条件下细胞代谢与翻译所需氧气充足。此外,适时调整 pH(如维持在 6.8–7.2)和滴定补料速率,可避免酸化或碱化对蛋白折叠的不利影响。


九、蛋白纯化与分析

9.1 初步分离(细胞裂解与上清收集)

对于胞内表达蛋白,需先进行细胞破碎(如超声、压力破碎或化学裂解),随后通过离心或膜过滤去除细胞碎片,获得可溶性蛋白上清;对于分泌蛋白,可直接收集培养上清,并使用超滤或盐析进行预浓缩,以减少下游纯化负担。裂解缓冲液中通常添加低浓度表面活性剂(如 Triton X-100、NP-40)或还原剂(如 β-巯基乙醇、DTT),以稳定蛋白结构并降低变性风险。

9.2 亲和层析与纯化步骤

基于融合标签的亲和层析是最常用的纯化手段。例如,His-tag 蛋白可通过金属螯合亲和层析(IMAC)一步回收高纯度蛋白;GST-tag 蛋白可通过谷胱甘肽树脂纯化。纯化条件(如 pH、盐浓度、洗脱梯度)需根据目标蛋白特性进行优化,以提高结合特异性并减少非特异结合。若不需要标签,可在亲和层析后使用特异性蛋白酶(如 TEV、HRV3C)切除标签,并结合第二步亲和层析或疏水作用层析(HIC)进一步去除酶、未切除的融合蛋白及其他杂质。

9.3 分析与质量控制

纯化后需对蛋白进行 SDS-PAGE、Western blot、质谱(MS)、高效液相色谱(HPLC)等方法检测,以评估蛋白的纯度、分子量和同质性。对于酶类、受体或抗体等功能蛋白,还需进行活性检测(如酶活性测定、结合亲和力测定)。若蛋白需用于结晶与结构分析,还需通过动态光散射(DLS)检测蛋白聚集状态,并在适合的缓冲体系中进行浓缩与冷冻保存,以保证长期稳定性。


十、常见问题与解决方案

  1. 表达产量低

    • 检查质粒序列是否正确,是否存在突变;

    • 重新设计或优化密码子;

    • 更换强启动子或提高载体拷贝数;

    • 调整诱导温度与诱导剂浓度,并延长诱导时间;

    • 采用高密度培养基或联营批发酵模式。

  2. 蛋白主要呈包涵体形式

    • 降低诱导温度(< 25 ℃)并延长诱导时间;

    • 降低诱导剂浓度或采用渐进诱导;

    • 在裂解缓冲中添加低浓度甘油、乳糖或氨基酸,促进可溶性折叠;

    • 共表达分子伴侣(如 GroEL/ES、DnaK/DnaJ)或将蛋白融合至可溶性伴侣标签;

    • 结合化学折叠方案(梯度稀释或透析)进行重折叠。

  3. 蛋白降解严重

    • 在裂解和纯化过程中添加蛋白酶抑制剂;

    • 降低培养与提取温度;

    • 调整裂解缓冲 pH 和盐浓度;

    • 尽快进行纯化并减少样品暴露在室温下的时间;

    • 若哺乳动物细胞体系,可在表达高峰期添加蛋白酶抑制剂或延长诱导时间后尽快收获。

  4. 纯化后蛋白聚集

    • 在缓冲中添加低浓度甘油或非离子表面活性剂(如 Tween 20);

    • 适当调节 pH(如从 pH 7.4 调至 6.8 或 8.0);

    • 添加低浓度盐(如 50–150 mM NaCl)或二硫键还原剂(如 DTT);

    • 使用凝胶过滤层析(SEC)分离单体与聚集体;

    • 进行稀释再浓缩法以打散聚集体。


十一、结语

蛋白表达优化是一项系统工程,涉及基因设计、载体构建、宿主体系、培养与诱导方案、标签与融合策略、折叠与重折叠、发酵工艺及纯化分析等多个环节。通过对每个环节的细致优化与整体协调,可显著提高目标蛋白的产量与质量。面对不同蛋白的特性,应结合多种优化策略进行组合实验,逐步筛选出最佳表达方案。希望本文梳理的核心要点与常见实践能为广大科研工作者提供参考,助力重组蛋白研究与生产取得更好成果。