——解讀 ACS Synthetic Biology 2025 新研究
Cell-Free Protein Synthesis as a Method to Rapidly Screen Machine Learning-Generated Protease VariantsThornton et al., ACS Synth. Biol., 2025
一、為什么“機(jī)器學(xué)習(xí)設(shè)計(jì)蛋白",仍然離不開實(shí)驗(yàn)?
近年來,機(jī)器學(xué)習(xí)(Machine Learning, ML)在蛋白科學(xué)領(lǐng)域的影響力迅速擴(kuò)大。從 AlphaFold 帶來的結(jié)構(gòu)預(yù)測革命,到各類序列生成模型用于蛋白設(shè)計(jì),算法正在以未有的速度探索蛋白序列空間。
然而,一個(gè)現(xiàn)實(shí)問題始終存在:算法只能“提出假設(shè)",而蛋白功能的優(yōu)劣,仍然必須由實(shí)驗(yàn)數(shù)據(jù)來驗(yàn)證。
尤其是在酶工程和功能蛋白優(yōu)化中,ML 模型對訓(xùn)練數(shù)據(jù)提出了更高要求——不僅要多,還要真實(shí)反映蛋白功能差異。傳統(tǒng)依賴細(xì)胞表達(dá)、純化和動(dòng)力學(xué)表征的流程,往往周期長、通量有限,很容易成為 ML 迭代的瓶頸。
在這一背景下,Thornton 等人在 ACS Synthetic Biology 發(fā)表的這項(xiàng)研究,給出了一個(gè)具代表性的解決思路:
?? 將無細(xì)胞蛋白合成(CFPS)直接嵌入機(jī)器學(xué)習(xí)驅(qū)動(dòng)的蛋白設(shè)計(jì)流程中。

二、研究思路一覽:一個(gè)典型的“Create–Test–Learn"閉環(huán)
這項(xiàng)研究圍繞一種人工設(shè)計(jì)的蛋白酶 Con1 展開,目標(biāo)是提升其催化活性。整體流程可以概括為三個(gè)階段:
Create(設(shè)計(jì))
基于結(jié)構(gòu)預(yù)測和計(jì)算分析,篩選出可能影響底物結(jié)合的關(guān)鍵殘基區(qū)域,并進(jìn)行多位點(diǎn)突變設(shè)計(jì);
Test(測試)
利用無細(xì)胞蛋白合成體系,在體外快速合成蛋白變體,并直接進(jìn)行酶活性檢測;
Learn(學(xué)習(xí))
將“序列—功能"數(shù)據(jù)輸入主動(dòng)學(xué)習(xí)算法(ALDE),由模型推薦下一輪更有潛力的突變組合。
通過僅兩輪篩選、約百個(gè)變體,研究者成功獲得了酶活性提升約 4 倍的突變體,展示了該流程在效率上的顯著優(yōu)勢。

Create–Test–Learn 工作流程示意圖(Thornton et al., ACS Synth. Biol., 2025)
三、無細(xì)胞蛋白合成在這里“厲害"在哪里?
值得注意的是,作者并沒有把 CFPS 當(dāng)作“傳統(tǒng)細(xì)胞表達(dá)的替代方案",而是將其定位為機(jī)器學(xué)習(xí)實(shí)驗(yàn)數(shù)據(jù)的加速器。
從方法學(xué)角度來看,CFPS 在這一工作中體現(xiàn)出三點(diǎn)關(guān)鍵價(jià)值:
快速獲得“可比較"的功能數(shù)據(jù)
研究中并未追求嚴(yán)格的動(dòng)力學(xué)絕-對參數(shù),而是通過統(tǒng)一條件下的反應(yīng)初始速率作為 fitness 指標(biāo)。事實(shí)證明,這種相對比較數(shù)據(jù)已經(jīng)足以支撐 ML 對突變體優(yōu)劣的判斷。
開放體系,實(shí)驗(yàn)設(shè)計(jì)更自由
無細(xì)胞體系不受細(xì)胞生存、毒性或底物通透性限制,尤其適合早期功能篩選和多突變組合的測試。
實(shí)驗(yàn)速度,決定 ML 是否真正“跑得動(dòng)"
當(dāng)一輪蛋白表達(dá)和功能測試可以在數(shù)小時(shí)內(nèi)完成,機(jī)器學(xué)習(xí)的“主動(dòng)學(xué)習(xí)"優(yōu)勢才能被真正釋放。

CFPS 與純化蛋白活性對比(Thornton et al., ACS Synth. Biol., 2025)
四、從文獻(xiàn)到產(chǎn)業(yè)實(shí)踐:穩(wěn)定 CFPS 平臺(tái)的重要性
文中作者也明確指出,如果采用更成熟、標(biāo)準(zhǔn)化的無細(xì)胞蛋白合成體系,該流程在通量、重復(fù)性和自動(dòng)化方面仍有提升空間。
這恰恰反映了當(dāng)前行業(yè)的一個(gè)重要趨勢:無細(xì)胞蛋白合成正在從“實(shí)驗(yàn)室方法",演進(jìn)為“工程化工具"。
在這一方向上,珀羅汀生物(PLD Technology)正致力于將無細(xì)胞蛋白表達(dá)打造成可直接嵌入蛋白設(shè)計(jì)、篩選和驗(yàn)證流程的通用工具,服務(wù)于酶工程、功能蛋白研究以及 AI 蛋白設(shè)計(jì)等場景。
當(dāng) CFPS 不再需要研究者投入大量精力進(jìn)行體系搭建,而是能夠穩(wěn)定輸出高質(zhì)量蛋白和功能數(shù)據(jù)時(shí),機(jī)器學(xué)習(xí)模型的優(yōu)勢才能被充分放大。

珀羅汀生物聯(lián)合自動(dòng)化儀器進(jìn)行高通量篩選應(yīng)用
五、總結(jié):蛋白工程的核心競爭力正在發(fā)生變化
這項(xiàng)研究傳遞出一個(gè)非常清晰的信號:
未來蛋白工程的競爭,不僅是算法的競爭,也不僅是實(shí)驗(yàn)技術(shù)的競爭,而是“數(shù)據(jù)生成效率 × 設(shè)計(jì)迭代速度"的綜合競爭。
無細(xì)胞蛋白合成,正在成為連接“計(jì)算設(shè)計(jì)"與“實(shí)驗(yàn)驗(yàn)證"的關(guān)鍵橋梁。而當(dāng)這一橋梁足夠穩(wěn)定、足夠快速,蛋白工程的創(chuàng)新節(jié)奏也將被重新定義。
掃一掃,關(guān)注微信
微信掃一掃