冷凍電鏡(cryo-EM)技術帶來了分辨率革命,讓我們能夠以原子級的高分辨率觀察并描繪蛋白質結構?;谌斯ぶ悄埽ˋI)的AlphaFold等工具實現(xiàn)了對蛋白質結構的快速且精準的預測,如今,AlphaFold已經(jīng)預測了地球上幾乎所有已知的蛋白質的結構。
從歷史上來看,結構生物學(Structural Biology)一直專注于研究已知物質。而現(xiàn)在,結構生物學正經(jīng)歷著一種范式轉變——從靶向結構確定到結構引導的發(fā)現(xiàn)先前未被表征的生物實體。而冷凍電鏡的高分辨率能力以及人工智能的結構預測能力,為探索完全未知的生物實體提供了前所未有的機會。
最近,深圳醫(yī)學科學院顏寧教授團隊接連發(fā)表了幾篇論文,提出了一個名為CryoSeek(酷尋)的新策略,將冷凍電鏡作為一種觀察工具,結合AI輔助的自動建模和生物信息學分析,發(fā)現(xiàn)自然界中完全未知的新型生物實體。
北京時間2025年1月1日,顏寧、李張強、閆創(chuàng)業(yè)等人在《美國國家科學院院刊》(PNAS)發(fā)表了題為:CryoSeek II: Cryo-EM analysis of glycofibrils from freshwater reveals well-structured glycans coating linear tetrapeptide repeats 的研究論文。
盡管最近在蛋白質的結構測定和預測方面取得了突破性進展,但對碳水化合物結構的研究仍然是一個挑戰(zhàn)。
在這項最新研究中,研究團隊報告了在清華荷塘淡水中發(fā)現(xiàn)的糖蛋白纖維的冷凍電鏡(cryo-EM)分析。研究團隊將其命名為TLP-4,它是由四肽重復序列的線性多肽鏈組成,外覆>4納米厚的聚糖。在每個重復中,兩個聚糖O-連接到一個3,4-二羥脯氨酸(diHyp),另一個聚糖連接到相鄰的絲氨酸或蘇氨酸。纖維結構完全通過聚糖填充來維持。
生物信息學分析證實,TLP-4重復序列在物種間的保守性,提示了自然界還存在大量有待發(fā)現(xiàn)的糖蛋白纖維。
此外,對TLP-4和其他糖蛋白纖維的結構研究可以為訓練基于人工智能(AI)的工具建立有價值的數(shù)據(jù)集,用于精確聚糖結構預測、模型建立和結合劑設計。
總的來說,這一發(fā)現(xiàn)發(fā)現(xiàn)不僅對聚糖在生物組裝中的結構作用提供了有價值的見解,而且展示了研究團隊最近制定的CryoSeek(酷尋)研究策略在尋找生物實體以及為碳水化合物的結構研究建立原型方面的潛力。
顏寧教授表示,這篇論文的上線完美標志著2025年是實驗室新方向的正式開始——利用CryoSeek(酷尋)做起點,研究糖蛋白和糖生物學。此外,實驗室最近以及將來會多投預印本bioRxiv,因為全新的領域太需要合作,所以一有新發(fā)現(xiàn)就先放出來,希望從糖質鑒定、化學合成、生物學合成通路、糖蛋白纖維功能等多個方面建立廣泛的合作。
此前的兩項的關于CryoSeek(酷尋)的研究論文
2024年10月9日,顏寧、李張強等人在《美國國家科學院院刊》(PNAS)發(fā)表了題為:CryoSeek: A strategy for bioentity discovery using cryoelectron microscopy 的研究論文【2】。
CryoSeek的工作流程包括以下幾個步驟:1)從自然來源收集樣本;2)用過濾、濃縮等簡單程序處理樣品;3a)執(zhí)行標準冷凍樣品制備和冷凍電鏡數(shù)據(jù)采集,或3b)通過其他方法(例如宏基因組測序和質譜分析)來表征樣品;4)冷凍電鏡數(shù)據(jù)處理;5)AI輔助自動建模;6)結合步驟3b的其他生物信息學分析結果,根據(jù)其結構識別相應的生物實體。
首先,顏寧團隊使用冷凍電鏡(cryo-EM)對清華荷塘的濾過水樣進行觀察分析,發(fā)現(xiàn)了豐富多樣的生物大分子,其中長短、粗細不一的纖維狀結構在占據(jù)主導地位。然后,顏寧團隊通過三維重構獲得了多個纖維結構的高分辨率電鏡密度圖。
接下來,利用清華大學張強鋒團隊開發(fā)的基于AI算法的CryoNet軟件進行自動模型搭建,獲得了兩種高度相似的螺旋纖維蛋白的三維結構,顏寧團隊將其命名為TLP-1a和TLP-1b,每一種直徑約為8 nm。
進一步的生物信息學分析顯示,TLP-1a和TLP-1b這兩種纖維狀蛋白具有獨特的形狀和厚度,來自完全未知的物種。研究團隊認為,其很可能是某種細菌用于物質傳遞和輔助運動的菌毛。
總的來說,這項研究展示了結構生物學的范式轉變,之前的結構生物學總是應用于已知的物質,而現(xiàn)在,在蛋白質序列和來源完全未知的情況下,完全基于高分辨率的結構測定實現(xiàn)了對未知生物實體的物質鑒定和功能預測,使結構生物學成為探索完全未知物質的驅動力。
此外,該研究提出的CryoSeek策略還可以擴展到識別來自河流、海洋、雨滴的生物實體,甚至來自深海、熱液噴口甚至太空等極端環(huán)境的生物實體,從而有助于將結構生物學擴展到結構X學(Structural X-ology),例如結構病理學(Structural pathology)、結構生態(tài)學(Structural ecology)、結構考古學(Structural archeology)等。
2024年12月15日,顏寧、李張強等在預印本平臺 bioRxiv 發(fā)表了題為:The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek 的研究論文【3】。
顏寧團隊之前開發(fā)了一種名為CryoSeek(酷尋)的研究策略——使用冷凍電鏡(cryo-EM)從自然或內(nèi)源性資源中識別未表征的全新生物實體。
在這項新研究中,研究團隊發(fā)現(xiàn)了一種高度糖基化的蛋白纖維——TLP-4b,其主要分子質量歸因于一個厚聚糖殼。由于多個AI輔助軟件都無法自動搭建出其蛋白結構,研究團隊進行了人工手動搭建,確定了其結構,3.3 分辨率的冷凍電鏡結構重建揭示了該糖蛋白纖維的唯一蛋白質成分——直徑約為8 nm的四肽重復線性多肽鏈。每個四肽重復序列包含1個保守的3,4-二羥脯氨酸(diHyp)、1個絲氨酸或蘇氨酸,以及2個較少保守的氨基酸殘基組成。其中,3,4-二羥脯氨酸的3-OH與4-OH均高度O-糖基化,絲氨酸或蘇氨酸同樣存在O-糖基化。
在三維重構區(qū)段中,該纖維結構高度規(guī)則,其折疊形式完全由糖質間的相互作用維持,并且由于高重復性,這些糖質的組裝也是高度有序的。通過計算氨基酸和糖質的比例發(fā)現(xiàn),該纖維結構中糖質的質量占比達到了驚人的95%以上。
總的來說,該研究揭示了聚糖在糖綴合物結構折疊中的關鍵作用,并有助于理解生物圈中的碳/氮比值。該研究也進一步證明了CryoSeek(酷尋)在發(fā)現(xiàn)完全未知的生物實體方面的能力,有望成為推動一系列新研究的起點。
論文鏈接:
1. https://www.pnas.org/doi/10.1073/pnas.2423943122
2. https://www.pnas.org/doi/10.1073/pnas.2417046121
3. https://www.biorxiv.org/content/10.1101/2024.12.15.627649v1
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com