大規(guī)模蛋白質(zhì)組學(xué)研究能夠深化對(duì)健康和疾病的理解,但現(xiàn)有研究仍集中于有限的疾病結(jié)局,蛋白與健康和疾病之間的關(guān)系仍然存在許多未解之謎。疾病相關(guān)的蛋白質(zhì)是特異性的還是共同的?這些蛋白質(zhì)能否啟示疾病的生物學(xué)分類?它們能否作為疾病預(yù)測(cè)和診斷的生物標(biāo)志物及潛在的治療靶點(diǎn)?
2024年11月22日,復(fù)旦大學(xué)附屬華山醫(yī)院郁金泰、毛穎團(tuán)隊(duì)與復(fù)旦大學(xué)類腦智能科學(xué)與技術(shù)研究院程煒、馮建峰團(tuán)隊(duì)合作,在國(guó)際頂尖學(xué)術(shù)期刊 Cell 在線發(fā)表了題為:Atlas of the plasma proteome in health and disease in 53,026 adults 的研究論文。
這項(xiàng)研究全面繪制了人類健康與疾病蛋白質(zhì)組圖譜,并結(jié)合人工智能大數(shù)據(jù)分析方法,構(gòu)建了疾病診斷預(yù)測(cè)模型以及發(fā)現(xiàn)了26個(gè)藥物治療新靶點(diǎn),為精準(zhǔn)醫(yī)學(xué)的實(shí)施提供了重要科學(xué)依據(jù)。
該研究于2025年1月9日,登上了 Cell 期刊封面,該封面描繪了一個(gè)由蛋白質(zhì)構(gòu)成的人類,正在借助人工智能(由芯片和二進(jìn)制代碼代表)的幫助來(lái)檢查自己的健康狀況(通過(guò)心電圖監(jiān)測(cè)界面來(lái)體現(xiàn))。
封面圖片來(lái)自郁金泰、程煒
該研究的核心突破:
該研究通過(guò)深入分析53026名個(gè)體的血漿蛋白質(zhì)組數(shù)據(jù),納入了2920種血漿蛋白質(zhì)與406種既往患病、660種隨訪新發(fā)疾病以及986種健康相關(guān)特征,跨越了14.8年的中位隨訪期,揭示了168100個(gè)蛋白質(zhì)-疾病關(guān)聯(lián)和554488個(gè)蛋白質(zhì)-表型關(guān)聯(lián)。研究中發(fā)現(xiàn)超過(guò)650種蛋白質(zhì)與至少50種疾病存在聯(lián)系,而超過(guò)1000種蛋白質(zhì)表現(xiàn)出性別和年齡的異質(zhì)性,這些發(fā)現(xiàn)深化了對(duì)疾病間共享和特異分子機(jī)制的理解,揭示了不同人群在疾病易感性上的差異。
人類健康與疾病血漿蛋白質(zhì)組圖譜
研究團(tuán)隊(duì)發(fā)現(xiàn)免疫系統(tǒng)相關(guān)通路在絕大部分疾病中富集,強(qiáng)調(diào)了炎癥在人類健康中的重要作用。此外,對(duì)不同疾病之間的生物學(xué)通路的比較完善了對(duì)疾病病理生理學(xué)相似性和異質(zhì)性的理解。例如,阿爾茨海默?。ˋD)和血管性癡呆(VaD)相關(guān)的蛋白質(zhì)在與神經(jīng)系統(tǒng)相關(guān)的共同通路中富集,而AD特異性通路大多與脂質(zhì)代謝有關(guān),VaD特異性通路與心肌有關(guān)。傳統(tǒng)的疾病分類策略通?;谙嗨频呐R床癥狀和表型特征,而忽略了共同的分子病因。利用蛋白質(zhì)組學(xué)特征對(duì)660種疾病進(jìn)行聚類,能夠根據(jù)其共享的生物學(xué)特性將這些疾病聯(lián)系起來(lái),從而重新審視疾病的類別和亞型。例如,各種癡呆亞型被劃分到同一疾病亞群,該亞群還包含精神、內(nèi)分泌、心血管等系統(tǒng)疾病,基于此,研究團(tuán)隊(duì)進(jìn)一步揭示了該亞群的特征性生物學(xué)功能,將生物學(xué)上相關(guān)的疾病聯(lián)系在一起,有助于解釋為何患者身上會(huì)同時(shí)出現(xiàn)看似不相關(guān)的癥狀,并進(jìn)一步加深對(duì)機(jī)制的理解和提高治療的有效性。
血漿高通量測(cè)序蛋白質(zhì)數(shù)據(jù)存在復(fù)雜交互作用,往往難以單獨(dú)處理,而人工智能算法,能夠高效提取關(guān)鍵特征,構(gòu)建精確預(yù)測(cè)/診斷模型。研究團(tuán)隊(duì)利用機(jī)器學(xué)習(xí)等人工智能大數(shù)據(jù)分析技術(shù),識(shí)別出了具有潛在診斷和預(yù)測(cè)價(jià)值的生物標(biāo)志物,發(fā)現(xiàn)基于蛋白質(zhì)的模型在183種疾病中的AUC值超過(guò)0.80,明顯優(yōu)于基于人口統(tǒng)計(jì)學(xué)的模型,將有助于提高疾病的早期診斷率。
值得一提的是,GDF15被發(fā)現(xiàn)是預(yù)測(cè)和診斷多種疾病的關(guān)鍵蛋白,其在對(duì)200種疾病的預(yù)測(cè)中的重要度均排名榜首,這表明GDF15在疾病的早期識(shí)別和風(fēng)險(xiǎn)評(píng)估中具有重要作用,可能成為一個(gè)重要的生物標(biāo)志物。此外,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多個(gè)疾病中表現(xiàn)出良好的預(yù)測(cè)和診斷性能,表明它們?cè)诙喾N生物過(guò)程中發(fā)揮著核心作用,具有廣泛的臨床應(yīng)用潛力。
對(duì)歷史藥物開(kāi)發(fā)項(xiàng)目數(shù)據(jù)的評(píng)估顯示,有遺傳證據(jù)支持的靶點(diǎn)-適應(yīng)癥對(duì)在藥物開(kāi)發(fā)中更有可能獲得成功。該研究通過(guò)整合蛋白質(zhì)數(shù)量性狀位點(diǎn)(pQTL)和疾病全基因組關(guān)聯(lián)研究(GWAS)數(shù)據(jù),使用孟德?tīng)栯S機(jī)化分析(MR)確定了474個(gè)具有潛在因果關(guān)聯(lián)的蛋白質(zhì)-疾病對(duì)。通過(guò)檢索DrugBank和Therapeutic Target Database中的藥物靶點(diǎn)信息以及進(jìn)行安全性評(píng)估,該研究提供了對(duì)25個(gè)已知靶點(diǎn)的37種潛在藥物重新利用機(jī)會(huì),并確立了26個(gè)具有治療潛力且安全性良好的新靶點(diǎn),為老藥新用和新藥開(kāi)發(fā)提供了重要線索。
為了進(jìn)一步推動(dòng)科學(xué)研究和精準(zhǔn)醫(yī)療的發(fā)展,該研究建立了一個(gè)可開(kāi)放訪問(wèn)的蛋白質(zhì)組-表型組資源數(shù)據(jù)庫(kù)Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。
這個(gè)數(shù)據(jù)庫(kù)不僅有助于科學(xué)家們更好地理解疾病的生物學(xué)機(jī)制,還將加速疾病生物標(biāo)志物、預(yù)測(cè)診斷模型和治療靶點(diǎn)的開(kāi)發(fā),為精準(zhǔn)醫(yī)學(xué)的實(shí)施提供強(qiáng)有力的支持。
Proteome-Phenome Atlas數(shù)據(jù)庫(kù)首頁(yè)
總的來(lái)說(shuō),這項(xiàng)研究繪制的人類健康與疾病蛋白質(zhì)組圖譜揭示了血漿蛋白在疾病診斷、預(yù)測(cè)和治療中的潛在應(yīng)用價(jià)值。該研究為臨床實(shí)踐提供了科學(xué)依據(jù),有助于疾病的早期檢測(cè)、精準(zhǔn)分層和個(gè)性化治療。
未來(lái),基于這一開(kāi)放獲取的蛋白質(zhì)組學(xué)圖譜,研究人員將能夠更深入地探索疾病發(fā)病機(jī)制,推動(dòng)生物標(biāo)志物和預(yù)測(cè)/診斷模型開(kāi)發(fā),并探尋全新治療靶點(diǎn),為精準(zhǔn)醫(yī)學(xué)發(fā)展奠定了基礎(chǔ)。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(24)01268-6
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com