細(xì)菌耐藥已成為影響全人類健康的重大問題,引起了全世界廣泛的關(guān)注。世界衛(wèi)生組織提出的解決耐藥措施之一是研發(fā)耐藥快速準(zhǔn)確的新型診斷技術(shù)和相關(guān)試劑。傳統(tǒng)的檢測方法基于細(xì)菌培養(yǎng),周期長,易導(dǎo)致漏診、誤診,延誤治療時機。而基于基因的檢測技術(shù),如具有靈敏、高效、快捷特點的基因芯片、數(shù)字 PCR等技術(shù),是公認(rèn)的快速檢測技術(shù)。然而,到目前為止,由于耐藥基因型與表型結(jié)果的不一致,使得基因檢測只能作為培養(yǎng)法的輔助手段用于耐藥的檢測?! ?/p>
中國科學(xué)院微生物研究所馮婕研究組等針對肺炎鏈球菌β-內(nèi)酰胺耐藥這一重要臨床問題,采用機器學(xué)習(xí)的方法挖掘耐藥相關(guān)數(shù)據(jù)的規(guī)律,建立了基因型和表型之間的聯(lián)系,使得基因檢測不再是一個輔助手段,而有望成為一種主要的耐藥快速檢測技術(shù)?! ?/p>
肺炎鏈球菌β-內(nèi)酰胺耐藥的主要機制是三種青霉素結(jié)合蛋白(PBP1a,PBP2b和PBP2x)的轉(zhuǎn)肽酶結(jié)構(gòu)域(TPD)的改變。由于不同臨床肺炎鏈球菌分離株P(guān)BPs的高度變異性,以及鏈球菌間重組導(dǎo)致的嵌合結(jié)構(gòu),使得PBPs極具多樣化,導(dǎo)致了很難將PBPs的突變與臨床耐藥性聯(lián)系起來。馮婕組研究人員首先將NCBI數(shù)據(jù)庫已公布的PBPs序列通過類別方差法計算,得到了139個與耐藥高度相關(guān)的HVLs (highly variant amino acid)。再以4300株肺炎鏈球菌的轉(zhuǎn)肽酶結(jié)構(gòu)域(TPD)序列以及對應(yīng)頭孢呋辛、阿莫西林的耐藥表型作為數(shù)據(jù)庫,將其中80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為檢驗集,用HVLs去預(yù)測頭孢呋辛和阿莫西林的耐藥水平,結(jié)果發(fā)現(xiàn)與用PBPs蛋白的TPD序列預(yù)測效果一樣好。進(jìn)一步分析發(fā)現(xiàn),HVLs與PBPs的某些區(qū)域的序列有很強的相關(guān)性。因此,分別使用來自pbp2x (2253 bp)的750 bp片段和來自pbp2b (2058 bp)的750 bp片段可以很好地預(yù)測頭孢呋辛和阿莫西林的耐藥性。這種長度只需要一個Sanger測序反應(yīng)即可,不僅使檢測操作更加簡單,也降低了成本。此外,通過對人工構(gòu)建的突變體和來自更多臨床分離的菌株的耐藥表型的檢測,進(jìn)一步確認(rèn)了機器學(xué)習(xí)法能精確預(yù)測耐藥表型。應(yīng)用該預(yù)測方法,研究人員分析了NCBI數(shù)據(jù)庫中已測序的8138株肺炎鏈球菌,進(jìn)而建立了耐藥表型、血清型以及ST型之間的關(guān)聯(lián),促進(jìn)了對肺炎鏈球菌的流行病學(xué)的認(rèn)識?! ?/p>
該研究成果在線發(fā)表于Briefings in Bioinformatics雜志,馮婕與南方科技大學(xué)教授楊亮為共同通訊作者。該研究得到國家自然科學(xué)基金和北京市科學(xué)技術(shù)委員會的資助。
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com