當前位置:首頁 > 新聞中心 > 科研進展

機器學習讓耐藥檢測更高效:馮婕課題組在肺炎鏈球菌β-內酰胺耐藥快速檢測方法上取得新進展

作者: 發布時間:2019.07.18 文章來源:

  細菌耐藥已成為影響全人類健康的重大問題,引起了全世界廣泛的關注。WHO 提出的解決耐藥措施之一是研發耐藥快速準確的新型診斷技術和相關試劑。傳統的檢測方法基于細菌培養,周期長,易導致漏診、誤診,延誤最佳治療時機。而基于基因的檢測技術,如基因芯片、數字 PCR等技術具有靈敏、高效、快捷的特點,是公認的快速檢測技術。然而,到目前為止由于耐藥基因型與表型結果的不一致,使得基因檢測只能作為培養法的輔助手段用于耐藥的檢測。馮婕研究組針對肺炎鏈球菌β-內酰胺耐藥這一重要臨床問題,采用機器學習的方法挖掘耐藥相關數據的規律,建立了基因型和表型之間的聯系,使得基因檢測不再是一個輔助手段,而有望成為一種主要的耐藥快速檢測技術。 

 

  肺炎鏈球菌β-內酰胺耐藥的主要機制是三種青霉素結合蛋白(PBP1aPBP2bPBP2x)的轉肽酶結構域(TPD)的改變。由于不同臨床肺炎鏈球菌分離株PBPs的高度變異性,以及鏈球菌間重組導致的嵌合結構,使得PBPs極具多樣化,導致了很難將PBPs的突變與臨床耐藥性聯系起來。馮婕組研究人員首先將NCBI數據庫已公布的PBPs序列通過類別方差(categorical variance)法計算,得到了139個與耐藥高度相關的HVLs (highly variant amino acid)。再以4300株肺炎鏈球菌的轉肽酶結構域(TPD)序列以及對應頭孢呋辛、阿莫西林的耐藥表型作為數據庫,將其中80%的數據作為訓練集,20%的數據作為檢驗集,用HVLs去預測頭孢呋辛和阿莫西林的耐藥水平,結果發現與用PBPs蛋白的TPD序列預測效果一樣好。進一步分析發現,HVLsPBPs的某些區域的序列有很強的相關性。因此,分別使用來自pbp2x (2253 bp)750 bp片段和來自pbp2b (2058 bp)750 bp片段可以很好的預測頭孢呋辛和阿莫西林的耐藥性(圖)。這種長度只需要一個Sanger測序反應即可,不僅使檢測操作更加簡單,也降低了成本。此外,通過對人工構建的突變體和來自更多臨床分離的菌株的耐藥表型的檢測,進一步確認了機器學習法能精確預測耐藥表型。應用該預測方法,分析了NCBI數據庫中已測序的8138肺炎鏈球菌,進而建立了耐藥表型、血清型以及ST型之間的關聯,促進了對肺炎鏈球菌的流行病學的認識。 

 

  該研究成果于2019611日在線發表于Briefings in Bioinformatics雜志上,題為“Systematic analysis of supervised machine learning as an effective approach to predicate β-lactam resistance phenotype in Streptococcus pneumoniae 。馮婕組張朝東博士、句英嬌碩士、唐娜博士生為文章的共同第一作者。北京大學第一醫院臨床藥理研究所李耘教授,馮婕組張剛副研究員,宋宇琴助理研究員,科研助理方海嶺為共同作者。馮婕研究員(lead contact)與南方科技大學楊亮教授為共同通訊作者。該研究得到國家自然科學基金和北京市科學技術委員會的資助。 

 

  文章鏈接: 

  https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbz056/5512424 

 

   

   機器學習預測實驗菌株的耐藥水平
  

    Experimental MIC: 實驗測定的MICHVLs: 耐藥相關的高度變異的氨基酸位點;3 slices: 來自3PBPs的相關片段;PBP2b slice: PBP2b相關片段;PBP2x slice: PBP2x相關片段。 

    

 

下载单机捕鱼达人 全国22选5走势图 永恒彩票苹果 广西快乐双彩开奖记录 云南十一选五开奖走势图 rp魔兽世界赚钱攻略 福建36选7走势图福彩 pk10冠军固定公式 牛牛青青草在免费线观 美人捕鱼95至尊 福彩辽宁35选7开奖结果