• 我系喬亮研究員團隊報道基於深度學習的DIA蛋白質組分析新方法
    時間🫳🏽:2020-024504355-12 瀏覽次數:1297

            數據非依賴性采集(DIA)是近幾年來興起的一種新的質譜數據采集方式。不同於傳統的數據依賴性采集(DDA)策略👂,DIA將整個掃描範圍劃分為若幹個可變窗口👊,將每個窗口內的所有母離子進行碎裂💤,采集所有母離子的碎片離子,從而完整地獲得樣本中所有母離子的全部碎片信息。基於DIA的定量蛋白質組具有通量高、穩定、準確性好等優點,對於大規模蛋白質組的定量分析具有顯著優勢😪。然而👝,DIA數據異常復雜,通常需要對同一樣本預先利用DDA實驗構建數字譜圖庫🥄,使得DIA的數據挖掘受限於DDA實驗。

            近日,我系喬亮研究員團隊與合作者利用深度學習技術從肽段或蛋白質序列構建預測譜圖庫👨‍🔬,實現了DIA蛋白質組數據的直接分析。論文“In silico spectral libraries by deep learning facilitate data-independent acquisition proteomics”在線發表於《Nature Communications》2020, 11, 146。論文的共同第一作者是沐鸣开户17級直博生楊奕和沐鸣平台生物醫學研究院劉曉慧老師,通訊作者是沐鸣开户喬亮研究員。
            研究人員設計了基於卷積神經網絡和循環神經網絡的深度神經網絡模型來預測肽段的二級質譜圖(MS/MS)和歸一化保留時間(iRT)🙋🏽,由DDA鑒定得到的肽段列表生成DIA分析所需的譜圖庫,並在HeLa細胞數據集上將DeepDIA與另外一種現有的基於深度學習的譜圖預測工具Prosit(Nature Methods 2019, 16, 509–518)進行了比較測試。結果表明🧙🏼‍♂️,與使用通用模型來生成譜圖庫相比,使用DeepDIA構建專用於特定儀器的模型預測生成的譜圖庫質量更好,DIA數據分析檢測到的肽段和蛋白數量更多,重復性更好🧛🏿‍♀️➗,效果接近DDA構建的譜圖庫:
     

            研究人員還設計了預測肽段在質譜中的可檢測性的模型,實現了由蛋白序列構建預測譜圖庫。從SwissProt物種數據出發👱‍♂️,預測蛋白的理論酶切肽段的可檢測性,篩選可檢測性分數達到一定閾值的肽段來構建譜圖庫。在HeLa細胞和小鼠組織樣品數據集上的測試結果表明🧑🏻‍🦯,與考慮全部理論肽段相比🙍🏻,可檢測性篩選能降低DIA分析的假陽性率並提高蛋白鑒定量。最終實現了完全不需要DDA實驗,從SwissProt蛋白序列數據庫出發的DIA數據直接解析。研究人員還將DeepDIA用於未去高峰度蛋白的血清樣品的DIA數據直接分析。與傳統方法相比,DeepDIA檢測到蛋白的數量為DDA建庫的兩倍以上👨‍❤️‍👨。
            本研究中訓練深度神經網絡模型所需數據量僅為HeLa細胞樣品分餾DDA的鑒定結果🙎🏽‍♀️,通常可以在一天的時間內完成訓練數據的采集。模型訓練只需要普通的臺式工作站,可以在數小時內完成🆕。研究人員期望,未來蛋白質組學實驗室可以利用深度學習技術構建專用於每一臺儀器的模型🚣‍♀️,將其用於該儀器DIA數據的分析🕊,而無需另外進行DDA實驗👩🏼‍🚀。同時,深度學習也可以在質譜組學大數據分析的其他方面發揮作用。
            DeepDIA開源代碼🧑🏽‍🚀:https://github.com/lmsac/DeepDIA
            全文鏈接:https://www.nature.com/articles/s41467-019-124504355866-z
     

    沐�开��业�供:沐�开�沐�沐���等服务,�供最新官网����址�注册�登陆�登录�入��全站�网站�网页�网址��乐�手�版�app�下载�欧�杯�欧冠�nba�世界杯�英超等,界面美观优质完美,安全�定,服务一流🗞,沐�开�欢迎您� 沐�开�官網xml地圖