專家園地

您所在位置:首頁 > 專家園地 > 正文

在單細胞分析中使用人工智能進行糾錯

文章作者:www.utbltn.icu發布時間:2020-01-22瀏覽次數:1900

人體細胞圖譜是一個有遠見的項目,具有廣泛的目標,旨在在不同的時間點映射人體的所有組織,目標是為個性化醫療的發展創建參考數據庫,區分能力在健康和患病細胞之間。這是通過一種稱為單細胞RNA測序的技術實現的,該技術可以幫助研究人員準確地了解哪些基因在生命的這些微小成分中的任何特定時刻開啟或關閉。 “從方法論的角度來看,這代表了一個巨大的飛躍。以前,這些數據只能從大量細胞群中獲得,因為測量需要如此多的RNA,“MarenBüttner解釋道。 “所以結果總是只是所有細胞的平均值。現在我們

然而,該技術的靈敏度增加也意味著對批次效應的敏感性增加。 “批次效應描述了可能發生的測量之間的波動,例如,如果設備的溫度略有偏差或細胞的處理時間發生變化,”MarenBüttner解釋道。雖然有幾種模型可以糾正這些偏差,但這些方法在很大程度上取決于效果的實際大小。 “因此我們開發了一種用戶友好,功能強大且靈敏的測量方法,稱為kBET,可以量化實驗之間的差異,并有助于比較不同的校準結果,”Büttner說。

除了批次效應之外,稱為損失事件的現象在單細胞測序中提出了主要挑戰。 “讓我們說我們對細胞進行了測序,并觀察到細胞中的特定基因根本沒有發出信號,”ICB生物系統數學模型主任Fabian Theis博士解釋道。 “根本原因可能是生物學或技術性的:要么基因不被測序者讀取,因為它根本不表達,或者由于技術原因未被檢測到,”他解釋說。

為了識別這些病例,來自Theis Group的生物信息學G?kcenElaslan和Lukas Simon使用了許多單細胞序列,并開發了所謂的深度學習算法,即模擬人類學習過程的人工智能(神經網絡)。

該算法使用新的概率模型,并將原始數據與重建數據進行比較,以確定丟失的基因信號是否是由生物或技術故障引起的。 “這種模型甚至可以在不使兩種不同細胞類型變得人為相似的情況下進行細胞類型特異性校正,”Fabian Theis說。 “作為單細胞基因組學領域最早的深度學習方法之一,該算法具有額外的優勢,可以很好地擴展到包含數百萬個細胞的數據集。”

但有辦法嗎?重要的是要強調:“我們不是在開發軟件來平滑結果。我們的主要目標是識別和糾正錯誤,”Fabian Theis解釋道。 “我們能夠與世界各地的同事分享這些盡可能準確的數據,并將我們的結果與他們的結果進行比較,” - 例如,當亥姆霍茲研究人員將他們的算法和分析貢獻給人類細胞圖譜時,因為可靠性數據的可比性是危急。

蓝海赚钱