經銷網絡

您所在位置:首頁 > 經銷網絡 > 正文

新的深度學習方法從氨基酸序列預測蛋白質結構

文章作者:www.utbltn.icu發布時間:2019-10-23瀏覽次數:1050

生命所必需的幾乎所有必需的生物過程都是由蛋白質完成的。它們創造并保持細胞和組織的形狀;構成催化維持終身化學反應的酶;充當分子工廠,車輛和電機;作為蜂窩通信的信號和接收器;和更多。

蛋白質由長鏈氨基酸組成,通過將自身折疊成精確的3D結構來控制它們與其他分子的相互作用,從而完成無數的任務。因為蛋白質的形狀決定了它的功能和疾病的功能障礙,所以闡明蛋白質結構的努力是所有分子生物學的核心 - 特別是治療科學和拯救生命和改變生命的藥物的發展。

近年來,計算方法在根據氨基酸序列的知識預測蛋白質如何折疊方面取得了重大進展。如果完全實施,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的大小和程度上受到限制。

現在,哈佛醫學院的一位科學家使用一種稱為深度學習的人工智能,根據其氨基酸序列預測任何蛋白質的三維結構。

系統生物學家Mohammed AlQuraishi于4月17日在Cell Systems網上報道,詳細介紹了一種計算蛋白質結構的新方法 - 實現與當前最先進方法相當的準確度,但速度要快一百萬倍。

“在過去的半個世紀里,蛋白質折疊一直是生物化學家最重要的問題之一,這種方法代表了應對這一挑戰的新方法,”HQ Blavatnik研究所的系統生物學AlQuraishi說。講師也是一個系統的藥理學實驗室。 “我們現在有了一個探索蛋白質折疊的新愿景,我想我們剛開始摸索表面。”

易于解釋

雖然非常成功,但使用物理工具識別蛋白質結構的過程既昂貴又耗時,即使使用低溫電子顯微鏡等現代技術也是如此。因此,絕大多數蛋白質結構 - 以及引起疾病的突變對這些結構的影響 - 仍然很大程度上未知。

用于計算蛋白質折疊模式的計算方法具有顯著降低確定結構所需的成本和時間的潛力。然而,經過近四十年的緊張努力,這個問題很難解決。

該蛋白質由20種不同氨基酸的文庫構建。這些行為,如字母表中的字母,被組合成單詞,句子和段落,以產生天文數字中的可能文本。然而,與字母不同,氨基酸是位于3D空間中的物理對象。通常,蛋白質的一部分在物理上是接近的,但在序列上相距很遠,因為它們的氨基酸鏈形成環,螺旋,片和扭曲。

“這個問題引人注目的是它很容易說明:采取序列并找到形狀,”AlQuraishi說。 “蛋白質來源于必須具有三維形狀的非結構化細胞系。可以折疊成可能形狀的繩子的形狀是巨大的。許多蛋白質的長度是數千個氨基酸,復雜性很快超過了人類的直覺,甚至是最強大的計算機。“

很難解決

為了應對這一挑戰,科學家們利用這樣一個事實,即氨基酸根據物理定律相互作用,以找到有利的能量狀態,例如將球滾落到山谷的底部。

最先進的算法通過在超級計算機上運行來計算蛋白質結構 - 或者在Rosetta

蓝海赚钱