交流合作

您所在位置:首頁 > 交流合作 > 正文

超級計算是基因組學研究的未來

文章作者:www.utbltn.icu發布時間:2019-09-29瀏覽次數:1982

目前,基因組學正處于這樣一個轉折點:人類基因組測序的成本不到1000美元,預計將繼續下降(2003年為30億美元)。隨著測序成本的降低,基因測試變得更加普遍,相應的基因組數據也在不斷增加。只有一個人的基因組“運行”產生0.5TB(1TB=1024GB)的原始數據圖像文件,這些文件很復雜并且包含難以管理和分析的分散的非結構化科學數據。

隨著測序技術的發展,研究人員面臨的挑戰是如何管理和分析這些大量非結構化基因組數據。通常,這些數據是在世界各地的學術研究,臨床試驗和藥物研究中產生的。現在,許多組織需要更先進的數據分析和管理,用于藥物發現,疾病基因檢測以及在臨床應用中創建個性化治療。然而,基因組測序是一個復雜的多步驟過程,涉及DNA序列讀取,基因組序列剪接,變異區序列分析和重測序。

現實情況是,我們在過去十年中使用的技術還不足以分析這些關鍵數據。隨著基因測序公司不斷創新,對數據分析的需求增長更快,這些技術注定將來會被新技術所取代。與此同時,對基因組測序的需求也在不斷增長。

因此,技術人員需要做的是通過復雜的高性能計算(HPC)或超級計算機和大數據技術使這些數據可用于分析,從而使基因組數據管理和分析更容易,更有效。

大數據本身

追求個性化醫療已經產生了爆炸性的數據增長,因為醫生和研究人員希望通過基因測序,根據患者的疾病表現和耐藥性,為不同的患者實現最佳的個性化治療。與此同時,隨著基因組學研究資金的不斷增加,基因測序已經越來越商業化,并進一步推動了個性化醫學的發展。

在相關案例中,Kaiser Permanente從美國的一位以上患者處收集了DNA樣本,醫療記錄等,隨后創建了世界上最大,最全面的精準醫學數據庫。在此基礎上,研究人員希望找到影響各種遺傳性疾病的特定基因,以便在臨床應用中提高疾病的診斷,治療和預防。

當然,為了成功整理出這些復雜,分散,非結構化的科學數據,研究人員需要大量的數據計算和高速分析以及靈活的計算系統,但傳統計算系統無法跟上數據的發展需要。步伐。

幸運的是,隨著現代超級計算技術的出現,研究機構可以繼續增加數據量并分析有價值的科學見解。

管理和分享新數據

為了在數據密集型時代取得重大科學突破,研究團隊需要更快,更輕松地分析大型數據集。 2016年,著名的美國衛生系統INOVA轉化醫學研究所(ITMI)購買了HPC系統,使研究人員能夠使用基因組數據庫更準確,更快地診斷患者,并提供更高水平的治療和護理。

ITMI的系統用于基因組中的數據密集型工作負載,研究人員通過開發和使用自己的代碼來簡化數據管理。憑借這種靈活性,ITMI管理IT的負擔顯著降低,同時還提高了研究工作流程的能力,使組織能夠在更具挑戰性的慢性疾病領域投入更多資源。

隨著研究機構處理越來越多的數據,未來的資本也將有利于新的超級計算解決方案,以改善數據管理和可訪問性。具體而言,這些系統將提供更快的工作流程和更快的裝配和分析操作,從而提高研究人員的研究效率。相對而言,HPC系統可以比一個數量級更快地查詢海量數據庫,可以探索更大的數據集,并可以同時進行更多的數據調查。

為什么數據存儲至關重要

基因組學研究中最大的挑戰是數據集通常需要存儲,分析,然后再次存儲。例如,美國基因測試公司Human Longevity最近與制藥公司AstraZeneca合作,對來自臨床試驗的DNA樣本進行測序分析。該計劃預計將在2020年之前生成100萬基因組,分子和臨床數據的綜合健康記錄。這將是一個驚人的數據量,所有這些數據必須存儲在外部存儲器中,以便以后通過網絡傳輸到計算機,分析然后存儲回外部存儲。

此過程會給傳統IT基礎架構帶來難以置信的負擔。大多數存儲管理員無法承受這些工作負載的壓力,因為他們沒有當今生物醫學應用程序的可擴展性,持久性和長期性,

超級計算機的現代化

來自基因組學研究的數據將繼續呈指數級增長。隨著技術人員提供千兆位和未來的大型megan解決方案,幾年前感受到的不可預測的數據現在可以快速,輕松地進行管理和分析。此外,超級計算系統變得更加實惠且不那么復雜。

超級計算機在基因組學中具有多種功能,包括協助編制和識別研究數據中的模式,以及將基因序列注釋到圖像建模中。

對于研究機構而言,為現代HPC尋找解決方案非常重要,因為它不僅可以分析數據,還可以輕松存儲數據,而其他研究人員可以再次訪問它。 Silicon Image Inc.(SGI)的存儲系統可以輕松集成高性能計算和數據分析系統功能。

現代HPC系統提供大規模的存儲虛擬化數據管理平臺,旨在管理生命科學應用程序生成的大量結構化和非結構化內容。在此次收集,研究,鏈接和分析與個性化醫療環境相關的關鍵生物醫學研究數據的競賽中,SGI為研究機構和實驗室提供了分析和創新的捷徑。

結論:

基因組學研究將促進疾病基因的鑒定,加速生物標志物的鑒定,并為患者提供更有針對性的個性化治療。與此同時,基因組學研究人員也面臨著挑戰。他們需要進行新的高質量研究,為臨床醫生提供個性化醫療治療的基礎,并通過基因組測序和干細胞研究來治療癌癥和其他疾病。 HPC系統的領先地位使一些研究機構在生命科學領域取得突破。

蓝海赚钱