品牌名稱
阿斯利康
企業規模
1001-5000人

阿斯利康制藥公司通過MongoDB加速研發

392次閱讀

去年,制藥巨頭阿斯利康 (AstraZeneca) 啟動了一項雄心勃勃的計劃,利用下一代基因組測序開發藥物來對抗包括癌癥在內的各種疾病。

 

該技術創造了一種合成版本的信使 RNA,有助于在細胞中制造蛋白質。如果成功,這些蛋白質可以對抗癌癥等疾病。

 

不幸的是,這種基因組測序需要大量的計算能力。正如阿斯利康 (AstraZenaca) 研發信息架構師 Jason Tetrault 最近解釋的那樣,分析 88 個完整的人類基因組需要 15,000 小時和 171 TB 的數據。分析一個人類基因組可能需要四天時間。

 

幸運的是,遺傳學的突破與計算能力的飛躍同時發生。特別是 MongoDB 的跨平臺、面向文檔的數據庫已經到了大規模處理這些數字的地步。“我會將 MongoDB 納入極具顛覆性的技術陣營,”Tetrault 說。“任何能幫助我們加快步伐以幫助更快地找到東西的東西都很棒。”

 

對于 Tetrault 來說,基因組測序是非結構化數據挑戰的典型例子。AstraZeneca 選擇 MongoDB 是因為其文檔存儲能力。然后,公司提供午餐并學習教育員工。“當然是午餐和學習,”他說。“每個人都會出現以獲得免費午餐。”

 

示例還有助于讓員工參與進來。Tetrault 指出,CraigslistMTV等公司使用 MongoDB 來跟蹤和整理他們的海量數據。Tetrault 說,去掉這些名字“真的打開了討論……這是一個‘哇哦’的時刻。”

 

也許讓每個人都加入的最有說服力的策略是展示 MongoDB 如何相對較快地取得有用的結果。“找到困難的事情,讓它變得容易,”他說。

 

阿斯利康的實驗包括提取其所有化合物的 10% 并從其不同的數據庫系統中提取信息。使用 MongoDB,該公司能夠對大約 500,000,000 種化合物進行 Tanimoto 比較。“所有這些,都在我的桌子底下,”Tetrault 說。

 

盡管在這個過程的早期,Tetrault 說他很高興阿斯利康可以使用 MongoDB 來幫助對抗癌癥。“我正在為癌癥研究人員提供支持。我們的研究人員正試圖找出哪種藥物對特定腫瘤類型最有效。” Tetrault 表示,通過更好地掌握數據,阿斯利康可以追蹤它以前從未注意到的鏈接和模式。“也許這對 10% 的肝癌有效,但哇,這種肺癌實際上具有相同的生物標志物。這就是我想問的問題,也是我對大數據技術感興趣的原因。”