作為ChatGPT和谷歌Gemini等熱門工具背后的技術,基于大語言模型(LLM)的生成式AI正在徹底改變各個行業,藥物發現領域當然也不例外。通過運用AI之力以解碼并操縱生物及化學語言,制藥企業如今可以更快、更加經濟高效地開發新藥。在本文中,我們將一同了解生成式AI如何改變藥物發現、加速開發過程并降低研發成本。
生成式AI在藥物發現中的作用
從傳統角度講,生成式AI的主要作用在于生成人類語言。但除此之外,其潛力早已跨過這條連坐,涵蓋了復雜的生物和化學語言。舉例來說,人類DNA可以看作是一條由30億個字母組成的序列,這就形成了一種獨特的語言。同樣的,作為生命基石的蛋白質也擁有自己的字母表,也就是20種氨基酸。這些化學物質均可使用簡化分子線性輸入規范(SMILES)來定義其結構。
生成式AI技術能夠解釋這些語言,幫助發現并開發出新的藥物療法。通過將大模型類型的方法應用于這些生物和化學語言,AI模型能夠發現以往無法觀察到的見解,加快藥物發現過程并顯著降低成本。鑒于新藥療法的失敗率很高——一般只有10%的藥物能夠順利通過臨床試驗——任何有助于提高效率和降低時間和成本的技術,都將為整個產業貢獻巨大價值。
為流程的各個階段增加價值
生成式AI可以應用于藥物發現的各個階段:
1.目標識別:第一階段是識別待治療的疾病或癥狀。生成式AI可以分析基因組數據,從而了解導致疾病或其他潛在生物過程的基因。這將有助于確定新藥開發的確切目標。
2.線索生成:第二階段是生成潛在線索,也就是針對已識別疾病的化學物質或蛋白質。但由于可能的化學物質(超過10^60種)與蛋白質(超過10^160種)數量極多,因此導致這項任務頗為艱難。生成式AI技術能夠篩選其中的可能性,并生成具有所需特性的新型化合物,從而產生大量可供探索的線索。
3.優化:在第三階段,需要對潛在候選藥物進行功效測試。生成式AI可以協助這一大規模篩選過程。例如,英偉達與Recursion Pharmaceuticals的合作就表現出在一周之內,對超過2.8千萬億種小分子靶標對進行篩選的能力。如果用傳統方法處理,這項任務需要10萬年才能完成。
生成式AI將使制藥公司以前所未有的規模、速度和準確性探索潛在新藥,大大加快臨床試驗的進展。
藥物開發中的AI案例研究
目前有多家公司在運用生成式AI進行藥物發現方面處于領先地位。一個著名案例就是Insilico Medicine,他們利用AI開發出一種治療特發性肺纖維化的藥物,這是一種會導致肺功能逐漸衰退的罕見疾病。傳統上,整個研發過程需要六年時間,耗資超過4億美元。但借助生成式AI,Insilico將成本降低至十分之一,并把研發周期縮短到了兩年半。
Insilico將AI方案應用在臨床前藥物發現流程中的各個階段,包括識別目標分子、生成新型候選藥物以及預測臨床試驗結果。他們還成功開發出一種對所有變體均有療效的AI生成COVID-19藥物,并啟動了30多個針對各類疾病(包括癌癥)的其他項目。
藥物開發的未來
生成式AI對藥物發現具有變革性的影響,有望以極低的成本快速治愈多種疾病。憑借AI解碼復雜生物與化學語言的能力,我們也許可以期待未來新藥的開發流程將更快、更高效也更成功。生成式AI代表的不只是一項技術進步,更將顛覆整個醫療保健行業,在為全球患者帶來更佳診療效果的同時,為未來藥物的開發探明前所未有的道路。