医薬品開発におけるAIの活用 〜DeepSeekから見た新たなAIイノベーションへの活用〜
医薬品開発でのAI活用が進んでいる中でDeepSeek社が発表した新たな生成AI開発技術、オープンソース化が与える創薬領域、特に「基礎研究・ターゲット選定」でのインパクトを検証する。
DeepSeekのインパクトはOpen AI並みの性能を持った生成AIがオープン化したことでカスタマイズが可能となることである。また、DeepSeek社がオープン化した事により今後出てくる生成AIも同様な取り組みをすると予想される。下記に記載したように「基礎研究・ターゲットバリデーション」では臨床データ、オミックスデータ、遺伝子情報等の臨床ビッグデータを活用した新しい創薬ターゲット選の取り組みが進んでいる。これらの取り組み推進にはアルゴリズムの作成、AIプラットフォームの構築が必要で、オープン化された生成AIの活用は朗報であると言える。
医薬品開発の現状とAI活用の現状
医薬品開発におけるAI(人工知能)技術活用の背景には医薬品の成功率の低下やコストの高騰、新薬開発のターゲットが原因不明の疾患にシフトしている現状がある。AIは高いデータ処理力で大量の既知情報から新たな見解を導き出すことができ、医薬品開発での化合物探索、化合物最適化の創薬プロセスにフォーカスした活用が進んでいる(第12回 保健医療分野AI開発加速コンソーシアム資料 資料-2)。化合物探索では「標的分子の構想予測、候補物質の探索、設計」、化合物最適化では「候補物質の探索、設計最適化、生物活性・毒性・動態予測」での活用である。2014年創業のAI創薬スタートアップ企業の「Insilico Medicine社」は、特発性肺線維症治療薬候補化合物(ISM001)のターゲットの特定から臨床試験に進める有望な新薬候補を、18ヶ月弱で達成し、現在、臨床試験(Phase2)が進んでいる。生成AIの創薬エンジン(Chemistry42)はNVIDIA TensorコアGPU を使用し、新規分子構造を生成している。
大手製薬メーカーも量子力学アルゴリズムとAIを組み合わせ、創薬に活用を始めている。生成AIを利用した創薬スタートアップ企業Aquemiaは、仏製薬大手サノフィとの間で1億4000万ドルの医薬品開発協力契約を締結した(2023年12月5日)。

図1:第12回 保健医療分野AI開発加速コンソーシアム資料 資料-2より抜粋
基礎研究・ターゲット選定に向けたAIの活用
基礎研究フェーズでのAI活用はこれからで、標的候補とその仮説生成には大きなブレークスルーのチャンスが広がっている。厚生労働省資料(第12回 保健医療分野AI開発加速コンソーシアム資料 資料-2)ではヒトデータに基づくAIを活用した創薬ターゲット設定のための新しいアプローチを展開する上ではAI活用は必須であるが、AIが十分に活用されていない現状が示されている。

図2:第12回 保健医療分野AI開発加速コンソーシアム資料 資料-2より抜粋
現在、国内で取り組まれている創薬ターゲット探索の2事例を下記に紹介する。
官民研究開発投資拡大プログラム (PRISM)の枠組みを活用した取り組み
~「新薬創出を加速する人工知能の開発」~
平成30年度から令和4年度にかけて、オミックスデータや臨床情報等のヒトデータに基づくデータ駆動的な創薬ターゲット探索手法等を用いて特発性肺線維症、肺がんでの創薬ターゲットを推定する取り組みである。取集した臨床情報(カルテ情報、患者日誌)、既存知識(文献など)、網羅的オミクス情報のデータベース構築とそれを利用した創薬ターゲットを推定する人工知能(AI)の構築が目的である。人工知能構築では創薬ターゲット推定アルゴリズム、量子コンピューター・ソフトウエア開発が盛り込まれている。下記の図3は「別紙-1:PRISM事業「新薬創出を加速する人工知能の開発」から抜粋した。

図3:別紙-1:PRISM事業「新薬創出を加速する人工知能の開発」
本プロジェクトは令和4年で終了したが、肺がん、特発性肺線維症以外への横展開を検討中である。

図4:第10回健康・医療データ利活用基盤協議会 第12回ゲノム医療協議会より抜粋
多因子性疾患の治療と予防を目指した「ヒューマン・メタバース疾患研究」
2022年秋に日本学術振興会の「世界トップレベル研究拠点プログラム」に採択されたプロジェクトである。人間の体内器官で起こっている生命現象・病的プロセスを仮想空間内で精密に再現したヒトのデジタルツイン(バイオデジタルツイン)を構築し、疾患メカニズムの解明と発症・進行・治療応答性の予測を行うことにより、個別化予防法や根治的な治療法の開発を目指すプロジェクトである。クリニカルデータ(マクロ情報)と患者本人から生成されたiPS細胞で再現したミニチュア臓器(オルガノイド)経由で得た生体反応(ミクロ情報)に情報数理科学的な処理を加えバイオデジタルツインを仮想空間に構築し,疾患メカニズムの解明や個別化予防と治療法の開発,疾患の発症・進行の予測をめざしている。上記情報の入力処理と出力処理に活用できる人工知能構築が不可欠である。

図5:Topics:世界トップレベル研究拠点(WPI拠点) (大阪大学Prime Topicsより抜粋)
DeepSeekのAIモデル(R1)開発
AIの開発には高速処理できる半導体が必須とされ、その開発には莫大なリソースが投入されている。また巨大なデータセンターを建設しなければならず、それらを運用するため大電力も必要とされる。
学習には事前学習と事後学習があり、事前学習でベースモデルを作成し、事後学習で多くの人間のテスターが提供する質問・回答のペアを模倣する訓練(RLHF:Reinforcement Learning with Human Feedback)を行い高評価回答に似た出力できるものを選定する。今回のDeepSeekはこのRLHFを完全自動化した強化モデルに置き換えていることである。つまり、既存AIモデルの入力・出力データを利用して新たなAIに学習させること(蒸留)、また、NVIDIA GPUを使うことなくOpenAI並みの性能を実現したと報告されている。また、DeepSeekのAIモデルはオープンソース化されたことで目的に合ったカスタマイズが可能になっており大きなインパクトがあると考えられる。
医療でのAIイノベーションの推進する上での課題
医薬品領域でのAIイノベーションを推進する上で重要なことは医療ビッグデータ(Electric health Record (EHR))の活用することであるが、医療機関横断的に医療情報を統合し実用化することがほとんど行われていない。これは電子カルテのベンダーが異なること、さらに同一ベンダーの電子カルテでも病院ごとにコードが異なり、病院を超えた情報の統合が出来ない現状がある。
令和5年度からスタートした戦略的イノベーション創造プログラム「統合型ヘルスケアシステム」では次世代の医療情報交換の標準規格である HL7 FHIR に準拠した電子カルテシステムの構築が取り組まれており日本版医療ビッグデータの構築が期待される。このシステムが完成することで「官民研究開発投資拡大プログラム (PRISM)の枠組み」、「多因子性疾患の治療と予防を目指した「ヒューマン・メタバース疾患研究」」のみならず臨床データを用いた医薬品開発研究は加速してくと期待される。
以上、DeepSeekから見た新たなAIイノベーションへの活用方法に関して、創薬ターゲットの探索の現状の取り組みと併せて考察してみた。2024年7月30日開催された創薬エコシステムサミット(Gate Opening Summit for Innovative Drug Discovery)において、日本を世界の人々に貢献できる「創薬の地」と宣言しており、創薬ターゲットに必要な臨床ビッグデータを利用した創薬ターゲット選定プロジェクトの実装化は是非、推進してほしい。
Author Profile
-
公益財団法人 木原記念横浜生命科学振興財団 事業企画部 部長
味の素株式会社に入社後、味の素製薬株式会社、EAファーマ株式会社で医薬品の探索から開発までを経験。公益財団法人 がん研究会 有明病院 先進がん治療開発センターに勤務後、現職場にて勤務。
Leave a Reply
Want to join the discussion?Feel free to contribute!