AIは、画像生成や自動運転だけでなく、今や生命の根源的な謎そのものに挑戦しています。もし、コンピュータ上で細胞の振る舞いを完璧にシミュレーションできたとしたら、創薬や病気の解明はどれほど加速するでしょうか?その夢の実現に向け、米国の研究機関Arc Instituteが優勝賞金10万ドル相当をかけたAIコンペティションを開始しました。世界中の頭脳が、生命の「仮想モデル」構築に挑みます。これは、かつてタンパク質の構造予測に革命を起こしたコンペティションの再来となるかもしれません。

 Arc Instituteが主催し、NVIDIA、10x Genomics、そしてUltima Genomicsが協賛するこのコンペティションは、AIによる生物学のモデリングの進歩を加速させることに焦点を当てています。参加者は、細胞における単一遺伝子摂動(single gene perturbations: 単一の遺伝子への意図的な変化)の影響を予測するモデルを作成します。優勝賞金10万ドル相当のこのチャレンジは、高品質なデータセットの作成を奨励し、仮想細胞モデリングのための標準化されたベンチマークの確立を支援するArcの取り組みの一環です。

本日(2025年6月26日)発行の学術雑誌『Cell』に掲載された解説記事で、Arcの研究者らは、この独立非営利団体初の「Virtual Cell Challenge」を発表しました。これは、細胞が遺伝的摂動にどのように応答するかを最もよく予測する機械学習モデルに、10万ドル相当の優勝賞金を授与する公開コンペティションです。Arcは、人工知能と生物学の接点における進歩を促進するため、特に高品質なデータセットの作成を加速させ、AIモデルが細胞の挙動をどれだけうまくシミュレートできるかを評価するための厳格な基準についての議論を喚起するために、このコンペティションを導入します。 

初開催となる今回のチャレンジのために、Arcは300の遺伝的摂動を加えた30万個のH1ヒト胚性幹細胞(H1 hESCs)からなる新しいシングルセル・トランスクリプトミクスデータセットを生成しました。このデータセットは、コンペティション期間を通じて、ファインチューニング、検証、およびテストのために段階的に展開されます。参加者は、Arc Virtual Cell Atlasに含まれる5億個以上の細胞の遺伝子発現データや、その他の公開データセットでモデルを訓練することが推奨されます。このチャレンジでは、個々の遺伝子がサイレンシング(機能抑制)されたときに、遺伝子の活性がどのように変化するかをモデルがどれだけうまく予測できるかを特に評価します。参加者は、コンペティションの中間段階でこれらの効果の予測を行い、その中間成績はライブのリーダーボードで共有された後、最終評価を経て勝者が公式に発表されます。

「チームの成功は、モデルが新しい細胞コンテキストに般化する能力にかかっています。これは難しい課題なので、私たちはこの最初のコンペティションを、H1ヒト胚性幹細胞のトレーニング用サブセットを公開するフューショット学習(few-shot learning)チャレンジとして構成しました」と、Arcの最高技術責任者であるデイブ・バーク博士(Dave Burke, PhD, X: @davey_burke)は述べています。「モデルが新しい細胞コンテキストに般化する能力は、最終的に創薬のために仮想細胞の可能性を解き放つ鍵であり、このチャレンジがその目標に向けた進歩を加速させる一助となることを願っています。」

このコンペティションの評価フレームワークを開発するにあたり、Arcは、この分野における仮想細胞モデルの性能に関する一貫したベンチマークを提供することも目指しています。シングルセル技術と機械学習の急速な進歩は、細胞の挙動をモデル化する新たな機会を生み出しましたが、研究者たちは評価方法が一貫しておらず、データセットの質も様々であるため、異なるアプローチを比較するのに苦労してきました。

「動的な細胞応答を捉えることができる仮想細胞は、生物学研究の未来を象徴するものですが、これらのモデルの性能をテストし比較するための厳格な方法が必要です」と、Arcの事務局長、共同創設者、そしてコア研究員であるシルヴァーナ・コーナマン博士(Silvana Konermann, PhD, X: @SKonermann)は語ります。「このコンペティションは、科学者が最も有望なAIモデルを構築することを奨励すると同時に、私たちが研究コミュニティと共に評価フレームワークをストレステストし、分野全体がその上に築き上げることができるベンチマークを確立することを可能にします。」

チャレンジへの登録は6月26日からvirtualcellchallenge.orgで受け付けており、チームはサインアップ時にトレーニングデータを受け取ります。最終順位は、最終提出期限の1週間前の10月下旬に公開される最終テストセットでのモデル性能のみによって決定されます。勝者は12月に発表される予定です。

個人での参加はもちろん、学術機関、バイオテクノロジー企業、独立した研究組織からのチームも参加資格があります。特に、計算モデリングやシングルセル生物学の経験を持つ参加者が奨励されています。上位3モデルのチームには、現金とNVIDIA DGX Cloudクレジットを組み合わせた、それぞれ10万ドル、5万ドル、2万5千ドル相当の賞品が授与されます。このVirtual Cell Challengeは、NVIDIA、10x Genomics、そしてUltima Genomicsの寛大な支援を受けています。

「Virtual Cell Challengeは、仮想細胞の開発者たちを結びつけ、生命科学における発見のための新しいモデルを構築する助けとなるでしょう。私たちは、遺伝的摂動が細胞の挙動にどのように影響するかを予測できる強力な基盤モデルを研究コミュニティが構築できるよう、このコンペティションを支援しています」と、NVIDIAのデジタルバイオロジー担当ディレクターであるアンソニー・コスタ博士(Anthony Costa, PhD)は述べています。

「この取り組みは、コミュニティの関与を促進し、高品質なベンチマークデータセット、公開リーダーボード、そして再現可能で透明性のある比較メカニズムを提供することによって、進歩を加速させることを目的としています」と、Arcのコア研究員であるハニ・グッドアージ博士(Hani Goodarzi, PhD, X: @genophoria)は語ります。「画期的なアイデアはどこからでも生まれます。研究者が互いにより良いモデルを作るよう切磋琢磨するとき、分野全体が前進するのです。」

Arcは、毎年異なる細胞タイプの新しいシングルセル・トランスクリプトミクスデータセットと、より複雑な生物学的変化の影響を予測することを参加モデルに要求する、より厳しい課題を伴う「Virtual Cell Challenge」を繰り返すことで、この分野の進歩を継続的に推進していく計画です。 

「CASPコンペティションは、25年以上にわたってタンパク質の構造予測を変革し、最終的にAlphaFoldのようなブレークスルーを可能にしました」と、Arcの共同創設者でありコア研究員のパトリック・スー博士(Patrick Hsu, PhD, X: @pdhsu)は言います。「私たちは、Arcが同じアプローチを用いて、私たちが生物学を研究し、複雑な疾患をより良く治療するための標的を特定する方法を根本的に変える可能性のある、包括的な仮想細胞への進歩を加速させることができると信じています。」

[Arc Institute news release]

この記事の続きは会員限定です