AIと生物学の融合:スタンフォード大学のHie博士が開発した「Evo」とは?
スタンフォード大学の進化設計研究室を率いるブライアン・ハイ博士(Brian Hie, PhD)は、人工知能(AI)と生物学の交差点に立ち、新たな研究領域を切り拓いています。彼が考えた一つの刺激的な問いが、最新の革新的なAIモデル「Evo」の誕生につながりました。「もしChatGPTのような言語モデルが、膨大なテキストデータのパターンを学習して新しい文章を生成できるならば、遺伝子コードを単語の代わりに置き換えた場合、何が起こるのか?」この単純に思える問いから生まれたのが「Evo」です。Evoは、遺伝子配列を生成する生成AIモデルであり、2024年11月15日付の科学誌『Science』に掲載された論文「Sequence Modeling and Design from Molecular to Genome Scale with Evo」にて、ハイ博士とArc Institute、カリフォルニア大学バークレー校の研究チームによって紹介されました。
Evoは、微生物やウイルスのゲノムの理解を深めたり、新しいタンパク質(つまり創薬)の設計を可能にしたりするほか、微生物を再プログラムして驚くべきタスクを遂行させることが期待されています。例えば、光合成の効率向上による二酸化炭素の固定化、農作物の収量増加、さらには海洋に漂うマイクロプラスチックの除去など、多様な応用が考えられます。
AIによるゲノム設計:Evoの革新性
従来、研究者は有望な遺伝子配列を見つけるために、自然界のデータを膨大に解析するか、試行錯誤による実験を繰り返すしかありませんでした。しかし、Evoの登場によって、このプロセスが大幅に効率化されます。
「これまでのような膨大な試行錯誤や自然界からの配列発掘に頼る必要がなくなり、AIモデルによって最も有望な配列に絞って研究できるようになります」と、ハイ博士は述べています。
Evoの最大の特徴は、生命のゲノム全体を解析可能なスケールを実現し、バイオエンジニアリングの設計プロセスを加速することにあります。さらに、この技術は進化のメカニズム解明や、遺伝性疾患の新たな理解と治療法開発にも貢献する可能性を秘めています。しかも、それらを実験室ではなく、コンピュータ上で行うことができるのです。
Evoが実現した技術的進歩
Evoの根幹となる技術は、自然界に存在する遺伝子コードの複雑な関係を解析し、それを設計・生成する能力です。しかし、DNA、RNA、タンパク質が進化の過程でどのように相互作用してきたのかを理解することは決して容易ではありません。
既存の類似ツールと比較したEvoの進歩点は、以下の2つです:
解析可能なゲノム配列の長さ(コンテキストウィンドウ)の拡大
既存ツールの約8,000塩基対(bp)から、131,000塩基対以上に拡張
DNAの基本単位であるヌクレオチドレベルでの高解像度解析
この結果、Evoは80,000種類の微生物ゲノム、2.7百万の原核生物やバクテリオファージのゲノム(3000億塩基対以上)を学習しました。また、プラスミド(細胞外遺伝子)を含む幅広いDNAデータセットを用いて訓練されています。
なお、安全性確保のため、ヒトや特定の生物に感染するウイルスのゲノムデータは学習から除外されました。
さらに、Evoはヌクレオチド配列の小さな変化が、どのように生物全体の進化適応度に影響を与えるかを学習し、100万塩基対以上のDNA配列を生成する能力を持つとされています。これは、Evoのコンテキストウィンドウ131,000塩基対を7倍以上も超える長さです。
Evoの実証実験:未知のCRISPRシステムの設計
Evoの設計能力を証明するため、Hie博士らはCRISPR-Cas分子複合体の合成設計に挑戦しました。
CRISPR-Casシステムは、RNAとタンパク質を組み合わせてDNAを編集する「分子レベルの機械」のようなものです。研究チームはEvoに対し、新たなCRISPRシステムを生成するよう指示しました。その結果、Evoは完全に機能する未知のCRISPRシステムを生成し、そのうち11種類の設計が実験的に検証されました。
これは言語モデルを活用した、タンパク質とRNAの同時設計の初の成功例となりました。
Evoの未来と展望
現在、ハイ博士はEvoのさらなる改良に取り組んでいます。その方向性としては、
より大規模なゲノム配列の処理能力の向上
出力の制御精度を高める改良
微生物の枠を超えたヒトやその他の生物のゲノム解析への応用
が挙げられます。
「Evoは、機械学習と生物学の交差点における新たな研究の扉を開きました。これにより、これまで想像もできなかった発見が可能となり、生命を設計する能力が飛躍的に向上するでしょう」と、ハイ博士は述べています。
さらに、Evoはオープンソースとして公開されており、研究者が自由にダウンロードして活用できるようになっています。
写真:ブライアン・ハイ博士(Brian Hie, PhD)



