テネシー州にあるオーク・リッジ国立研究所(ORNL)の科学者らは、量子生物学、人工知能、バイオエンジニアリングの専門知識を活用して、再生可能燃料や化学品を生産するために改変可能な微生物などの生物に対するCRISPR/Cas9ゲノム編集ツールの改良に取り組んでいます。CRISPRはバイオエンジニアリングにおいて強力なツールであり、生物の性能を向上させたり、突然変異を修正するために遺伝コードを変更するために使用されます。CRISPR/Cas9ツールは、Cas9酵素がゲノム内の対象となるサイトと結合し、切断するための唯一のユニークなガイドRNAに依存しています。CRISPRツール用の効果的なガイドRNAを計算上予測するための既存のモデルは、わずかなモデル種からのデータに基づいて構築されており、微生物に適用した場合の効率は弱く、一貫性がありません。
「多くのCRISPRツールは、哺乳類細胞やショウジョウバエなどのモデル種向けに開発されています。微生物に特化したものは少なく、染色体の構造やサイズが大きく異なります」と、ORNLの合成生物学グループのリーダーであるキャリー・エッカート博士(Carrie Eckert, PhD)は述べています。「微生物で作業する際にCRISPR/Cas9機構の設計モデルが異なる振る舞いをすることに気づいており、この研究は私たちが経験的に知っていたことを検証するものです。」
ガイドRNAのモデリングと設計を改善するために、ORNLの科学者らは、細胞核内で起こる最も基本的なレベルの現象をよりよく理解することを目指しました。細胞核は遺伝物質が保存されている場所です。彼らは、分子生物学と量子化学を架橋する量子生物学という分野に目を向けました。この分野は、電子構造が核酸(DNAやRNAを構成する分子)の化学的特性や相互作用に与える影響を調査します。
分子内で電子が分布する方法は、反応性や構造的安定性に影響を与え、Cas9酵素-ガイドRNA複合体が微生物のDNAと効果的に結合する可能性を含む、とORNLの計算システム生物学者であるエリカ・プラテス博士(Erica Prates, PhD)は述べています。
森の中の最良のガイド
科学者らは「反復ランダムフォレスト」と呼ばれる説明可能な人工知能モデルを構築しました。このモデルは、大腸菌のゲノムを標的とする約50,000のガイドRNAのデータセットを使用して訓練され、量子化学的特性を考慮に入れたアプローチで、2023年9月20日に「核酸研究」誌に掲載された論文で説明されています。オープンアクセスの論文は「Quantum Biological Insights into CRISPR-Cas9 sgRNA Efficiency from Explainable-AI Driven Feature Engineering(解釈可能なAIによる特徴エンジニアリングからのCRISPR-Cas9 sgRNA効率への量子生物学的洞察)」と題されています。
このモデルは、より良いガイドRNAを選択することができる核酸に関する重要な特徴を明らかにしました。「このモデルは、私たちのガイドRNAの効率を支える分子機構についての手がかりを特定するのに役立ちました。これにより、CRISPR技術を改善するのに役立つ豊富な分子情報のライブラリーを手に入れることができます。」とプラテス博士は述べています。ORNLの研究者らは、モデルによって選択された多数のガイドを使用して大腸菌でのCRISPR/Cas9カット実験を行い、説明可能なAIモデルを検証しました。
説明可能なAIを使用することで、科学者らは結果をもたらした生物学的メカニズムを理解することができました。これは、「ブラックボックス」アルゴリズムに根ざした深層学習モデルとは異なり、解釈可能性が欠けています。この論文の第一著者であり、以前はORNLの計算システム生物学者であったジャクリーン・ノーシェイ博士(Jaclyn Noshay, PhD)は述べています。
「我々は、微生物種に焦点を当てて、最適な切断効率のためのガイド設計ルールをより深く理解することを目指しました。これは、生物界をまたいで訓練されたモデルの互換性がないことを知っていたためです」とノーシェイ博士は述べています。
説明可能なAIモデルは、何千もの特徴を持ち、反復的な性質を持っており、ORNLのオーク・リッジ・リーダーシップ・コンピュータ施設(OLCF)のサミットスーパーコンピュータを使用して訓練されました。OLCFは、DOE(米国エネルギー省)科学局のユーザー施設です。
エッカート博士は、彼女の合成生物学チームが、新しい微生物CRISPR/Cas9モデルで学んだことを活かし、実験室の実験データや様々な微生物種からのデータを使用して、さらに改善するためにORNLの計算科学の同僚たちと協力する計画を持っていると述べました。
すべての種にとってのより良いCRISPR/Cas9ツール
量子特性を考慮に入れることで、すべての種に対するCas9ガイドの改良の道が開かれます。「この論文は、人類規模での影響も示唆しています」とエッカート博士は述べています。「例えば、特定のゲノム領域を標的とするCRISPRを使用した薬物開発などを考えるとき、それらのガイドを予測するために最も正確なモデルを持つことが必須です。」
CRISPR/Cas9モデルの洗練化により、科学者らは遺伝子型から表現型、つまり遺伝子から物理的特徴へのリンクを高速化するパイプラインを持つことができます。この研究は、バイオエネルギー原料植物の改善やバイオマスの細菌発酵など、ORNLが主導するバイオエネルギー革新センター(CBI)の仕事にも影響を与えるとされています。
「この研究により、私たちはガイドRNAの予測を大幅に改善しています。生物学的プロセスをより深く理解し、予測により多くのデータを供給するほど、私たちのターゲットはより正確になり、研究の精度と速度が向上します。」とエッカート博士は述べています。
「私たちの研究の主要な目標は、CRISPRツールを使用してより多くの生物のDNAを予測的に変更する能力を向上させることです。この研究は、生物の遺伝コードにコストのかかる“タイプミス”を避ける方法を理解する上で、興味深い進展を示しています。追加のトレーニングデータを生成し、説明可能なAIモデリングを活用し続けるにつれて、これらの予測がどれだけ改善できるかを知るのが楽しみです。」と、CRISPR研究を支援したDOEゲノム科学プログラムのセキュアエコシステムエンジニアリングおよびデザインサイエンスフォーカスエリア(SEED SFA)のリーダーであり、ORNLの生化学分析化学者であるポール・アブラハム博士(Paul Abraham, PhD)は述べています。
画像:Philip Gray/ORNL、米国エネルギー省
[News release] [Nucleic Acids Research article]



