科学者たちは20年以上にわたり、ヒト・リファレンスゲノムとして知られるコンセンサス遺伝子配列を使用し、他の遺伝子データと比較してきました。このリファレンスゲノムは数え切れないほどの研究で利用され、特定の病気の遺伝子を特定したり、ヒトの形質の進化を追跡したりすることが可能になりました。しかしこのツールには常に問題がありました。最大の問題の一つは、データの約70パーセントが、ヒトゲノム計画でDNA配列が決定されたアフリカ系ヨーロッパ人の男性から得られたものであるということです。その結果、地球上の70億の人々の間でわずかながらでも違いを生み出す0.2〜1パーセントの遺伝子配列についてはほとんど知ることができず、生物医学データにはバイアスが生じていると考えられています。このバイアスは、現在の健康格差の一部の原因ともなっています。

たとえば、リファレンスゲノムには含まれていないヨーロッパ人以外の集団に見られる多くの遺伝子変異が存在します。これまで、研究者たちはヒトの多様性をより包括的に捉えるためのリソースを求めてきました。そして、ヒト・パンゲノム・リファレンス・コンソーシアム(HPRC)の科学者たちは、この取り組みで画期的な進歩を遂げました。彼らは2023年5月10日付のネイチャー誌に発表し、世界中の47人のゲノム配列を「パンゲノム」と呼ばれる形で再構築したと述べています。このパンゲノムでは、各ゲノム配列の99%以上が高い精度で再現されています。

このオープンアクセス論文のタイトルは『A Draft Human Pangenome Reference』です。これにより、個人間で異なるヒトDNAの割合を特徴付ける上で、大きな進展が達成されました。これにより、将来的には様々な人々の遺伝子情報をより包括的に理解することが可能となります。ヒト・パンゲノムの構築により、リファレンスゲノムの限定的な範囲から抜け出し、より広範な遺伝子多様性を考慮することができるようになります。

DNA塩基配列の重ね合わせにより、これまで観察されていなかった約1億2000万個のDNA塩基対が明らかになりました。

エーリッヒ・D・ジャービス博士(ロックフェラー大学)は、「パンゲノムはまだ完全ではありませんが、世界中の科学者がヒトゲノムの新たな基準リファレンスとして利用できる状態で公開されています」と述べています。

彼はさらに、「この複雑なゲノムコレクションは、これまでに捉えられていなかったヒトの遺伝的多様性を非常に正確に反映しています。自由に利用できる遺伝子データの幅と深さが増えたことで、研究者は遺伝子と疾患形質の関連性について深い理解を得ることができ、臨床研究を加速させることができます」と述べています。

このパンゲノムの公開により、研究者たちは新たな情報にアクセスし、ヒトの遺伝子に関する知識を大幅に拡充することができます。また、遺伝的多様性がより正確に反映されることで、疾患の起源や進行メカニズムについても深い洞察を得ることが期待されます。

多様性の調達

2003年に完成した初版のヒトゲノムは、比較的に不正確なものでした。しかし、年月が経ち、ギャップが埋められ、エラーが修正され、シークエンス技術が進歩したことにより、より正確なデータが得られるようになりました。昨年、最後の8%のゲノム(主にタンパク質をコードしない領域や反復的なDNA領域)が解読され、新たなマイルストーンが達成されました。

しかしながら、リファレンスゲノムはまだ完全ではなく、特に多様性を反映する0.2〜1パーセントのDNAは重要でした。この問題に取り組むため、ヒト・パンゲノム・リファレンス・コンソーシアム(HPRC)が2019年に米国と欧州の10以上の研究機関によって設立されました。

当時、コンソーシアムのリーダーであるジャービス博士は、「脊椎動物ゲノムプロジェクト」という脊椎動物の全7万種の塩基配列決定を目指す取り組みを通じて、高度な塩基配列決定と計算手法の開発に取り組んでいました。彼と他の研究者たちは、これらの進歩を活用して高品質な2倍体ゲノムアセンブリを作成し、ホモ・サピエンス(ヒト)内の変異を明らかにすることを決めました。

多様なサンプルを収集するために、研究者たちは1000 Genomes Projectを利用しました。このプロジェクトは、地理的および民族的に多様な26の集団を代表する2,500人以上のヒトゲノムの塩基配列が登録されている公開データベースです。これらのサンプルの大部分は、地球上で最も多様な人々が住むアフリカからのものです。

ジャービス博士は、「他の多くのヒトゲノム多様性プロジェクトでは、主にヨーロッパのサンプルが選ばれていますが、私たちは意図的に逆のアプローチを取りました。過去の偏見に立ち向かおうとしたのです」と述べています。

ママ、パパ、子ども

脊椎動物ゲノムプロジェクトに関連するコンソーシアムのメンバーが開発したアプローチは、長年の技術的な問題を解決するために使用されました。このアプローチでは、親子の「トリオ」(母親、父親、子供)のゲノム配列を組み合わせることで、より正確な塩基配列情報を得ることができます。

ヒトのゲノムは、親から受け継がれるため、個人はすべての染色体のコピーを2つ持っています。しかし、古い技術やアルゴリズムでは、親のDNAを分離することが難しく、親の遺伝子データを統合する際にエラーが発生しやすくなっていました。このため、個人のゲノム情報が不明瞭になることがありました。
「お父さんとお母さんの染色体の違いは、多くの人が思っている以上に大きいのです。お母さんは20コピーの遺伝子を持っていて、お父さんは2コピーの遺伝子しか持っていないかもしれない。」

パンゲノムには非常に多くのゲノムが含まれるため、その解読は困難を伴うものでした。そこで、ヒト・パンゲノム・リファレンス・コンソーシアム(HPRC)は、親子のトリオを対象にしたアプローチに注目しました。このアプローチでは、母親と父親のゲノムデータを使用して、遺伝の系統を明確にし、子供の塩基配列をより正確に得ることができます。

この方法により、親子の遺伝子データの統合が改善され、個人のゲノム情報の正確性が向上しました。これにより、ヒト・パンゲノム・リファレンスの完成度が向上し、より包括的な遺伝的多様性の理解や、個別の遺伝子プロファイルに基づく医療や治療法の開発が進むことが期待されます。


新しいバリエーション

研究者たちは47人のサンプルを分析し、各染色体に2本ずつのゲノム配列と男性のY染色体を加えた94本の異なるゲノム配列を得ました。これらの配列を整列させ、重ね合わせるために高度な計算技術を使用しました。

その結果、1億2千万塩基対のDNAのうち、以前には見られなかったものや以前の文献で指摘されていた位置とは異なる位置にあるものが約9千万塩基対存在することが明らかになりました。これらの差異は、構造変異によるものです。構造変異とは、染色体の一部が移動、欠失、逆位、重複などの再配列によって生じるDNAの違いのことを指します。

近年の研究によって、構造変異が集団特異的な多様性だけでなく、ヒトの健康にも重要な役割を果たしていることが示されています。構造変異は形質の違いや病気、遺伝子の機能に劇的な影響を与える可能性があります。新たに同定された多くの変異により、以前に不可能だった新たな発見が可能になると期待されています。これにより、遺伝子疾患のメカニズムや個別の遺伝子変異と疾患の関連性の理解が深まり、医療の向上につながる可能性があります。

ギャップを埋める

パンゲノムアセンブリは、反復配列や重複遺伝子によるギャップも埋めることができます。その一例が主要組織適合複合体(MHC)です。MHCは細胞表面のタンパク質をコードする遺伝子群であり、SARS-CoV-2などの抗原を免疫系が認識するのに重要な役割を果たしています。

従来の配列決定法では、MHCの多様性を調べることは困難でした。しかし、パンゲノムアセンブリによってMHCの多様性を研究することが可能になりました。これにより、特定の病原体に対する免疫応答が個人によって異なるかどうかを理解する上で役立ちます。また、臓器移植のドナーと患者のマッチングや、自己免疫疾患のリスクの特定など、さまざまな医療の向上にもつながる可能性があります。

セントロメアは染色体の中心に位置し、細胞分裂時に引き離される役割を果たしています。セントロメアの変異は、ガンや他の病気の原因になる可能性があります。

セントロメアは高度に反復性のあるDNA配列を持っているにもかかわらず、異なるハプロタイプ間で非常に多様性があります。一人の人間の遺伝的な差異や、一人の人間内でも母方と父方のハプロタイプの遺伝的な差異の50%以上を占めることもあります。セントロメアは染色体の中で急速に進化している領域の一つとされています。


関係の構築

HPRCは現在、47人のパンゲノムを出発点としていますが、最終目標は2024年半ばまでに、少なくとも350人分の高品質でエラーのほとんどないゲノムデータを作成することです。これには、さまざまな集団からの参加が含まれます。例えば、チベット人のように、特定の集団が高地での生活に適応するための対立遺伝子を持っていることが示されています。

しかし、このようなデータ収集の課題の一つは、過去に生物学的データの濫用を経験してきたコミュニティからの信頼を得ることです。例えば、今回の研究には、科学的研究において長らく軽視され、搾取されてきたネイティブ・アメリカンやアボリジニのサンプルは含まれていません。遺伝子データの非倫理的な使用は、遡れば数年前にも存在しました。複数の国で何千人ものアフリカ人からのDNAサンプルが、提供者の知識、同意、利益なしに商品化された事例がありました。

このような過去の犯罪は、多くの人々に科学者への不信感を抱かせる結果となりました。しかし、これらの集団が参加していないことで、遺伝学的な不明瞭さが続き、データの偏りや健康格差が持続する可能性があります。

ジャービス博士は、この問題は複雑であり、関係構築が必要であると指摘しています。「私たちはより敏感になっています」と述べています。

ただし、現在でも多くの団体が参加を希望しており、さまざまな国の個人、機関、政府機関が参加したいと表明しています。ジャービス博士は、「私たちはすでに前進しています」と述べています。

[News release] [Nature article]

この記事の続きは会員限定です