国際研究チームは、完全にシークエンスされた最初のヒトY染色体の配列を生成しました。これは、完全にシークエンスされた最後のヒト染色体です。新しい配列は、Y染色体の長さの50%以上にわたるギャップを埋め、精子の生産に関連する要因など、生殖に関連する重要なゲノムの特徴を明らかにしています。

この研究は、国立ヒトゲノム研究所(National Human Genome Research Institute、NHGRI)が資金提供する研究チーム、テロメアからテロメアまでのコンソーシアム(Telomere-to-Telomere、T2T Consortium)によって主導され、2023年8月23日に「Nature」誌に掲載されました。この論文のタイトルは「ヒトY染色体の完全な配列」(The Complete Sequence of a Human Y Chromosome)です。

Y染色体は、X染色体と共に、性的発達における役割でよく議論されます。これらの染色体は中心的な役割を果たしますが、人間の性的発達に関与する要因はゲノム全体に広がっており、非常に複雑で、男性、女性、インターセックス個体の間で見られる多様な性的特徴を生み出しています。これらのカテゴリーは、社会的なカテゴリーであるジェンダーとは異なります。さらに、最近の研究では、Y染色体上の遺伝子が、がんのリスクや重症度など、人間の生物学の他の側面にも寄与していることが示されています。

研究者らは20年前に最初のヒトゲノム配列を完成させたとき、24本の染色体のすべての配列にギャップが残されました。しかし、残りのゲノム配列に散らばる小さなギャップとは異なり、Y染色体の配列の半分以上が謎のままでした。

すべての染色体には繰り返し領域があるものの、Y染色体は特に繰り返しが多く、その配列を完成させることは特に困難でした。配列データを組み立てることは、長い本を細かいストリップに切り分けて読むようなものです。本のすべての行がユニークなら、行の順番を決定するのは容易です。しかし、同じ文が何千回も繰り返されると、ストリップの元の順序ははるかに不明瞭になります。すべてのヒト染色体に繰り返しが含まれていますが、Y染色体の約3,000万文字が繰り返し配列です。それは、本の半分の長さにわたって同じ数行が繰り返されるようなものです。

T2Tコンソーシアムは、新しいDNAシークエンス技術と配列組み立て方法を適用し、他の23本のヒト染色体の最初のギャップのない配列を生成した際に得られた知見を活用し、ヒトゲノムの最も繰り返しの多い部分に取り組みました。

「最大の驚きは、繰り返しの整然とした組織化でした。欠落していた配列の正確な内容はわかりませんでした。とても混沌としている可能性もありましたが、代わりに染色体のほぼ半分が、衛星DNAとして知られる2つの特定の繰り返し配列の交互のブロックで構成されていました。それは美しいキルトのようなパターンを作っています。」とNHGRIの上級研究者であり、T2Tコンソーシアムのリーダーであるアダム・フィリッピ博士(Adam Phillippy, PhD)は述べています。

Y染色体の完全な配列は、医学的に関連する領域の重要な特徴も明らかにしています。Y染色体のあるセクションは、精子の生産に関与していることが知られているいくつかの遺伝子を含むDNAの一部で、無精子症因子領域と呼ばれています。新しく完成した配列を用いて、研究者らは無精子症因子領域内の反転繰り返しまたは「回文」の構造を調査しました。

「この構造は非常に重要です。時々、これらの回文はDNAのループを作ることがあります。時々、これらのループが偶然に切り取られ、ゲノムに欠失を生じさせます。」と、Nature誌の論文の第一著者であるNHGRIの研究員アラン・リー博士(Arang Rhie, PhD)は述べています。

無精子症因子領域における欠失は、精子の生産を阻害し、その結果、生殖能力に影響を与えることが知られています。完全なY染色体配列を持つことで、研究者はこれらの欠失と精子の生産に及ぼす効果をより正確に分析することができるようになります。

また、医学的に関連する可能性のある他の領域には、繰り返される遺伝子が含まれています。ヒトゲノムのほとんどの遺伝子は、両親からそれぞれ1つずつ、合計2つのコピーを持っています。しかし、一部の遺伝子は、DNAの一部分に沿って繰り返される多くのコピーを持っています。これは時々「遺伝子配列」と呼ばれます。

研究者らは、精子の生産に関与すると考えられているTSPY遺伝子に焦点を当てました。TSPYのコピーは、ヒトゲノムで2番目に大きい遺伝子配列で整理されています。他の繰り返し領域と同様に、繰り返される遺伝子の分析は困難であり、TSPYが多くの繰り返しコピーとして存在することは知られていましたが、この配列の特定のDNA配列と組織はこれまで知られていませんでした。研究者らはこの領域を分析し、異なる個体にはTSPYのコピーが10から40の間であることを発見しました。

「これまで見たことのない変異を見つけると、常に希望は、それらのゲノム変異が人間の健康を理解する上で重要になることです。医学的に関連するゲノム変異は、将来的により良い診断法の設計に役立てることができます。」とフィリッピ博士は述べています。

Y染色体の完全な配列に加えて、NHGRI資金提供のヒトゲノム構造変異コンソーシアムは、「Nature」の同じ号に掲載された43個の多様なヒトY染色体の配列も報告しています。この二つ目の論文は「Assembly of 43 Human Y Chromosomes Reveals Extensive Complexity and Variation(43個のヒトY染色体の組み立てが広範な複雑さと変異を明らかにする)」と題されています。これらの進歩は、2022年にT2Tコンソーシアムによってリリースされたギャップのないヒトゲノム配列、および2023年5月にNHGRI資金提供のヒトパンゲノムリファレンスコンソーシアムによってリリースされた「パンゲノム」と補完し合っています。これらの成果を通じて、科学者たちはヒト生物学を解き明かし、ゲノム医療の未来を切り開くための新しいゲノミクスリソースにアクセスできるようになりました。

NHGRIについて

国立ヒトゲノム研究所(NHGRI)は、保健福祉省の機関である国立衛生研究所(NIH)の27の研究所とセンターの一つです。NHGRIの内部研究部門は、ゲノムと遺伝病の理解、診断、治療のための技術を開発し、実施しています。NHGRIに関する追加情報は、https://www.genome.gov/で見ることができます。

[News release] [Nature article 1] [Nature article 2] [CNN article]

この記事の続きは会員限定です