マルチモーダルデータ時代の細胞解析ツールを開発するMIT博士課程の学生、シンイー・チャン(Xinyi Zhang)。
近年のイメージング技術やゲノミクスなどの進歩により、生命科学の分野は膨大なデータにあふれています。例えば、アルツハイマー病患者の脳組織から採取された細胞を研究する生物学者は、細胞の種類、発現している遺伝子、組織内での位置など、さまざまな特徴を調査したいと考えるでしょう。
しかし、現在、細胞を実験的に異なる種類の測定を同時に行うことは可能ですが、そのデータを解析する際には、通常、一度に一種類の測定データしか扱うことができません。この「マルチモーダル」データを解析するためには、新しい計算ツールが必要です。ここで、シンイー・チャン(Xinyi Zhang)の登場です。
MIT博士課程の4年生であるチャンは、機械学習と生物学を組み合わせることで、従来の方法では限界がある領域において、基礎的な生物学的原理を理解するための研究を進めています。彼女は、MIT電気工学・コンピュータ科学部のキャロライン・ユーラー(Caroline Uhler)教授の研究室、情報と意思決定システム研究所(Laboratory for Information and Decision Systems)、およびデータ・システム・社会研究所(Institute for Data, Systems, and Society)で活動しており、ブロード研究所(Broad Institute)のエリック・ウェンディ・シュミットセンター(Eric and Wendy Schmidt Center)の研究者らとも協力しています。チャンは、細胞の制御メカニズムを理解するための計算フレームワークや原理の構築において、数々の取り組みを主導してきました。
「これらすべては、細胞がどのように機能するのか、組織や臓器がどのように機能するのか、なぜ病気になるのか、そしてなぜ時には治癒するのかを解明するための一歩です」とチャンは語っています。
チャンは、MITでの研究だけでなく、余暇にも積極的に活動しています。MITのコンサート合唱団でのパフォーマンス、セーリング、スキー、アイススケート、ロッククライミング、さらにはシングルエンジン機の操縦まで、彼女の趣味は多岐にわたります(彼女は2022年11月にパイロットライセンスを取得しました)。
「私は新しい場所に行き、やったことのないことをするのが好きです」と、彼女は控えめに述べています。
彼女の指導教官であるユーラー教授は、チャンの静かな謙虚さが「毎回の会話で驚き」をもたらすと述べています。
「毎回、新しい何かを学びます。例えば『今度は飛行機の操縦を学んでいるんだ』とかね。彼女が何をしても、それは彼女が本当に大切にしていることだからこそです。彼女が関心を持つことに真剣に取り組む姿勢は、とても素晴らしいと思います」とユーラー教授は語っています。
チャンが初めて生物学に興味を持ったのは、中国の杭州で高校生だった頃です。彼女は、生物の授業で先生が自分の質問に答えられなかったことから、生物学が「最も興味深い」学問であると感じるようになりました。
その後、彼女の生物学への興味は、バイオエンジニアリングへの関心へと発展しました。中学校教師である両親の勧めで、彼女は米国での学びを決意し、カリフォルニア大学バークレー校で電気工学とコンピュータサイエンスを専攻しながら、バイオエンジニアリングを学びました。
チャンは2020年にMITの電気工学・コンピュータ科学博士課程に進む準備をしていましたが、COVID-19パンデミックにより1年遅れることになりました。それにもかかわらず、2022年12月には、ユーラー教授や他の2名の共著者とともに、Nature Communications誌に論文を発表しました。
この論文の基礎を築いたのは、共著者の一人であるシャオ・ワン(Xiao Wang)です。彼女は以前、ブロード研究所で、同一細胞の複数の形態のイメージングと遺伝子発現を組み合わせる空間細胞解析法を開発し、その細胞が由来する組織サンプル内の位置をマッピングするという、これまでにない研究を行っていました。
この技術は、さまざまな病気の進行を追跡する新しい方法を提供する可能性がありましたが、生成されるマルチモーダルデータを解析する手段がありませんでした。ここでチャンが登場し、このデータを解析する計算手法の設計に興味を持ちました。
チームは、細胞の情報を明らかにする安価なイメージング手法であるクロマチン染色を選択しました。次のステップとして、ワンが開発した空間解析技術を統合するため、チャンはオートエンコーダを設計し始めました。
オートエンコーダは、通常、高次元データを圧縮し、その後元のサイズに戻すニューラルネットワークの一種です。しかし、この場合、チャンのオートエンコーダは逆のアプローチを取り、入力データをより高次元に変換しました。これにより、異なる動物からのデータを統合し、生物学的に意味のない技術的なバリエーションを除去することができました。
論文では、この技術を利用して、アルツハイマー病の進行を空間およびイメージング技術を用いてどのように観察できるかを特定しました。このモデルは、他の多くの病気の解析にも利用できるとチャンは述べています。
時間と資源が無限にあれば、彼女の夢は人間の生命を完全にモデル化することです。しかし、時間も資源も限られているため、彼女の野心は留まるところを知りません。彼女は「私たちがまだ解決するためのツールを持っていない最も困難な問題を解決するために、私のスキルを活かしていきたい」と述べています。
現在、チャンは、前頭前野のイメージングを解析して神経変性を研究するプロジェクトや、タンパク質の配列とクロマチンイメージングからタンパク質の画像を予測するプロジェクトなど、いくつかのプロジェクトを進めています。
「まだ多くの未解決の問題があります」と彼女は言います。「私は、生物学的に意味があり、これまで知られていなかったことを理解するのに役立つ質問を選びたいです」。
この投稿は、MITのオースティン・チェン氏(Austin Chenによるリリースを基にしています。
写真:Xinyi Zhang シンイー・チャン (Credit: Jared Charney)



