科学データのほとんどは、本来それらが促進すべき発見に活かされていません。作成される100のデータセットごとに、約80は研究室内に留まり、20は共有されてもほとんど再利用されず、FAIR原則(FAIR: Findable, Accessible, Interoperable, and Reusable)を満たすものは2つ未満、そして新たな知見を導くものは通常1つしかありません。その結果、がん治療は遅れ、気候モデルは証拠に欠け、研究は再現不可能になっています。オープンサイエンスの出版社であるFrontiersは、研究データのための世界初となるAI駆動型オールインワンサービス「Frontiers FAIR² Data Management」の立ち上げにより、この問題に取り組んでいます。データが再利用可能かつクレジット(功績)が認められる形で共有される方法を変革するように設計されており、キュレーション、コンプライアンスチェック、AI対応パッケージング、査読、インタラクティブポータル、認証、生涯ホスティングを単一のワークフローにまとめています。これにより、今日資金提供された研究が、明日には健康、持続可能性、技術の分野でより迅速なブレークスルーをもたらすことを確実にします。

FAIR²は、FAIR原則を拡張し、すべてのデータセットがAI対応であり、人間と機械の両方によって責任を持って再利用可能であることを保証するオープンな仕様を加えています。研究成果が指数関数的に増加し、AIが発見を再形成している時代に、Frontiers FAIR² Data Managementは、原則を現実世界で大規模な影響を与えるための実用的なインフラストラクチャに変える、最初の実装となります。

Frontiersの共同設立者兼CEOであるカミラ・マークラム博士(Kamila Markram, PhD)は、次のようにコメントしています。 「科学の90%は虚空に消えています。Frontiers FAIR² Data Managementによって、データセットも発見も二度と失われる必要はありません。すべての貢献が今や進歩を促進し、それに値する功績を獲得し、科学を解き放つことができるのです。」

 

AIを核に

データセットのキュレーションやコンプライアンスのチェックから、メタデータの作成、出版可能なアウトプットの生成に至るまで、かつては数ヶ月の手作業を要したタスクが、FAIR²の背後にあるFrontiersのベンチャーであるSenscienceを搭載した「AI Data Steward」によって、今や数分で完了します。

研究者は一度の提出で、認証済みデータパッケージ、査読済みで引用可能なデータ記事、視覚化とAIチャットを備えたインタラクティブ・データポータル、そしてFAIR²証明書の4つのアウトプットを受け取れます。これらは総合的に、品質チェックと明確な要約を含んでおり、専門外の人々にとってデータの解釈を容易にし、分野を超えた組み合わせを簡素化します。

これらが一体となり、すべてのデータセットが保存され、検証され、引用可能で、再利用可能であることを保証します。つまり、科学者に値する功績を与えながら、新たな発見を推進する準備が整うのです。Frontiers FAIR²はまた、データを可視化し、探索しやすくすることで、研究者、政策立案者、実務家、コミュニティ、そして機械による責任ある再利用を可能にし、社会が科学への投資からより多くの価値を得るのを助けます。

 

主要なパイロットデータセット

SARS-CoV-2変異株の特性 — 3,800のスパイクタンパク質変異株をカバーするこのデータセットは、AlphaFold2およびESMFoldによる構造予測と、ACE2結合および発現データをリンクさせています。変異株の挙動と適応度についてのより深い理解を可能にし、パンデミックへの備えのための強力なリソースを提供します。

前臨床脳損傷MRI — 4つの研究センターからの343の拡散MRIスキャンを調和させたデータセットで、プロトコル間で標準化され、比較可能性のために調整されています。再現性のあるバイオマーカーの発見、堅牢な施設横断的分析、そして前臨床外傷性脳損傷研究の進展をサポートします。

環境圧力指標(1990年〜2050年) — 60年以上にわたる43カ国の観測データとモデル化された予測を組み合わせ、排出量、廃棄物、人口、GDP(国内総生産)を追跡します。持続可能性のベンチマーキングと、証拠に基づく気候政策の計画を支えます。

インド太平洋の環礁生物多様性 — 5つの地域にわたる280の環礁を対象とし、生物多様性の記録、サンゴ礁の生息地、気候指標、および人間による利用の歴史を統合しています。生態学的モデリング、保全の優先順位付け、そして脆弱な島嶼生態系に関する地域横断的な研究のための前例のない基盤を提供します。

パイロット版を試用した研究者たちは、Frontiers FAIR²がデータを保存・共有するだけでなく、品質チェック、専門外の人々のための明確な要約、そして分野を超えてデータセットを組み合わせる信頼性を通じて、その再利用への信頼を構築すると指摘しています。これらすべてが、科学者が功績を得ることを保証しながら実現されています。

すべてのパイロットデータセットはFAIR²オープン仕様に準拠しており、責任を持ってキュレーションされ、再利用可能であり、人間と機械による長期的な使用において信頼できるものとなっています。これにより、今日のデータが、社会の最も差し迫った課題に対する明日の解決策を加速することができます。

 

認識と再利用

再利用のたびに元のデータセットの価値は倍増し、発見が無駄になることなく、すべての貢献が次のブレークスルーの火付け役となり、研究者がその仕事に対する認識を得られるようになります。

FAIR² Data Managementの背後にあるFrontiersのAIベンチャー、Senscienceの共同設立者兼CEOであるショーン・ヒル博士(Sean Hill, PhD)は次のように述べています。 「科学はデータの生成に何十億も投資していますが、そのほとんどは失われています。そして研究者が功績を得ることは稀です。Frontiers FAIR²では、すべてのデータセットが引用され、すべての科学者が認識されます。これにより、データ作成という不可欠な作業がようやく報われるのです。こうして治療法、気候変動の解決策、そして新技術がより速く社会に届くようになります。これこそが、私たちが科学を解き放つ方法なのです。」

 

研究者の声

アンヘル・ボルハ博士(Ángel Borja, PhD)、AZTI(海洋研究)、バスク研究技術アライアンス(BRTA: Basque Research and Technology Alliance)、主任研究員: 「この種のデータキュレーションと記事の出版を強くお勧めします。非常に迅速に情報を生成でき、あらゆるエンドユーザーにとって有用なフォーマットだからです。」

エリック・シュルテス氏(Erik Schultes)、ライデン大学アカデミックセンター(LACDR: Leiden Academic Centre for Drug Research)、上級研究員;GO FAIR財団、FAIR実施リード: 「Frontiers FAIR²は、プロジェクトの科学的側面を完璧に捉えていました。」

 

フェムケ・ヘデマ氏(Femke Heddema)、PharmAccess、研究者兼ヘルスデータシステム・イノベーションマネージャー: 「Frontiers FAIR²は、研究者やデジタルヘルス実施者にとってFAIR原則の実行をよりスムーズにし、MomCareのようなデータセットを再利用可能にすることが複雑である必要はないと証明してくれます。透明でアクセス可能、かつ実行可能なデータを実現することで、Frontiers FAIR²は健康研究における新たな機会の扉を開きます。」

 

ニール・ハリス博士(Neil Harris, PhD)、カリフォルニア大学ロサンゼルス校(UCLA: University of California, Los Angeles)、脳神経外科部門・脳損傷研究センター、常駐教授: 「Frontiers FAIR²の実装は、データの欠損と品質の両方について客観的なチェックを提供でき、非常に多くのレベルで有用です。こ のような偏りのない評価とデータ要約は、専門分野外の専門家による理解を助け、最終的にデータ共有を強化することができます。分野が異分野のサブ分野でビッグデータを使用するように進歩するにつれて、これらのデータチェックと要約は、現在 の分析内で既に取得されている多数のデータをどのように使用し、組み合わせるかを適切に把握し続けるために不可欠になるでしょう。」

 

マリアン・マルトーネ氏(Maryann Martone)、Open Data Commons、編集長: 「Frontiers FAIR²は、データをFAIRにするための最も簡単で効果的な方法の1つです。すべての主任研究者(PI)は、自分のデータが研究室内、共同研究者、そして科学コミュニティ全体で見つけやすく、アクセスしやすく、比較可能で、再利用可能になることを望んでいます。本当のボトルネックは、常にそれに必要な時間と労力でした。Frontiers FAIR²は、その障壁を劇的に下げ、真にFAIRなデータをほとんどの研究室の手の届くところに置きます。」

 

ヴィンセント・ウン・コク・シン博士(Vincent Woon Kok Sin, PhD)、香港科技大学(HKUST: The Hong Kong University of Science and Technology)、ソサエティハブ、カーボンニュートラリティ・気候変動スラスト、助教授: 「Frontiers FAIR²は、私たちの世界の廃棄物データセットをより目に見えるアクセスしやすいものにし、しばしば希少で断片的なデータに苦しむ世界中の研究者を助けてくれます。これが協力を広げ、持続可能な廃棄物管理のための知見を加速することを願っています。」

 

セバスチャン・スタイブル博士(Sebastian Steibl, PhD)、ナチュラリス生物多様性センターおよびオークランド大学、ポスドク研究員: 「真のデータアクセシビリティとは、単にデータシートをリポジトリにアップロードすること以上の意味があります。それは、必ずしも長年の訓練を必要とせずに、データを簡単に見たり、探索したり、理解したりできるようにすることを意味します。AIチャットボットとインタラクティブな視覚的データ探索および要約ツールを備えたFrontiers FAIR²プラットフォームは、私たちの生物多様性および環境データを、学者だけでなく、実務家、政策立案者、そして地域コミュニティのイニシアチブにとっても広くアクセス可能で利用可能なものにします。」

[News release]

この記事の続きは会員限定です