国立大学法人東京大学とGoogle日本法人は、AIを活用した多遺伝子リスクスコア(PRS: Polygenic Risk Score)モデル研究の協業に関して契約を締結したと発表した。
本協業は、多様な社会問題の解決とAIが人と相利共生して生み出す未来社会「AI相利共生未来社会」の実現に向けて、東京大学とGoogleが2020年10月に締結したパートナーシップの一環として行なわれるものとなる。
非欧米系として世界最大級の疾患バイオバンク・ジャパンの包括的なデータを活用
Googleは、これまでに、ゲノム(遺伝子配列データにおける変異やバリアント)を特定するプロセスであるバリアントコーリングの精度を向上させるAIモデルを開発し、2018年にNature Biotechnologyで発表。
また、ゲノム配列データから目の色や特定の病気などの身体的特徴をより正確に予測できるモデルや、これを利用して特定の特徴と関連するバリアントを発見するモデルも開発している。
東京大学医科学研究所では、これまでバイオバンク・ジャパンの解析を通じて肥満症、血液検査、2型糖尿病、心筋梗塞、心房細動などの、数々のゲノムワイド研究において非欧米系集団で最大の貢献をしてきた。
今回の協業では、欧州で開発されたPRSを予測するGoogleのAIモデルを日本でも検証し、改良するとともに、東京大学のゲノムワイド研究の知見をもって評価することで、日本における疾患管理や予防医療の発展への貢献を目指すという。
現在、多くの遺伝学的研究は、ヨーロッパ地域に祖先をもつ個人を対象にしている。それらの人々は世界人口の4分の1以下であるにもかかわらず、既存のGWAS(ゲノムワイド関連解析)研究の4分の3、そしてPRS研究の3分の2 以上は彼らが対象だ。
病気やその治療法に関する理解は、しばしばこれらの研究にもとづいており、ヨーロッパ地域に祖先もつ人々を対象に開発されたPRSの予測性能はほかの集団では低くなることがあるなど、集団間での精度の違いが影響を与える可能性もある。
本研究は、バイオバンク・ジャパンの包括的なデータと、Googleの遺伝統計学とディープニューラルネットワークの専門性を合わせることで、多くの集団に対する遺伝学研究の有用性を広げる機会を提供する。
また、今回の協業では、東京大学医科学研究所のバイオバンク・ジャパンのデータを使用し、機械学習モデルのパフォーマンス分析を行なう。これらのデータは、本協業での利用のみを目的として、高水準のセキュリティを有するGoogle Cloudの日本国内に設置したサーバーに暗号化した上で保管されるとのことだ。
なお、本協業に関して、東京大学大学院新領域創成科学研究科教授の鎌谷洋一郎氏は以下のように述べている。
「バイオバンク・ジャパンは非欧米系として世界最大級の疾患バイオバンクであり、PRS研究の地域間の予測性能差を最初に大規模に証明した研究でも主要な役割を果たしました。今回のデータ利活用と Google の先進的な AI によって、平等で公正な予測性能を持ち、全世界で健康と福祉の増進につながる PRS の開発につながることを期待しています。また、バイオバンク・ジャパンは今後も医療の革新を目指して産業界を含めた更なるデータ利活用の推進をおこなっていきます」
関連情報
https://japan.googleblog.com/2023/02/bbj.html
https://www.u-tokyo.ac.jp/focus/ja/press/z1702_00034.html
構成/立原尚子