東大と日本IBMが脂肪肝からの肝がん発症リスクを予測する新しいAIモデルを構築

2024.06.11

東京大学医学部附属病院消化器内科の中塚拓馬助教、検査部の佐藤雅哉講師（消化器内科医）、同大大学院医学系研究科消化器内科学の建石良介准教授、藤城光弘教授、小池和彦東京大学名誉教授らの研究グループは、日本アイ・ビー・エムコンサルティング事業本部橋爪夏香氏、鎌田亜美氏、米澤翔氏、壁谷佳典氏の協力の下、脂肪肝デジタル病理画像（注1）の深層学習によって、脂肪肝からの肝がん発症リスクを予測する新しいAIモデルを構築した。

線維化が進行していない症例からの肝がん発症予測が可能に

AIが脂肪肝病理画像から肝発がんリスクを推定する（赤枠は発がん確率が高く、青枠は発がん確率が低い、平均して全体の確率を計算する）

脂肪性肝疾患（SLD: Steatotic liver disease）（注2）は、肥満人口の増加に伴い、世界中で問題となっている。近年では人口の約3割が脂肪肝を有すると言われ、その中から肝がんの発症リスクの高い患者を特定することが重要な課題となっている。

本研究では、脂肪肝肝生検標本のデジタル病理画像を深層学習し、肝がん発症リスクを予測する人工知能（AI）モデルを構築した。

肝線維化（注3）は、肝がん発症リスクの最も重要な指標とされているが、SLDにおいては線維化が進展していない状態においても肝がんを発症するケースが頻繁に報告されている。

本AIモデルは、非がん組織における細胞異型（注4）、核細胞質比（注5）の上昇、炎症細胞浸潤、大型脂肪滴の消失といった、これまで注目されていなかった微細な病理所見を認識することにより、線維化が進行していない症例からの肝がん発症予測を可能とした。

今回の研究結果は、脂肪肝から発症する肝がんの早期発見を可能とし、脂肪肝病理所見と肝がんリスク評価に新たな視点を提供することが期待されている。本研究成果は5月20日（現地時間）に学術誌「Hepatology」オンライン版にて発表された。

発表内容について

■研究の背景

肥満人口の増加を背景としてSLDは世界中で増加の一途を辿っており、近年では成人人口の約3割が脂肪肝を有するとも言われている。

脂肪肝の中には、肝炎や肝硬変を経て肝不全や肝がんに至る重症例も存在する。特に、線維化が顕著な脂肪肝では肝がんのリスクが高まることが報告されているが、SLDにおいては線維化が進展していない状態においても肝がんを発症するケースが頻繁に報告されている。

多くの患者が適切な管理を受けずに進行した肝がんの診断を受けるため、脂肪肝患者の中から高リスク群を早期に特定し、適切なフォローアップを受けられるよう誘導することが急務だ。しかしながら、確立された方法は未だなく、この課題の解決が強く求められている。

研究の内容

■全国主要9施設から登録された2432人のSLD症例のデータを用いて実施

本研究は、「組織学的に診断された脂肪性肝疾患のレジストリ研究（注6）（STEALTH study：STEAtotic Liver registry for invesTigating clinical outcomes including HCC）」を基に、全国主要9施設から登録された2432人のSLD症例のデータを用いて実施された。

この中には飲酒習慣のない者だけでなく、中等量飲酒者（MetALDに該当＜注2＞）も含まれている。

この研究では、肝生検後7年以内に肝がんを発症した46人（発がん群）と、7年以上肝がんを発症しなかった639人（非発がん群）を抽出した。さらに、AIモデルの学習が施設ごとの染色法や時期に影響されないよう、肝生検を実施した施設と生検した時期をマッチングさせた58例の肝生検標本デジタル病理画像を256×256ピクセルの小さなタイルに分割して、2万8000枚の画像を生成した。

図1：肝発がん予測AIモデル作成法

これらの画像を用いて深層学習を行い、肝がん発症リスクを推定するAIモデルを構築した（図1）。5分割交差検証法（注7）を用いた検証において、本AIモデルの肝がん発症予想能は、正解率（注8）82.3%、AUC（注9）0.84であり、従来の標準指標である線維化ステージによる肝がん発症予測能（精度 78.2%、AUC 0.81）と同等であった。

また、本研究では近年注目されている説明可能AI (XAI: Explainable AI) (注10)技術の一つである Grad-CAM++ （注11）を用いて、開発されたAIモデルが病理画像のどの部分に注目しているかを分析した。

図2：AIが注目した肝がん発症に関連する病理学的所見

その結果、このAIモデルは、線維化以外にも細胞異型、核細胞質比の上昇、炎症細胞浸潤を肝がん発症高リスクの病理学的特徴として認識し、また大型脂肪滴の沈着を肝がん発症低リスクの病理学的特徴として認識していることが明らかになった（図2）。

これら所見はいずれも発がんに関連する病理学的特徴であり、ヒトの目では見過ごされがちな暗黙知（注12）をAIが明確化したものだ。実際、AIモデルは軽度の線維化症例から発がんした6症例のうち3症例を高リスクと正確に予測していた。

■今後の展望

本研究で構築されたAIモデルにより、肝臓の病理画像からの肝がん発症リスクの高精度な予測が可能となった。

本モデルの活用は、肝がん発症高リスク患者の早期発見を通じた適切なフォローアップを可能とし、将来的な肝がん予防と治療成績の向上への貢献が期待される。

本研究成果は、慢性肝疾患の肝病理組織から発がん予測を行なったものであり、脂肪肝診療における更なる発展をもたらすブレイクスルーになるだけでなく、他疾患への応用も期待されている。

＜論文情報＞
雑誌名／Hepatology
題名／Deep Learning and Digital Pathology Powers Prediction of Hepatocellular Carcinoma Development in Steatotic Liver Disease
著者名／Takuma Nakatsuka, Ryosuke Tateishi（※）, Masaya Sato, Natsuka Hashizume, Ami Kamada, Hiroki Nakano, Yoshinori Kabeya, Sho Yonezawa, Rie Irie, Hanako Tsujikawa, Yoshio Sumida, Masashi Yoneda, Norio Akuta, Takumi Kawaguchi, Hirokazu Takahashi, Yuichiro Eguchi, Yuya Seko, Yoshito Itoh, Eisuke Murakami, Kazuaki Chayama, Makiko Taniai, Katsutoshi Tokushige, Takeshi Okanoue, Michiie Sakamoto, Mitsuhiro Fujishiro, Kazuhiko Koike
（※責任著者）
DOI／10.1097/HEP.0000000000000904
URL／https://journals.lww.com/hep/abstract/9900/deep_learning_and_digital_pathology_powers.884.aspx

＜用語解説＞
（注1）デジタル病理画像
病理組織標本をデジタル形式で撮影またはスキャンして得られる画像のこと。専用のソフトウェアを通じて標本を評価することができる。
（注2）脂肪性肝疾患（Steatotic liver disease：SLD）
肝臓の5%以上に脂肪沈着を来した状態を総称した疾患群。代謝異常と関連するMASLD（代謝異常関連脂肪性肝疾患）、アルコール多飲を原因とするALD（アルコール関連肝疾患）、その中間のMetALDなどに分類される。
（注3）肝線維化
脂肪肝などによって肝臓の障害が長期に継続すると、肝臓の組織は徐々に線維に置き換わって硬くなる。肝臓の線維化が進むほど、発がんなどのリスクが上昇することが知られている。
（注4）細胞異型
細胞診や組織診断において見られる現象で、通常の細胞形態から逸脱した形態を示すことを意味している。しばしばがんや前がん状態、炎症、感染症などの病態に関連しており、病理学的な診断の際に重要な指標の一つとして考慮される。
（注5）核細胞質比
細胞の核と細胞質（核以外の細胞内物質）のサイズ比を指す。健康な細胞では核と細胞質の比率が適切に保たれているが、がん細胞などの異常な細胞では、核細胞質比が高くなることがある。高い核細胞質比は、細胞が異常に増殖し、がん細胞が形成されている可能性を示唆することがある。
（注6）レジストリ研究
特定の疾患や症状、医療処置、または医療介入についての情報を集めるために作成されたデータベースを用いて行われる研究。患者の臨床情報や治療結果などのデータを収集、保管、分析することで、疾患の自然史や治療効果、治療選択肢の比較など、さまざまな健康関連の問題についての知見が得られる。
（注7）5分割交差検証法
学習用データを5つに分割し、4個を訓練データ、1個をテストデータとし、すべての分割データが少なくとも１回はテストデータとして用いられるよう5回検証を行なう。得られた5つの結果を平均することで、より正確な推定値を求める。
（注8）正解率
真の値と予測値との間の一致度。本研究の場合、発がん例または非発がん例を正しく予測できた割合になる。
（注9）AUC
AUCは、Area Under the Curve（曲線下面積）の略で、ROC曲線（Receiver Operating Characteristic Curve）の下側の面積を指し、診断能を単一の数値で要約する。AUCの値は、0から1の範囲にあり、1に近いほど良い性能を示す。
（注10）説明可能AI (XAI: Explainable AI)
従来ブラックボックスとされていたAIによる予測結果や推定結果についての根拠やプロセスを人間が理解できる形で出力することを目指した技術。
（注11） Grad-CAM++
Grad-CAM++（Gradient-weighted Class Activation Mapping）は、画像分類モデルの解釈可能性を向上させるための手法の一つ。モデル内の特徴マップとクラススコアの勾配を使用して、モデルが重要視している領域を可視化する。
（注12）暗黙知
言葉や文字で明確に表現することが難しい、経験や感覚に基づく知識のこと。AIは、こうした人間が無意識のうちに行っている判断や行動のパターンを学習して、可視化・言語化することができる。

構成／清水眞希