眠っている間に体はさまざまな「メッセージ」を発しており、それを読み取ることで将来の重大な病気のリスクを予測できる可能性のあることが、新たな研究で示された。「SleepFM」と呼ばれる人工知能(AI)を用いた実験的な睡眠基盤モデルは、ポリソムノグラフィー(PSG)データを用いて、約130種類の疾患・健康状態の将来のリスクを予測できるという。米スタンフォード大学医学部生物医学データサイエンス分野のJames Zou氏らによるこの研究の詳細は、「Nature Medicine」に1月6日掲載された。研究グループは、「SleepFMは、がん、妊娠合併症、心疾患、精神疾患など、非常に幅広い疾患の予測において高い性能を示した。また、全死亡リスクの予測も可能だった」と述べている。 PSGは睡眠解析で用いられる検査であり、睡眠中の人の脳波(EEG)、心電図(ECG)、心拍、眼球運動などを測定する。PSGは、多様な生理学的信号を取得できる一方で、標準化や汎用性の確保、また複数の生理学的信号を統合する難しさから十分に活用されてこなかった。 今回、この課題を克服するために研究グループは、PSGを構成する生理学的信号のうちの1つを意図的に隠し、隠された信号と整合する情報を残りの信号から推測するように訓練するleave-one-out contrastive learningと呼ばれる新たな学習方法を開発した。SleepFMは、睡眠センターでPSG検査を受けた約6万5,000人の合計58万5,000時間以上に及ぶ睡眠データを用いて訓練された。睡眠データは5秒単位に分割されている。これは、ChatGPTなどの大規模言語モデルの学習に用いられる「単語」に相当する単位である。Zou氏は、「SleepFMは、本質的には『睡眠の言語』を学習していると言える」とニュースリリースで述べている。また同氏は、「この研究における技術的進歩の一つは、全ての異なるデータ様式を調和させ、それらが一緒になって同じ言語を学習できるようにする方法を見つけ出したことだ」と説明している。 モデルの調整後、研究グループはまず、睡眠段階(レム睡眠、ノンレム睡眠など)の分類や睡眠時無呼吸の重症度診断を実施した。その結果、SleepFMは、現行の最先端モデルと同等以上の性能を示した。そこで、2〜96歳の患者3万5,052人を最長で25年間追跡したスタンフォード睡眠医学センターの長期データを用いて、睡眠データと健康リスクとの関連を解析した。予測性能の評価には、C統計量と呼ばれる指標が用いられた。C統計量は、0.8以上であれば高い予測精度を持つとされる。 電子カルテ内に記録されていた1,000以上の疾患カテゴリーを解析した結果、130種類の疾患・健康アウトカムについては、PSGデータから妥当な精度で予測可能であることが判明した。特に予測精度が高かった疾患は、パーキンソン病(C統計量0.89)、認知症(同0.85)、高血圧性心疾患(同0.84)、心筋梗塞(同0.81)、前立腺がん(同0.89)、乳がん(同0.87)、死亡(同0.84)であった。 こうした結果を受けてZou氏は、「これほど多様な疾患について、モデルが有用な予測を行えることは、私たちにとっても嬉しい驚きだった」と述べている。 研究グループは、「本研究では、心疾患の予測においては心臓の信号が、精神疾患の予測においては脳信号がより重要な要素であった。その一方で、最も正確な予測を達成したのは、全てのデータ様式を組み合わせた場合であった」と指摘。論文の責任著者の1人であるスタンフォード大学クレイグ・レイノルズ睡眠医学教授のEmmanuel Mignot氏は、「疾患予測において最も多くの情報が得られたのは、異なるチャネルを対比させたときだった。例えば、脳は眠っているように見えるのに、心臓は起きているように見えるなどの同期の乱れは、健康上の問題を示唆している可能性がある」と述べている。 研究グループは現在、ウェアラブルデバイスなどの他のデバイスからのデータを追加することで、SleepFMの予測性能をさらに高める方法を模索している。また、SleepFMが実際にどのような特徴に注目して予測を行っているのかを解明する研究も進めている。(HealthDay News 2026年1月7日) https://www.healthday.com/health-news/sleep-disorder/sleep-lab-data-can-predict-illnesses-years-earlier-study-finds Copyright © 2026 HealthDay. All rights reserved.Photo Credit: Ekaterina/Adobe Stock