論文のタイトル: Machine Learning of Plasma Proteomics Classifies Diagnosis of Interstitial Lung Disease
著者: Yong Huang, et al
出版年: 2024
ジャーナル: American Journal of Respiratory and Critical Care Medicine
PMID: 38422478
機械学習と血漿プロテオミクスを組み合わせた新たなアプローチを用いることで、膠原病に伴う間質性肺疾患と特発性肺線維症を鑑別でき、免疫に関与するタンパクが同定されました。
概要
膠原病に伴う間質性肺疾患(CTD-ILD)と特発性肺線維症(IPF)の区別は臨床的に重要である。この研究の目的は、CTD-ILDとIPF患者を分離し分類するためのタンパクを特定することである。
方法:1247人のIPF患者と352人のCTD-ILD患者が含まれる4つのレジストリーを用いた。血漿サンプルにハイスループットプロテオミクスアッセイを用いた。タンパクの特徴は、プロテオミクス分類子を構築するために再帰的特徴消去(RFE)を使用した。Support Vector Machine、LASSO回帰、ランダムフォレスト(RF)、および不均衡RFを含む複数の機械学習モデルが、独立したコホートで訓練およびテストされた。検証されたモデルは、外部データセットで各ケースを反復的に分類するために使用された。
結果:気管支の発達、平滑筋の増殖、および免疫応答の生物学的プロセスに37のタンパク(PC37)が同定された。4つの機械学習モデルは、PC37を性別および年齢スコアとともに使用して、連続的な分類値を生成した。これらのスコアのROC曲線は、テストコホートで一貫してAUC 0.85-0.90を、単一サンプルデータセットでAUC 0.94-0.96を示した。二値分類は、テストコホートで感度78.6%~80.4%、特異度76%~84.4%、単一サンプル分類データセットで感度93.5%~96.1%、特異度69.5%~77.6%を示した。すべての機械学習モデルの複合分析により、テストコホートでは78.2%(194/248)の精度、単一サンプル分類データセットでは82.9%(208/251)の精度が確認された。
結論:大規模なコホートのプロテオミクスデータセットで学習した複数の機械学習モデルは、一貫してCTD-ILDとIPFを鑑別した。免疫経路に関与するタンパクが同定された。さらに、単一サンプルの分類のための新しいアプローチを開発し、困難な症例におけるILDの鑑別診断を洗練し、臨床的意思決定を改善することができた。