외상성 부상 환자의 병원 사망률 예측: 다양한 SMOTE 비교
BMC 의학 연구 방법론 23권, 기사 번호: 101(2023) 이 기사 인용
1026 액세스
1 인용
1 알트메트릭
측정항목 세부정보
외상은 전 세계적으로 가장 중요한 공중 보건 문제 중 하나이며 사망과 장애로 이어지고 모든 연령층에 영향을 미칩니다. 따라서 중환자실에 입원한 외상 환자의 사망률을 예측하는 모델에 큰 관심이 있습니다. 본 연구의 주요 목적은 불균형한 데이터를 사용하여 외상 환자의 병원 사망률을 예측하기 위한 SMOTE 기반 기계 학습 도구를 개발하고 평가하는 것입니다.
이번 후향적 코호트 연구는 2020년 3월부터 2021년 3월까지 이란 서부 하마단 주 베사트 병원 중환자실에 입원한 외상 환자 126명을 대상으로 실시됐다. 데이터는 환자의 의료정보 기록에서 추출됐다. 데이터의 불균형 특성에 따라 SMOTE 기술, 즉 SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, SMOTE-NC 및 SVM-SMOTE가 1차 전처리에 사용되었습니다. 이후 DT(Decision Tree), RF(Random Forest), NB(Naive Bayes), ANN(Artificial Neural Network), SVM(Support Vector Machine), XGBoost(Extreme Gradient Boosting) 방법을 사용하여 환자의 병원을 예측했다. 외상으로 인한 사망. 사용된 방법의 성능은 민감도, 특이도, PPV(Positive Predictive Value), NPV(Negative Predictive Value), 정확도, AUC(Area Under the Curve), 기하 평균(G-means), F1 점수 및 P로 평가되었습니다. -McNemar의 테스트 값.
중환자실에 입원한 환자 126명 중 117명(92.9%)이 생존하고 9명(7.1%)이 사망했다. 외상 날짜부터 결과 날짜까지 평균 추적 기간은 3.98 ± 4.65일이었습니다. ML 알고리즘의 성능은 불균형 데이터에서는 좋지 않은 반면, SMOTE 기반 ML 알고리즘의 성능은 크게 향상됩니다. 모든 SMOTE 기반 모델의 ROC 곡선 아래 평균 면적(AUC)은 91% 이상이었습니다. 데이터세트 균형을 조정하기 전 F1 점수와 G 평균은 ANN을 제외한 모든 ML 모델에서 70% 미만이었습니다. 대조적으로 균형 잡힌 데이터세트의 F1 점수와 G 평균은 모든 SMOTE 기반 모델에서 90% 이상에 도달했습니다. 모든 SMOTE 기반 ML 방법 중에서 SMOTE 기반의 RF 및 ANN과 SMOTE-NC 기반의 XGBoost가 모든 평가 기준에서 가장 높은 값을 달성했습니다.
이 연구는 SMOTE 기반 ML 알고리즘이 ML 알고리즘보다 외상성 부상의 결과를 더 잘 예측한다는 것을 보여주었습니다. 이는 ICU 의사가 임상 결정을 내리는 데 도움을 줄 수 있는 잠재력을 가지고 있습니다.
동료 검토 보고서
외상은 사망과 장애로 이어지고 모든 연령층에 영향을 미치는 세계에서 가장 중요한 공중 보건 문제 중 하나입니다[1]. 외상성 부상은 인생의 첫 40년 동안 사망의 주요 원인입니다[2]. 외상으로 인해 매년 440만 명이 사망하고 전 세계 사망자의 거의 8%를 차지합니다[1, 3]. 이러한 점에서 외상으로 인한 영향과 외상으로 인한 사망자 수를 줄이기 위한 해결책을 찾는 것이 중요합니다. 예를 들어, 높은 정확도로 외상 환자의 결과를 예측하는 능력을 향상시키고 환자의 결과에 영향을 미치는 중요한 요인을 식별하는 것은 외상 환자를 치료하기 위한 의료 외상 팀의 신속한 노력에 도움이 될 수 있습니다.
이전의 많은 연구에서는 외상성 부상에 영향을 미치는 요인을 식별하기 위해 로지스틱 및 포아송 회귀 모델과 같은 전통적인 방법을 사용했습니다[4,5,6]. 수많은 연구에서는 TRISS(Trauma and Injury Severity Score)를 가장 일반적인 모델 중 하나로 사용했습니다. 이 모델은 로지스틱 회귀(LR)를 기반으로 하며 단일 센터의 소규모 코호트를 사용하여 외상 환자의 생존 확률을 예측합니다. 부상 [7]. 그러나 TRISS와 그 다양한 변형은 증거 기반 도구이며 일부 연구 결과에 따르면 환자의 상태를 잘못 분류하여 의사를 오도할 수 있음이 나타납니다[8]. 그럼에도 불구하고, 공선성, 이분산성, 고차 상호작용 및 변수 간 비선형 관계가 존재하는 경우 두 모델 범주 모두 제대로 수행되지 않았습니다[9,10,11]. 따라서 더 나은 환자 결과를 달성하고 자원을 최대한 활용하려면 이러한 가정에 국한되지 않는 보다 가치 있고 정확한 예측 도구가 필요합니다.