banner
뉴스 센터
매력적인 디자인

교육자료 표현을 위한 피부톤 분석(STAR)

Jun 30, 2023

npj 디지털 의학 6권, 기사 번호: 151(2023) 이 기사 인용

640 액세스

26 알트메트릭

측정항목 세부정보

어두운 피부색을 묘사하는 이미지는 주치의와 피부과 전문의에게 피부 질환을 인식하도록 가르치는 데 사용되는 교육 자료에서 상당히 과소평가됩니다. 이는 다양한 인종 그룹에 걸쳐 피부병 진단의 불균형에 기여할 수 있습니다. 이전에는 도메인 전문가가 교과서를 수동으로 평가하여 피부 이미지의 다양성을 추정했습니다. 수동 평가는 많은 교육 자료로 확장되지 않으며 인적 오류가 발생합니다. 이 프로세스를 자동화하기 위해 우리는 기계 학습을 사용하여 의학 교육 자료의 피부 톤 표현을 평가하는 교육 자료 표현을 위한 피부 톤 분석(STAR-ED) 프레임워크를 제시합니다. 문서(예: .pdf의 교과서)가 주어지면 STAR-ED는 콘텐츠 구문 분석을 적용하여 구조화된 형식의 텍스트, 이미지 및 테이블 엔터티를 추출합니다. 다음으로, 피부가 포함된 이미지를 식별하고 해당 이미지에서 피부가 포함된 부분을 분할한 후 기계 학습을 사용하여 피부 톤을 추정합니다. STAR-ED는 Fitzpatrick17k 데이터 세트를 사용하여 개발되었습니다. 그런 다음 일반적으로 사용되는 4개의 의학 교과서에서 STAR-ED를 외부적으로 테스트했습니다. 결과는 피부 이미지 감지(0.96 ± 0.02 AUROC 및 0.90 ± 0.06 F1 점수) 및 피부 톤 분류(0.87 ± 0.01 AUROC 및 0.91 ± 0.00 F1 점수)에서 강력한 성능을 보여줍니다. STAR-ED는 4개의 의학 교과서에 나오는 피부 톤의 불균형한 표현을 정량화합니다. 갈색 및 검은색 피부 톤(Fitzpatrick V-VI) 이미지는 전체 피부 이미지의 10.5%에 불과합니다. 우리는 이 기술을 의료 교육자, 출판사 및 실무자가 교육 자료에서 피부색의 다양성을 평가할 수 있는 도구로 활용하기를 희망합니다.

주요 의과대학의 커리큘럼에 사용되는 의학 교과서, 강의 노트 및 출판된 기사에는 피부 질환의 징후를 입증하는 데 사용되는 이미지의 피부 톤이 적절하게 표현되지 않습니다1,2,3. 예를 들어, 일반적으로 사용되는 의학 교과서에 대한 최근 수동 평가에서는 갈색과 검은색 피부 톤을 나타내는 Fitzpatrick 피부 톤(FST) V 및 VI가 상당히 과소표시된 것으로 나타났습니다1,2. 코로나19 팬데믹은 이러한 불평등을 더욱 부각시켰습니다. 공개된 코로나19 피부 발현 사진에 수동으로 주석을 추가한 결과 어두운 피부를 묘사하는 이미지가 과소표현된 것으로 드러났습니다4.

피부질환은 피부톤에 따라 다르게 나타나므로, 잘 훈련된 의료 인력을 위해서는 다양한 피부톤을 묘사하는 교육 자료가 필요합니다1,2,3,4,5. Louie와 Wilkes는 의료 분야(접근성, 제공 및 품질)의 인종적 불평등이 커리큘럼 자료의 다양성 부족에 영향을 받는다고 제안합니다1. 예를 들어, 유색 인종 환자의 경우 피부암 진단(예: 흑색종, 편평 세포 암종)이 상당히 지연되어 이병률과 사망률이 증가합니다6.

피부과 관련 학술 자료(저널 및 교과서)에 대한 이전 분석에서는 FST V 및 VI가 과소 대표되는 것으로 나타났습니다. 그러나 이미지에 주석을 달고 수동으로 분석했습니다. 즉, 도메인 전문가가 각 이미지를 교과서/저널에 배치하고 피부색에 라벨을 붙였습니다. 불행하게도 이 수동 접근 방식은 노동 집약적 특성, 운영자 시각적 피로 및 피부 톤 라벨링의 관찰자 간 오류로 인해 대규모 코퍼스에 대해 다루기 어렵습니다. 기계 학습(ML)을 사용한 자동 피부색 표현 평가는 의료 교육 자료의 편견을 식별하는 데 큰 도움이 되며 이전에는 교육 자료에서 수행되지 않았습니다.

피부과의 피부 톤 분석에 대한 기계 학습 기반 접근 방식은 이전에 선별된 데이터 세트(예: ISIC 20187 및 SD-1988)에만 적용되었으며 실제 학술 자료에는 적용되지 않았습니다. 이전 접근 방식 중 하나는 픽셀 강도 값9,10,11에서 계산된 개별 유형 각도(ITA)를 사용했습니다. 그런 다음 ITA 값이 FST12에 매핑되었습니다. 그러나 이전에는 피부 이미지에서 FST를 직접 분류하도록 훈련된 기계 학습 모델이 FST13으로 변환한 ITA 기반 추정보다 FST 분류에서 더 나은 성능을 보였습니다. ITA 기반 방법은 원시 픽셀 값에 의존하므로 조명 조건에 더 민감합니다. 이러한 이전 모델은 피부과에서 기계 학습 모델을 개발하는 데 사용된 선별된 피부 이미지 데이터 세트가 어두운 피부 톤을 상당히 과소 표현한다는 것을 식별했습니다.

0.9 AUROC) is achieved between the classifiers across the four textbooks confirming the robustness of the framework. Specifically, XGB classifier results in an average AUROC of 0.96 ± 0.02 and F1 score of 0.90 ± 0.06 F1 across the textbooks. To summarize, skin image detection could be done satisfactorily using traditional machine learning classifiers (without sophisticated deep networks). XGB was used for the final STAR-ED pipeline due to its slightly better performance, particularly in its AUROC, which, unlike accuracy, is independent of single prediction thresholds./p>