UCI를 통한 심혈관계 심장질환 예측을 기반으로 한 능동학습기법
Scientific Reports 13권, 기사 번호: 13588(2023) 이 기사 인용
412 액세스
5 알트메트릭
측정항목 세부정보
심장병은 전 세계적으로 사망의 중요한 원인이며 임상 데이터 분석을 통해 이를 예측하는 것은 어려운 일입니다. 머신러닝(ML)은 의료 데이터를 분석하여 심장병을 진단하고 예측하는 귀중한 도구로 부상했습니다. 이전 연구에서는 심장병 예측을 위한 의학 연구에 ML 기술을 광범위하게 사용했습니다. 본 연구에서는 심장병 예측의 정확성을 높이는 중요한 특징을 식별하기 위해 8개의 ML 분류기를 활용했습니다. 예측 모델을 개발하기 위해 다양한 기능 조합과 잘 알려진 분류 알고리즘이 사용되었습니다. Naïve Bayes 및 Radial Basis Functions와 같은 신경망 모델이 구현되어 심장 질환 예측에서 각각 94.78% 및 90.78%의 정확도를 달성했습니다. 심혈관 문제 예측을 위한 최신 방법 중 학습 벡터 양자화(Learning Vector Quantization)가 98.7%로 가장 높은 정확도를 보였다. 심혈관성 심장병을 예측하는 동기는 생명을 구하고 건강 결과를 개선하며 의료 자원을 효율적으로 할당할 수 있는 잠재력에 있습니다. 주요 기여에는 조기 개입, 맞춤형 의학, 기술 발전, 공중 보건에 대한 영향, 지속적인 연구 등이 포함되며, 이 모두는 개별 환자와 사회 전체에 대한 CHD의 부담을 줄이기 위해 공동으로 노력합니다.
의료 산업은 환자, 질병, 진단에 대한 많은 데이터를 생성하지만 원하는 결과를 생성하는 데 올바르게 사용되지 않습니다. 심장병과 뇌졸중은 주요 사망 원인 중 두 가지입니다. WHO 보고서에 따르면 심혈관 질환으로 인해 매년 1,780만 명 이상의 사람들이 직접 사망하고 있습니다. 분석이 충분하지 않기 때문에 헬스케어 산업의 막대한 양의 환자, 질병, 진단 데이터는 환자가 기대하는 건강에 영향을 미치지 않습니다1. 심장 및 혈관 질환(CVD)에는 관상동맥 질환, 심근염, 혈관 질환 및 기타 질환이 포함됩니다. 뇌졸중과 심장병으로 인해 CVD로 사망하는 전체 사람의 80%가 사망합니다. 사망하는 전체 사람의 4분의 3은 70세 미만입니다. 심혈관 질환의 위험을 높이는 주요 요소는 성별, 흡연, 나이, 가족력, 열악한 식습관, 지질, 신체 활동 부족, 고혈압입니다. , 체중 증가, 음주2. 고혈압과 당뇨병은 유전될 수 있고 심혈관 질환에 걸릴 확률을 높이는 두 가지 예입니다. 위험을 높이는 다른 요인으로는 활동하지 않음, 과체중, 잘 먹지 않음, 등, 목, 어깨 통증, 매우 피곤함, 빠른 심장 박동 등이 있습니다. 대부분의 사람들은 가슴 통증, 어깨 통증, 팔 통증, 숨가쁨, 전반적인 허약감을 경험합니다. 오랫동안 그래왔듯이 흉통은 심장에 충분한 혈액이 공급되지 않는다는 가장 흔한 징후입니다3. 이런 가슴통증을 의학에서는 협심증이라고 합니다. X-레이, 자기공명영상(MRI), 혈관 조영술과 같은 일부 검사는 무엇이 잘못되었는지 파악하는 데 도움이 될 수 있습니다. 반면에 중요한 의료 장비에 쉽게 접근할 수 없는 경우도 있어 응급 상황에서 할 수 있는 일이 제한됩니다. 심장에 어떤 문제가 있는지 파악하고 치료하려면 매 순간이 중요합니다4. 심장병 진단은 그다지 좋지 않으며 심혈관 시스템 재설계 및 환자 결과에 대한 더 나은 빅 데이터 분석이 크게 필요합니다. 그러나 데이터의 노이즈, 불완전성 및 불규칙성으로 인해 명확하고 정확하며 근거가 충분한 결론을 도출하기가 어렵습니다. 최근 빅데이터, 정보 저장 및 검색과 같은 기술의 발전으로 인해 컴퓨터화된 지능은 심장학에서 중요한 역할을 합니다. 다양한 ML 모델로 채굴된 데이터에서 결론을 도출하기 위해 연구원들은 전처리 기술5을 사용했습니다. 유전성 심장 질환과 건강한 조절을 추적하는 데 사용되는 일반적인 알고리즘 세트와 그 변형을 사용하면 심부전의 첫 번째 단계가 언제 시작되는지 예측할 수 있습니다. 분류 기술, DT, SVC, LR 및 RF 기계는 심정지 예측에 사용할 수 있는 모든 유형의 알고리즘입니다. 기계 학습에 관해 생각하는 세 가지 주요 방법이 있습니다. 기계 학습의 세 가지 주요 유형은 작업 중심 지도 ML(분류/회귀), 데이터 중심 비지도 ML(클러스터링) 및 오류 중심 강화 학습( RL). 관상동맥질환은 심장 근육에 혈액을 공급하는 주요 혈관에 발생하는 매우 흔한 질병입니다. 지질단백질로 구성된 플라크는 심장 동맥에 축적되어 관상동맥 질환을 유발할 수 있습니다. 죽상동맥경화증은 이러한 플라크가 쌓이는 것을 일컫는 이름입니다6. 죽상동맥경화증은 정맥을 통해 흉부 및 기타 기관으로 가는 혈액의 흐름을 느리게 합니다. 심장병, 협심증, 뇌졸중이 있으면 올라갑니다. 남성과 여성은 관상동맥질환의 경고 징후와 증상이 다를 수 있습니다. 예를 들어, 남성은 여성보다 가슴 통증을 경험할 가능성이 더 높습니다. 가슴 통증 외에도 여성은 숨가쁨, 메스꺼움, 갑작스러운 피로를 경험할 가능성이 더 높습니다. 심부전, 흉부 압박감, 흉부 압박, 흉통은 모두 관상동맥 질환의 징후일 수 있습니다7. 심장병 예측 시스템은 의사 결정을 돕기 위해 Naive Bayesian 분류 기술을 통합합니다. 과거 심장병 사례에 대한 방대한 데이터베이스를 분석함으로써 시스템은 귀중한 통찰력을 찾아냅니다. 이 모델은 심장병 위험이 있는 환자를 식별하는 데 매우 효율적입니다. 복잡한 쿼리에 응답하는 능력을 보유하고 있으며 해석 가능성, 포괄적인 정보에 대한 접근 및 정확성 측면에서 강점을 보여줍니다8. 정확하고 시의적절한 결정을 내리는 것은 의료 분야, 특히 환자를 치료할 때 매우 중요합니다. 머신러닝(ML) 기술은 의료 산업에서 생성된 광범위한 데이터를 활용하여 질병을 예측하는 데 중요한 역할을 합니다. 인도에서는 심장병이 사망의 주요 원인이며, 세계보건기구(WHO)는 뇌졸중을 예측하고 예방하기 위해 시기적절한 개입의 중요성을 강조합니다. 본 논문에서는 위험 요인과 함께 Decision Tree, Naive Bayes 등의 ML 기법을 활용하여 향상된 정확도로 심혈관 질환을 예측하는 데 중점을 둡니다. 본 연구에 활용된 데이터 세트는 13가지 속성9으로 구성된 심부전 데이터 세트입니다. 저자는 SVM(Support Vector Machine)과 Naive Bayes라는 두 가지 알고리즘이 심장병 발병 및 환자의 생존 상태를 예측하는 데 얼마나 잘 수행되는지 조사했습니다. 알고리즘은 캘리포니아 대학 어바인 기계 학습 및 지능형 시스템 센터의 16개 속성이 포함된 데이터세트에 적용되었습니다. 모델 성능을 평가하기 위해 혼동 행렬을 사용하여 정확도, 재현율, 정밀도 및 오류와 같은 지표를 시각화했습니다. 또한 모델의 정확성을 입증하기 위해 ROC(수신기 작동 특성) 곡선을 활용하고 곡선 아래 면적을 계산하여 통계 분석을 수행했습니다10. 본 연구 논문에서는 방사형 기저 함수 신경망을 사용하여 8가지 유형의 심장 부정맥을 정확하게 예측하는 시스템을 소개합니다. 연구의 주요 초점은 심박수 시계열 데이터의 분석이며, 제안된 알고리즘은 좌각차단, 심방세동, 정상동리듬, 우각차단, 동서맥, 심방 등 특정 부정맥을 예측하도록 특별히 설계되었습니다. 조동, 조기 심실 수축 및 2도 차단. 연구에 활용된 심박수 시계열 데이터는 MIT-BIH 부정맥 데이터베이스에서 가져온 것입니다. 선형 및 비선형 특징 모두 각 개별 부정맥의 심박수 시계열에서 추출됩니다. 방사형 기저 함수 신경망(RBFN)의 훈련은 특징 데이터 세트의 70%를 사용하여 수행되고 나머지 30%는 8가지 심장 질환의 발생을 예측하는 데 사용됩니다. 제안된 접근 방식은 문헌에 문서화된 기존 방법의 성능을 능가하는 96.33%의 인상적인 전체 예측 정확도를 보여줍니다. 임상 데이터베이스를 사용하여 심장병을 분류하기 위해 방사형 기준 분류(Radial Basis Classification)라는 새로운 방법이 도입되었습니다. 여러 속성을 포함하는 기존 분류기는 매개변수 수가 많아 이상적인 속성을 결정하기 어려운 경향이 있습니다. 이 문제를 해결하기 위해 보다 응집력 있는 확률적 추세를 장려하고 오류나 예상치 못한 결과의 가능성을 최소화하는 것을 목표로 하는 다변량 함수 분류기 아이디어의 개념이 제안되었습니다. 이 공식은 다차원 데이터를 정렬하고 분석 단계에서 그룹화의 정확성을 높이는 데 유용한 것으로 입증되었습니다. 연구 결과는 제안된 계산 방법이 이전 접근 방식에 비해 더 높은 정밀도를 제공한다는 것을 나타냅니다12. 역전파 신경망은 정확도 예측에서 만족스러운 성능을 보여주었습니다. 그러나 정확도를 더욱 높이고 특정 유형의 심장병을 결정하기 위해 이 논문에서는 CBR 기술을 ANN과 통합합니다. 과거 환자 기록을 활용하여 97%에 달하는 정확도 수준을 달성했습니다. 본 연구에서는 CBR을 활용하여 정확도를 높일 뿐만 아니라 심장질환의 종류를 예측하는데도 활용하고 있습니다. CBR 출력에는 확인된 심장 질환 유형과 권장 약물이 모두 포함됩니다. 이를 통해 원래의 약물과 RBF(Radial Basis Function)에서 제안한 약물을 비교할 수 있습니다. 이 접근법을 사용하여 처방된 약물은 98%13의 비교 정확도를 나타냅니다. 증상으로는 호흡 곤란, 등 위쪽, 목, 턱 또는 목의 통증, 사지의 통증, 무감각, 쇠약 또는 오한이 있습니다. 신체 특정 부위의 혈관이 좁아지기 때문에 관상동맥질환이 있어도 심장마비, 협심증, 뇌졸중, 심부전이 발생하기 전까지는 그 사실을 알지 못할 수도 있습니다. 심장 문제의 징후를 주의깊게 살펴보고, 걱정이 된다면 의사와 상담하세요. 자주 검진을 받으면 심장(심장혈관) 질환을 더 일찍 발견할 수도 있습니다14. 제안된 방법은 감독된 ML 분류기를 사용하여 다양한 모델이 어떻게 심혈관 질환의 존재를 예측할 수 있는지 보여주고 랜덤 포레스트, 의사 결정 트리, 지원 벡터 머신, XGBoost, 방사형 기저 함수, k-최근접 이웃과 같은 분류기의 성능을 평가합니다. , 순진한 베이 및 벡터 양자화 학습.