양의 체중 예측을 위한 인공지능 알고리즘 비교 및 순위
Scientific Reports 13권, 기사 번호: 13242(2023) 이 기사 인용
384 액세스
3 알트메트릭
측정항목 세부정보
빠르게 변화하는 세상에서 농장 데이터는 기하급수적으로 증가하고 있습니다. 이 데이터의 중요성을 인식한 연구자들은 이 데이터를 분석하고 농업 예측을 할 수 있는 새로운 솔루션을 찾고 있습니다. 빅데이터를 처리할 수 있는 능력을 갖춘 인공지능(AI)이 급속히 대중화되고 있다. 또한 비선형, 잡음이 있는 데이터도 처리할 수 있으며 기존 데이터 분석에 필요한 조건에 의해 제한되지 않습니다. 따라서 이 연구는 가장 널리 사용되는 기계 학습(ML) 알고리즘을 비교하고 11년에 걸친 양 농장 데이터에 대한 예측 능력에 따라 순위를 매기기 위해 수행되었습니다. 분석 전에 데이터를 정리하고 준비했습니다. 이상값 제거를 위해 Winsorization이 수행되었습니다. 주성분 분석(PCA)과 특징 선택(FS)을 수행하고 이를 기반으로 세 가지 데이터 세트가 생성되었습니다. PCA(PCA만 사용됨), PCA+ FS(두 기술 모두 차원 축소에 사용됨) 및 FS(특징 선택만 사용됨) 체중 예측. 평가된 11개의 ML 알고리즘 중 MARS 알고리즘, 베이지안 능선 회귀, 능선 회귀, Support Vector Machines, Gradient Boosting 알고리즘, Random Forest, XgBoost 알고리즘, 인공 신경망, 분류 및 회귀 트리에 대한 실제 값과 예측 값 간의 상관 관계, 다항식 회귀, K 최근접 이웃 및 유전자 알고리즘은 체중에 대해 각각 0.993, 0.992, 0.991, 0.991, 0.991, 0.99, 0.99, 0.984, 0.984, 0.957, 0.949, 0.734였습니다. 체중 예측을 위한 상위 5개 알고리즘은 MARS, 베이지안 능선 회귀, 능선 회귀, Support Vector Machines 및 Gradient Boosting 알고리즘이었습니다. 본 연구에서는 양의 체중 예측을 위해 총 12개의 기계 학습 모델이 개발되었습니다. 기계 학습 기술은 합리적인 정확도로 예측을 수행할 수 있으므로 추론을 도출하고 농장의 경제적 번영, 성과 개선 및 그에 따른 식량 안보에 대한 미래 예측을 하는 데 도움이 될 수 있다고 말할 수 있습니다.
2050년까지 세계 인구는 99억 명으로 증가할 것으로 예상되며, 다양한 육류 및 동물성 제품에 대한 전 세계 수요는 향후 수십 년 동안 70% 이상 증가할 것으로 예상됩니다1. 따라서 2050년까지 거의 동일한 토지, 동일한 자원을 사용하면서 생산을 강화하여 식량 생산량을 늘려야 할 필요성이 절실합니다. 이는 제한된 토지, 물 및 기타 모든 천연 자원을 사용하여 더 많은 동물을 생산해야 하기 때문에 축산 부문에도 압력을 가하고 있습니다. 이는 우리가 더 많은 식량을 생산하기 위한 새롭고 혁신적인 접근법을 찾아야 한다는 것을 의미하며, 이는 막대한 유전적 부에도 불구하고 동물 과학자들에게 큰 도전입니다2,3. 이를 해결하기 위해 전통 기술에서 첨단 기술로 진화하는 동물 농장에 새로운 기술이 채택되고 있습니다4. 농업 운영은 이제 점점 더 자동화되고 있으며 농장 관리의 모든 측면에서 센서의 사용이 증가하고 있습니다. 이는 고역과 노동력을 줄일 뿐만 아니라 매일 생성되는 데이터 양의 기하급수적인 증가로 이어집니다. 이 모든 것이 농장 데이터의 기하급수적인 증가로 이어집니다. 전통적인 방법과 전통적인 전략은 이 엄청난 데이터를 따라잡을 수 없기 때문에 특히 개발도상국에서 생산 감소 추세를 보이고 있습니다5,6,7,8,9,10.
인공지능은 모든 산업을 크게 변화시키고 있으며 축산 및 수의학의 분석 문제에 대한 솔루션을 제공합니다11. 이는 사망률을 줄이고 생산성을 향상시키는 데 중요한 농장 관리의 여러 측면을 입증하는 데 도움이 될 것입니다12. ML 기술은 기존 기술에는 없는 기능을 보유하고 있기 때문에 데이터를 효율적으로 처리할 수 있을 뿐만 아니라 지금까지 알려지지 않았던 추론도 도출할 수 있습니다. 이러한 방법의 모델링 허용 오차는 통계적 방법론보다 상당히 높습니다. ML에는 가정이나 가설 테스트에 대한 요구 사항이 없기 때문입니다. 또한 ML은 비선형, 부정확, 잡음이 있는 데이터를 처리하는 기능과 같은 이점을 제공합니다. 이 모든 것이 이 과학 분야를 기존 통계 모델보다 훨씬 더 유연하게 만듭니다.