ارزیابی و مقایسه مدل‌های یادگیری ماشین و یادگیری عمیق در پیش‌بینی خطر وقوع زمین‌لغزش

جلیلیان, شادی; شتایی جویباری, شعبان; معیری, محمدهادی; سعدالدین, امیر

doi:10.22092/ijwmse.2025.369812.2119

مقالات آماده انتشار

نوع مقاله : مقاله پژوهشی

نویسندگان

¹ گروه جنگلداری دانشگاه علوم کشاورزی و منابع طبیعی گرگان

² دانشگاه علوم کشاورزی و منابع طبیعی گرگان

³ گروه جنگلداری، دانشگاه علوم کشاورزی و منابع طبیعی گرگان

⁴ گروه مدیریت آبخیر، دانشگاه علوم کشاورزی و منابع طبیعی گرگان

10.22092/ijwmse.2025.369812.2119

چکیده

زمین‌لغزش‌ها به‌عنوان یکی از مخرب‌ترین پدیده‌های طبیعی، سالانه موجب وارد آمدن تلفات انسانی و خسارات مالی قابل‌توجهی می‌گردند. هدف از این پژوهش، ارزیابی مقایسه ای عملکرد الگوریتم های یادگیری ماشین جنگل تصادفی (RF) و ماشین‌بردارپشتیبان (SVM) و الگوریتم های یادگیری عمیق شبکه عصبی پیچشی (CNN) و شبکه عصبی بازگشتی (RNN) در مدل‌سازی خطر وقوع زمین‌لغزش حوزه آبخیز جنگلی 85 در بخشی از استان گلستان بود. براساس مطالعات قبلی برای مدل‌سازی، لایه‌های 10 عامل تأثیرگذار محیطی و انسانی شامل ارتفاع، شیب، جهت شیب، شاخص نمناکی توپوگرافی (TWI)، شاخص تفاضل نرمال ‌شده پوشش گیاهی (NDVI)، کاربری اراضی، فاصله از جاده، فاصله از رودخانه، فاصله از گسل و بارندگی تعیین و تهیه شد. از مجموع 494 نقاط لغزشی و غیر لغزشی، 70 درصد برای مرحله آموزشی و 30 درصد برای مرحله اعتبارسنجی استفاده شد. از محیط نرم‌افزار ArcGIS و زبان برنامه‌نویسی پایتون برای اجرای الگوریتم‌های یادگیری ماشین (ML) و یادگیری عمیق (DL) استفاده شد. ارزیابی عملکرد الگوریتم های موردبررسی با استفاده از شاخص مساحت زیر منحنی مشخصه‌ی عامل گیرنده ROC ص.رت گرفت. در این پژوهش، عملکرد چهار الگوریتم یادگیری ماشین و عمیق در پهنه‌بندی حساسیت زمین‌لغزش در حوزه آبخیز جنگلی ۸۵ استان گلستان مورد ارزیابی قرار گرفت. نتایج نشان داد که الگوریتم یادگیری عمیق CNN با کسب امتیاز AUC برابر 910/0، صحت کلی 72/87% و ضریب کاپای 899/0 برای طبقات پرخطر (خطرناک و خیلی خطرناک) به‌عنوان کارآمدترین مدل شناسایی شد. تحلیل اهمیت متغیرها با استفاده از مدل برتر (CNN) نشان داد که عوامل فاصله از گسل و فاصله از رودخانه به ترتیب دارای بیش‌ترین اهمیت در وقوع زمین‌لغزش در منطقه موردمطالعه هستند. این یافته کاملاً با انتظارات زمین‌شناختی و ژئومورفولوژیکی منطقه همخوانی دارد. نقشه نهایی حساسیت زمین‌لغزش تولیدشده توسط مدل CNN نشان داد که 46/31 درصد از مساحت حوزه (معادل تقریباً12360 هکتار) در طبقه خطر خیلی زیاد قرار دارد.نتایج این تحقیق در شناسایی مناطق پرخطر و تعیین عوامل مؤثر بر رخداد زمین‌لغزش‌ها در این حوضه در امر کاهش خسارات احتمالی و تهدیدهای مرتبط با زمین‌لغزش و تدوین سیاست ها و اجرای راهکارهای مدیریتی می‌‌تواند بسیار کارآمد باشد.

کلیدواژه‌ها

عنوان مقاله [English]

Evaluation and Comparison of Machine Learning and Deep Learning Models in Predicting the Landslide Risk

نویسندگان [English]

Shadi Jalilian ¹
Shaban Shataee Jouibary ²
Mohammad Hadi Moayeri ³
Amir Saddodin ⁴

¹ Gorgan University of Agricultural Sciences and Natural Resources

² Gorgan University of Agricultural Sciences and Natural Resources

³ Department of Forestry, Gorgan University of Agricultural Sciences and Natural Resources

⁴ Department of Watershed Management, Gorgan University of Agricultural Sciences and Natural Resources

چکیده [English]

Abstract
Introduction:
Landslides, as one of the most destructive natural phenomena, annually cause significant human casualties and financial damage. This study aimed to evaluate the performance of two machine learning models, Random Forest (RF) and Support Vector Machine (SVM), as well as two deep learning models, Convolutional Neural Network (CNN) and Recurrent Neural Network (RNN), in modeling landslide risk in a part of Golestan province.
Methodology:
For modeling, layers of 10 influential environmental and human factors were identified and prepared, including elevation, slope, slope direction, Topographic Wetness Index (TWI), Normalized Difference Vegetation Index (NDVI), land use, distance from roads, distance from rivers, distance from faults, and precipitation. From 494 landslide and non-landslide points, 70% were used for the training phase and 30% for the validation phase. To further the research objectives and prepare the information layers, ArcGIS software and the Python programming language were utilized to implement machine learning (ML) and deep learning (DL) algorithms.
Results:
The results demonstrated that the deep learning algorithm CNN, with an AUC score of 0.910, an overall accuracy of 87.72%, and a Kappa coefficient of 0.899 for high-risk classes (high and very high risk), was identified as the most efficient model. Variable importance analysis using the superior model (CNN) revealed that the factors Distance to Fault and Distance to River were respectively the most significant contributors to landslide occurrence in the study area.
Conclusion:
The results of this research can be highly effective in identifying high-risk areas and determining the factors influencing the occurrence of landslides in this area, thereby aiding in reducing potential damages and threats associated with landslides, as well as in implementing effective management strategies.

کلیدواژه‌ها [English]

Landslide susceptibility prediction
Hyrcanian forests
Deep learning
Convolutional Neural Network (CNN)
Spatial modeling
Receiver Operating Characteristic (ROC) curve

مهندسی و مدیریت آبخیز

ارزیابی و مقایسه مدل‌های یادگیری ماشین و یادگیری عمیق در پیش‌بینی خطر وقوع زمین‌لغزش

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 29 دی 1404

ارزیابی و مقایسه مدل‌های یادگیری ماشین و یادگیری عمیق در پیش‌بینی خطر وقوع زمین‌لغزش

مقالات آماده انتشار، پذیرفته شده انتشار آنلاین از تاریخ 29 دی 1404

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 29 دی 1404