نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه جنگلداری دانشگاه علوم کشاورزی و منابع طبیعی گرگان
2 دانشگاه علوم کشاورزی و منابع طبیعی گرگان
3 گروه جنگلداری، دانشگاه علوم کشاورزی و منابع طبیعی گرگان
4 گروه مدیریت آبخیر، دانشگاه علوم کشاورزی و منابع طبیعی گرگان
چکیده
زمینلغزشها بهعنوان یکی از مخربترین پدیدههای طبیعی، سالانه موجب وارد آمدن تلفات انسانی و خسارات مالی قابلتوجهی میگردند. هدف از این پژوهش، ارزیابی مقایسه ای عملکرد الگوریتم های یادگیری ماشین جنگل تصادفی (RF) و ماشینبردارپشتیبان (SVM) و الگوریتم های یادگیری عمیق شبکه عصبی پیچشی (CNN) و شبکه عصبی بازگشتی (RNN) در مدلسازی خطر وقوع زمینلغزش حوزه آبخیز جنگلی 85 در بخشی از استان گلستان بود. براساس مطالعات قبلی برای مدلسازی، لایههای 10 عامل تأثیرگذار محیطی و انسانی شامل ارتفاع، شیب، جهت شیب، شاخص نمناکی توپوگرافی (TWI)، شاخص تفاضل نرمال شده پوشش گیاهی (NDVI)، کاربری اراضی، فاصله از جاده، فاصله از رودخانه، فاصله از گسل و بارندگی تعیین و تهیه شد. از مجموع 494 نقاط لغزشی و غیر لغزشی، 70 درصد برای مرحله آموزشی و 30 درصد برای مرحله اعتبارسنجی استفاده شد. از محیط نرمافزار ArcGIS و زبان برنامهنویسی پایتون برای اجرای الگوریتمهای یادگیری ماشین (ML) و یادگیری عمیق (DL) استفاده شد. ارزیابی عملکرد الگوریتم های موردبررسی با استفاده از شاخص مساحت زیر منحنی مشخصهی عامل گیرنده ROC ص.رت گرفت. در این پژوهش، عملکرد چهار الگوریتم یادگیری ماشین و عمیق در پهنهبندی حساسیت زمینلغزش در حوزه آبخیز جنگلی ۸۵ استان گلستان مورد ارزیابی قرار گرفت. نتایج نشان داد که الگوریتم یادگیری عمیق CNN با کسب امتیاز AUC برابر 910/0، صحت کلی 72/87% و ضریب کاپای 899/0 برای طبقات پرخطر (خطرناک و خیلی خطرناک) بهعنوان کارآمدترین مدل شناسایی شد. تحلیل اهمیت متغیرها با استفاده از مدل برتر (CNN) نشان داد که عوامل فاصله از گسل و فاصله از رودخانه به ترتیب دارای بیشترین اهمیت در وقوع زمینلغزش در منطقه موردمطالعه هستند. این یافته کاملاً با انتظارات زمینشناختی و ژئومورفولوژیکی منطقه همخوانی دارد. نقشه نهایی حساسیت زمینلغزش تولیدشده توسط مدل CNN نشان داد که 46/31 درصد از مساحت حوزه (معادل تقریباً12360 هکتار) در طبقه خطر خیلی زیاد قرار دارد.نتایج این تحقیق در شناسایی مناطق پرخطر و تعیین عوامل مؤثر بر رخداد زمینلغزشها در این حوضه در امر کاهش خسارات احتمالی و تهدیدهای مرتبط با زمینلغزش و تدوین سیاست ها و اجرای راهکارهای مدیریتی میتواند بسیار کارآمد باشد.
کلیدواژهها
عنوان مقاله [English]
Evaluation and Comparison of Machine Learning and Deep Learning Models in Predicting the Landslide Risk
نویسندگان [English]
- Shadi Jalilian 1
- Shaban Shataee Jouibary 2
- Mohammad Hadi Moayeri 3
- Amir Saddodin 4
1 Gorgan University of Agricultural Sciences and Natural Resources
2 Gorgan University of Agricultural Sciences and Natural Resources
3 Department of Forestry, Gorgan University of Agricultural Sciences and Natural Resources
4 Department of Watershed Management, Gorgan University of Agricultural Sciences and Natural Resources
چکیده [English]
Abstract
Introduction:
Landslides, as one of the most destructive natural phenomena, annually cause significant human casualties and financial damage. This study aimed to evaluate the performance of two machine learning models, Random Forest (RF) and Support Vector Machine (SVM), as well as two deep learning models, Convolutional Neural Network (CNN) and Recurrent Neural Network (RNN), in modeling landslide risk in a part of Golestan province.
Methodology:
For modeling, layers of 10 influential environmental and human factors were identified and prepared, including elevation, slope, slope direction, Topographic Wetness Index (TWI), Normalized Difference Vegetation Index (NDVI), land use, distance from roads, distance from rivers, distance from faults, and precipitation. From 494 landslide and non-landslide points, 70% were used for the training phase and 30% for the validation phase. To further the research objectives and prepare the information layers, ArcGIS software and the Python programming language were utilized to implement machine learning (ML) and deep learning (DL) algorithms.
Results:
The results demonstrated that the deep learning algorithm CNN, with an AUC score of 0.910, an overall accuracy of 87.72%, and a Kappa coefficient of 0.899 for high-risk classes (high and very high risk), was identified as the most efficient model. Variable importance analysis using the superior model (CNN) revealed that the factors Distance to Fault and Distance to River were respectively the most significant contributors to landslide occurrence in the study area.
Conclusion:
The results of this research can be highly effective in identifying high-risk areas and determining the factors influencing the occurrence of landslides in this area, thereby aiding in reducing potential damages and threats associated with landslides, as well as in implementing effective management strategies.
کلیدواژهها [English]
- Landslide susceptibility prediction
- Hyrcanian forests
- Deep learning
- Convolutional Neural Network (CNN)
- Spatial modeling
- Receiver Operating Characteristic (ROC) curve