نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی دکتری، گروه جنگلداری، دانشکده علوم جنگل، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران
2 استاد، گروه جنگلداری، دانشکده علوم جنگل، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران
3 ستاد، گروه جنگلداری، دانشکده علوم جنگل، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران
4 استاد، گروه آبخیزداری، دانشکده مرتع و آبخیزداری، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران
چکیده
مقدمه
زمینلغزش بهعنوان یکی از مخربترین بلایای طبیعی، سالانه خسارات جانی و مالی قابلتوجهی در سراسر جهان و بهویژه در استان گلستان بهدلیل شرایط خاص توپوگرافیکی و اقلیمی به بار میآورد. اگرچه مطالعات متعددی در این منطقه انجام شده، اما عمده آنها بر روشهای کلاسیک و آماری سنتی تکیه داشته و خلأ استفاده از الگوریتمهای پیشرفته یادگیری عمیق بهشدت احساس میشد. این پژوهش با هدف پُرکردن این خلأ و با سه نوآوری اصلی ۱) استفاده از مدلهای یادگیری عمیق (CNN و RNN) برای اولین بار در منطقه، ۲) انجام مقایسه سیستماتیک با مدلهای کلاسیک یادگیری ماشین (RF و SVM) و ۳) تمرکز بر یک حوزه آبخیز جنگلی با اکوسیستم حساس و پیچیده (هیرکانی) انجام شد.
مواد و روشها
منطقه موردمطالعه، حوزه آبخیز جنگلی ۸۵ به مساحت تقریبی ۳۹۲۸۸ هکتار در استان گلستان بود. بر اساس مطالعات پیشین و تحلیل شرایط منطقه، ده عامل مؤثر بر وقوع زمینلغزش شامل ارتفاع، درصد شیب، جهت شیب، شاخص رطوبت توپوگرافی (TWI)، شاخص تفاضل نرمالشده پوشش گیاهی (NDVI)، کاربری اراضی، فاصله از جاده، فاصله از رودخانه، فاصله از گسل و میانگین بارندگی سالانه انتخاب و در محیط سامانه اطلاعات جغرافیایی (ArcGIS) بهصورت لایههای رستری با اندازه سلول ۳۰×۳۰ متر تهیه شدند. دادههای نقطهای زمینلغزش (۲۴۷ نقطه) از اداره کل منابع طبیعی و آبخیزداری استان گلستان اخذ و بهمنظور ایجاد تعادل در مجموعه داده، به همان تعداد (۲۴۷ نقطه) نیز بهصورت تصادفی از مناطقی که فاقد پدیده زمینلغزش بودند، انتخاب شدند. بدین ترتیب، یک مجموعه داده متعادل متشکل از ۴۹۴ نقطه برای مدلسازی آماده شد. این دادهها با نسبت ۷۰ به ۳۰ (۳۴۶ نقطه برای آموزش و ۱۴۸ نقطه برای اعتبارسنجی) تقسیم شدند. چهار مدل پیشرفته شامل دو مدل یادگیری ماشین (جنگل تصادفی RF و ماشین بردار پشتیبان SVM) و دو مدل یادگیری عمیق (شبکه عصبی پیچشی CNN و شبکه عصبی بازگشتی RNN) در محیط پایتون و با استفاده از کتابخانههای Scikit-learn و TensorFlow پیادهسازی و آموزش داده شدند. میزان عملکرد مدلها با استفاده از منحنی مشخصه عملکرد گیرنده (ROC) و شاخص مساحت زیر منحنی (AUC)، و صحت سنجی نقشههای تولیدی در مناطق خطرناک (طبقات خطر زیاد و خیلی زیاد) با استفاده از 30 درصد نمونههای استفادهنشده با معیارهای صحت کلی و ضریب کاپا مورد ارزیابی کمی قرار گرفت.
نتایج و بحث
در این پژوهش، عملکرد چهار الگوریتم یادگیری ماشین و عمیق در پهنهبندی حساسیت زمینلغزش در حوزه آبخیز جنگلی ۸۵ استان گلستان مورد ارزیابی قرار گرفت. نتایج نشان داد که الگوریتم یادگیری عمیق CNN با کسب امتیاز AUC برابر 0.910، صحت کلی 87.72 درصد و ضریب کاپای 0.899 برای طبقات پرخطر (خطرناک و خیلی خطرناک) بهعنوان کارآمدترین مدل شناسایی شد. تحلیل اهمیت متغیرها با استفاده از مدل برتر (CNN) نشان داد که عوامل فاصله از گسل و فاصله از رودخانه بهترتیب دارای بیشترین اهمیت در وقوع زمینلغزش در منطقه موردمطالعه هستند. این یافته کاملاً با انتظارات زمینشناختی و ژئومورفولوژیکی منطقه همخوانی دارد. نقشه نهایی حساسیت زمینلغزش تولیدشده توسط مدل CNN نشان داد که 31.46 درصد از مساحت حوزه (معادل تقریباً 12360 هکتار) در طبقه خطر خیلی زیاد قرار دارد.
نتیجهگیری
یافتههای این پژوهش بهوضوح برتری و پتانسیل بالای الگوریتمهای یادگیری عمیق، بهویژه معماری شبکه عصبی پیچشی (CNN) را در تهیه نقشههای حساسیت زمینلغزش با دقت بالا در مقایسه با الگوریتمهای یادگیری ماشین تأیید کرد. نقشه تولیدشده میتواند بهعنوان یک ابزار علمی معتبر و قدرتمند در اختیار مدیران و برنامهریزان قرار گیرد تا با تمرکز بر نواحی پرخطر، اقدامات پیشگیرانه، مدیریت ریسک و برنامهریزی برای کاربری اراضی ایمن را در اولویت قرار دهند. برای مطالعات آینده، تلفیق این مدلها با الگوریتمهای بهینهساز، استفاده از دادههای باقدرت تفکیک بالاتر برای غلبه بر محدودیتهای دادههای فعلی و توسعه چارچوبهای هیبریدی که هم دقت و هم قابلیت تفسیرپذیری را افزایش دهند، پیشنهاد میشود.
کلیدواژهها
عنوان مقاله [English]
Evaluation and comparison of machine learning and deep learning models in landslide susceptibility zoning case study: forest watershed 85, Golestan Province
نویسندگان [English]
- Shadi Jalilian 1
- Shaban Shataee Jouibary 2
- Mohammad Hadi Moayeri 3
- Amir Saddodin 4
1 Ph.D. Student, Department of Forestry, Faculty of Forest Sciences, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran
2 Professor, Department of Forestry, Faculty of Forest Sciences, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran
3 Professor, Department of Forestry, Faculty of Forest Sciences, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran
4 Professor, Department of Watershed Management, Faculty of Rangeland and Watershed Management, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran
چکیده [English]
Introduction
Landslides, as one of the most destructive natural disasters, cause significant annual human and financial losses worldwide, particularly in Golestan Province due to its specific topographic and climatic conditions. Although numerous studies have been conducted in this region, most have relied on classical and traditional statistical methods, leaving a notable gap in the application of advanced deep learning algorithms. This research aimed to address this gap with three main innovations: 1) employing deep learning models (CNN and RNN) for the first time in the region, 2) conducting a systematic comparison with classical machine learning models (RF and SVM), and 3) focusing on a forest watershed with a sensitive and complex ecosystem (Hyrcanian).
Materials and methods
The study area was Forest Watershed 85, covering approximately 39,288 hectares in Golestan Province. Based on previous studies and analysis of regional conditions, ten factors influencing landslide occurrence were selected: elevation, slope percentage, slope aspect, Topographic Wetness Index (TWI), Normalized Difference Vegetation Index (NDVI), land use, distance to roads, distance to rivers, distance to faults, and average annual rainfall. These factors were prepared as raster layers with a 30x30 meter cell size in a Geographic Information System (ArcGIS) environment. Landslide point data (247 points) were obtained from the General Department of Natural Resources and Watershed Management of Golestan Province. To balance the dataset, an equal number of points (247) were randomly selected from areas without landslide phenomena. Thus, a balanced dataset comprising 494 points was prepared for modeling. The data were split into a 70:30 ratio (346 points for training and 148 points for validation). Four advanced models, including two machine learning models (Random Forest, RF, and Support Vector Machine, SVM) and two deep learning models (Convolutional Neural Network, CNN, and Recurrent Neural Network, RNN), were implemented and trained in the Python environment using the Scikit-learn and TensorFlow libraries. The performance of the models was quantitatively evaluated using the Receiver Operating Characteristic (ROC) curve and the Area Under the Curve (AUC) index. Furthermore, the validation of the generated susceptibility maps in high-risk areas (high and very high-risk classes) was performed using 30% of the unused samples, assessed by the overall accuracy and Kappa coefficient metrics.
Results and discussion
In this research, the performance of four machine learning and deep learning algorithms was evaluated for landslide susceptibility zoning in Forest Watershed 85 of Golestan Province. The results demonstrated that the deep learning algorithm CNN, with an AUC score of 0.910, an overall accuracy of 87.72%, and a Kappa coefficient of 0.899 for high-risk classes (high and very high risk), was identified as the most efficient model. Variable importance analysis using the superior model (CNN) revealed that the factors Distance to Fault and Distance to River were respectively the most significant contributors to landslide occurrence in the study area. This finding is entirely consistent with the geological and geomorphological expectations of the region. The final landslide susceptibility map generated by the CNN model indicated that 31.46% of the watershed area (approximately equivalent to 12,360 hectares) is classified within the very high-risk category.
Conclusion
The findings of this research clearly confirm the superiority and high potential of deep learning algorithms, particularly the Convolutional Neural Network (CNN) architecture, for producing high-accuracy landslide susceptibility maps compared to machine learning algorithms. The generated map can serve as a reliable and powerful scientific tool for managers and planners, enabling them to prioritize preventive measures, risk management, and safe land-use planning by focusing on high-risk areas. For future studies, integrating these models with optimization algorithms, utilizing higher-resolution data to overcome the limitations of the current data, and developing hybrid frameworks that enhance both accuracy and interpretability are recommended.
کلیدواژهها [English]
- Convolutional Neural Network (CNN)
- Hyrcanian forests
- Landslide susceptibility prediction
- Receiver Operating Characteristic (ROC) curve
- Spatial modeling