با همکاری انجمن آبخیزداری ایران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری، گروه جنگلداری، دانشکده علوم جنگل، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران

2 استاد، گروه جنگلداری، دانشکده علوم جنگل، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران

3 ستاد، گروه جنگلداری، دانشکده علوم جنگل، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران

4 استاد، گروه آبخیزداری، دانشکده مرتع و آبخیزداری، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران

10.22092/ijwmse.2025.369812.2119

چکیده

مقدمه
زمین‌لغزش به‌عنوان یکی از مخرب‌ترین بلایای طبیعی، سالانه خسارات جانی و مالی قابل‌توجهی در سراسر جهان و به‌ویژه در استان گلستان به‌دلیل شرایط خاص توپوگرافیکی و اقلیمی به بار می‌آورد. اگرچه مطالعات متعددی در این منطقه انجام شده، اما عمده آنها بر روش‌های کلاسیک و آماری سنتی تکیه داشته و خلأ استفاده از الگوریتم‌های پیشرفته یادگیری عمیق به‌شدت احساس می‌شد. این پژوهش با هدف پُرکردن این خلأ و با سه نوآوری اصلی ۱) استفاده از مدل‌های یادگیری عمیق (CNN و RNN) برای اولین بار در منطقه، ۲) انجام مقایسه سیستماتیک با مدل‌های کلاسیک یادگیری ماشین (RF و SVM) و ۳) تمرکز بر یک حوزه آبخیز جنگلی با اکوسیستم حساس و پیچیده (هیرکانی) انجام شد.
 
مواد و روش‌ها
منطقه موردمطالعه، حوزه آبخیز جنگلی ۸۵ به مساحت تقریبی ۳۹۲۸۸ هکتار در استان گلستان بود. بر اساس مطالعات پیشین و تحلیل شرایط منطقه، ده عامل مؤثر بر وقوع زمین‌لغزش شامل ارتفاع، درصد شیب، جهت شیب، شاخص رطوبت توپوگرافی (TWI)، شاخص تفاضل نرمال‌شده پوشش گیاهی (NDVI)، کاربری اراضی، فاصله از جاده، فاصله از رودخانه، فاصله از گسل و میانگین بارندگی سالانه انتخاب و در محیط سامانه اطلاعات جغرافیایی (ArcGIS) به‌صورت لایه‌های رستری با اندازه سلول ۳۰×۳۰ متر تهیه شدند. داده‌های نقطه‌ای زمین‌لغزش (۲۴۷ نقطه) از اداره کل منابع طبیعی و آبخیزداری استان گلستان اخذ و به‌منظور ایجاد تعادل در مجموعه داده، به همان تعداد (۲۴۷ نقطه) نیز به‌صورت تصادفی از مناطقی که فاقد پدیده زمین‌لغزش بودند، انتخاب شدند. بدین ترتیب، یک مجموعه داده متعادل متشکل از ۴۹۴ نقطه برای مدل‌سازی آماده شد. این داده‌ها با نسبت ۷۰ به ۳۰ (۳۴۶ نقطه برای آموزش و ۱۴۸ نقطه برای اعتبارسنجی) تقسیم شدند. چهار مدل پیشرفته شامل دو مدل یادگیری ماشین (جنگل تصادفی RF و ماشین بردار پشتیبان SVM) و دو مدل یادگیری عمیق (شبکه عصبی پیچشی CNN و شبکه عصبی بازگشتی RNN) در محیط پایتون و با استفاده از کتابخانه‌های Scikit-learn و TensorFlow پیاده‌سازی و آموزش داده شدند. میزان عملکرد مدل‌ها با استفاده از منحنی مشخصه عملکرد گیرنده (ROC) و شاخص مساحت زیر منحنی (AUC)، و صحت سنجی نقشه‌های تولیدی در مناطق خطرناک (طبقات خطر زیاد و خیلی زیاد) با استفاده از 30 درصد نمونه‌های استفاده‌نشده با معیارهای صحت کلی و ضریب کاپا مورد ارزیابی کمی قرار گرفت.
 
نتایج و بحث
در این پژوهش، عملکرد چهار الگوریتم یادگیری ماشین و عمیق در پهنه‌بندی حساسیت زمین‌لغزش در حوزه آبخیز جنگلی ۸۵ استان گلستان مورد ارزیابی قرار گرفت. نتایج نشان داد که الگوریتم یادگیری عمیق CNN با کسب امتیاز AUC برابر 0.910، صحت کلی 87.72 درصد و ضریب کاپای 0.899 برای طبقات پرخطر (خطرناک و خیلی خطرناک) به‌عنوان کارآمدترین مدل شناسایی شد. تحلیل اهمیت متغیرها با استفاده از مدل برتر (CNN) نشان داد که عوامل فاصله از گسل و فاصله از رودخانه به‌ترتیب دارای بیش‌ترین اهمیت در وقوع زمین‌لغزش در منطقه موردمطالعه هستند. این یافته کاملاً با انتظارات زمین‌شناختی و ژئومورفولوژیکی منطقه همخوانی دارد. نقشه نهایی حساسیت زمین‌لغزش تولیدشده توسط مدل CNN نشان داد که 31.46 درصد از مساحت حوزه (معادل تقریباً 12360 هکتار) در طبقه خطر خیلی زیاد قرار دارد.
 
 نتیجه‌گیری
یافته‌های این پژوهش به‌وضوح برتری و پتانسیل بالای الگوریتم‌های یادگیری عمیق، به‌ویژه معماری شبکه عصبی پیچشی (CNN) را در تهیه نقشه‌های حساسیت زمین‌لغزش با دقت بالا در مقایسه با الگوریتم‌های یادگیری ماشین تأیید کرد. نقشه تولیدشده می‌تواند به‌عنوان یک ابزار علمی معتبر و قدرتمند در اختیار مدیران و برنامه‌ریزان قرار گیرد تا با تمرکز بر نواحی پرخطر، اقدامات پیشگیرانه، مدیریت ریسک و برنامه‌ریزی برای کاربری اراضی ایمن را در اولویت قرار دهند. برای مطالعات آینده، تلفیق این مدل‌ها با الگوریتم‌های بهینه‌ساز، استفاده از داده‌های باقدرت تفکیک بالاتر برای غلبه بر محدودیت‌های داده‌های فعلی و توسعه چارچوب‌های هیبریدی که هم دقت و هم قابلیت تفسیرپذیری را افزایش دهند، پیشنهاد می‌شود.

کلیدواژه‌ها

عنوان مقاله [English]

Evaluation and comparison of machine learning and deep learning models in landslide susceptibility zoning case study: forest watershed 85, Golestan Province

نویسندگان [English]

  • Shadi Jalilian 1
  • Shaban Shataee Jouibary 2
  • Mohammad Hadi Moayeri 3
  • Amir Saddodin 4

1 Ph.D. Student, Department of Forestry, Faculty of Forest Sciences, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran

2 Professor, Department of Forestry, Faculty of Forest Sciences, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran

3 Professor, Department of Forestry, Faculty of Forest Sciences, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran

4 Professor, Department of Watershed Management, Faculty of Rangeland and Watershed Management, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran

چکیده [English]

Introduction
Landslides, as one of the most destructive natural disasters, cause significant annual human and financial losses worldwide, particularly in Golestan Province due to its specific topographic and climatic conditions. Although numerous studies have been conducted in this region, most have relied on classical and traditional statistical methods, leaving a notable gap in the application of advanced deep learning algorithms. This research aimed to address this gap with three main innovations: 1) employing deep learning models (CNN and RNN) for the first time in the region, 2) conducting a systematic comparison with classical machine learning models (RF and SVM), and 3) focusing on a forest watershed with a sensitive and complex ecosystem (Hyrcanian). 
 
Materials and methods
The study area was Forest Watershed 85, covering approximately 39,288 hectares in Golestan Province. Based on previous studies and analysis of regional conditions, ten factors influencing landslide occurrence were selected: elevation, slope percentage, slope aspect, Topographic Wetness Index (TWI), Normalized Difference Vegetation Index (NDVI), land use, distance to roads, distance to rivers, distance to faults, and average annual rainfall. These factors were prepared as raster layers with a 30x30 meter cell size in a Geographic Information System (ArcGIS) environment. Landslide point data (247 points) were obtained from the General Department of Natural Resources and Watershed Management of Golestan Province. To balance the dataset, an equal number of points (247) were randomly selected from areas without landslide phenomena. Thus, a balanced dataset comprising 494 points was prepared for modeling. The data were split into a 70:30 ratio (346 points for training and 148 points for validation). Four advanced models, including two machine learning models (Random Forest, RF, and Support Vector Machine, SVM) and two deep learning models (Convolutional Neural Network, CNN, and Recurrent Neural Network, RNN), were implemented and trained in the Python environment using the Scikit-learn and TensorFlow libraries. The performance of the models was quantitatively evaluated using the Receiver Operating Characteristic (ROC) curve and the Area Under the Curve (AUC) index. Furthermore, the validation of the generated susceptibility maps in high-risk areas (high and very high-risk classes) was performed using 30% of the unused samples, assessed by the overall accuracy and Kappa coefficient metrics.
 
Results and discussion
In this research, the performance of four machine learning and deep learning algorithms was evaluated for landslide susceptibility zoning in Forest Watershed 85 of Golestan Province. The results demonstrated that the deep learning algorithm CNN, with an AUC score of 0.910, an overall accuracy of 87.72%, and a Kappa coefficient of 0.899 for high-risk classes (high and very high risk), was identified as the most efficient model. Variable importance analysis using the superior model (CNN) revealed that the factors Distance to Fault and Distance to River were respectively the most significant contributors to landslide occurrence in the study area. This finding is entirely consistent with the geological and geomorphological expectations of the region. The final landslide susceptibility map generated by the CNN model indicated that 31.46% of the watershed area (approximately equivalent to 12,360 hectares) is classified within the very high-risk category.
 
Conclusion
The findings of this research clearly confirm the superiority and high potential of deep learning algorithms, particularly the Convolutional Neural Network (CNN) architecture, for producing high-accuracy landslide susceptibility maps compared to machine learning algorithms. The generated map can serve as a reliable and powerful scientific tool for managers and planners, enabling them to prioritize preventive measures, risk management, and safe land-use planning by focusing on high-risk areas. For future studies, integrating these models with optimization algorithms, utilizing higher-resolution data to overcome the limitations of the current data, and developing hybrid frameworks that enhance both accuracy and interpretability are recommended.

کلیدواژه‌ها [English]

  • Convolutional Neural Network (CNN)
  • Hyrcanian forests
  • Landslide susceptibility prediction
  • Receiver Operating Characteristic (ROC) curve
  • Spatial modeling
Abdelkader, M. M., Csámer, Á., 2025. Comparative assessment of machine learning models for landslide susceptibility mapping: a focus on validation and accuracy. Nat. Hazards 1-23.
Abolfathi, K., Alikhah-Asl, M., Rezvani, M., 2015. Range classification and evaluation using Geographic Information System (GIS) and Normalized Difference Vegetation Index (NDVI), case study: Hablehrood Subwatershed of Shahrabad Basin. Hum. Environ. 13, 45-55 (in Persian).
Alavi, E.S., Dinpashoh, Y., Asadi, E., 2019. Analysis of hourly storms for the purpose of extracting design hyetographs using the Huff method. Geogr. Environ. Plann. 30, 41-58 (in Persian).
Alavinia, M., Nasiri Saleh, F., Asadi, H., 2019. Effects of rainfall patterns on runoff and rainfall-induced erosion. Int. J. Sediment Res. 34, 270-278.
Babar Beig, N., Larestani, Gh., Esmaeili, R., 2025. Landslide susceptibility zonation using random forest and support vector machine models (Case study: Talar watershed). Earth Sci. Res. J. 16(1), 152-168 (in Persian).
Chang, Z., Huang, F., Huang, J., Jiang, S.H., Liu, Y., Meena, S.R., Catani, F., 2023. An update of landslide susceptibility prediction from the perspective of space and time. Geosci. Frontiers. 14(5), 101619.
Custodio, P.M., 2025. Improving MRI classification through layered convolutional neural network configuration. Smart Techno. 7(1), 45-58.
Daviran, M., Shamekhi, M., Ghezelbash, R., Maghsoudi, A., 2023. Landslide susceptibility prediction using artificial neural networks, SVMs, and random forest: Hyperparameters tuning by the genetic optimization algorithm. Int. J. Environ. Sci. Technol. 20(1), 259-276.
Destranj, A., Karimi Sangchini, A., Noor, H., 2024. Evaluation of machine learning models efficiency in preparing landslide hazard map in Bar Neyshabur watershed. Watershed Manage. Res. J. 37(2), 133-147 (in Persian).
Destranj, A., Karimi Sangchini, A., Noor, H., 2024. Landslide risk assessment in Bar Neyshabur watershed, Razavi Khorasan province. Iran. J. Water. Manage. Sci. Engin. 18(67), 44-57 (in Persian).
Ferreira, Z., Almeida, B., Costa, A.C., do Couto Fernandes, M., Cabral, P., 2025. Insights into landslide susceptibility: A comparative evaluation of multi-criteria analysis and machine learning techniques. Geomatics. Nat. Hazards ad Risk 16(1), 1-22.
Fitriana, H.L., Ismanto, R.D., Tulus, J.S., Julzarika, A., Nugroho, J.T., Manalu, J., 2024. Comparison of statistical and machine-learning models for analyzing landslide susceptibility in the Sumedang area, Indonesia. Geomat. Environ. Engin. 18(2), 45-62.
Ganesh, B., Vincent, S., Pathan, S., Benitez, S.R.G., 2023. Machine learning based landslide susceptibility mapping models and GB-SAR-based landslide deformation monitoring systems: Growth and evolution. Remote Sensing Applications: Soci. Environ. 29, 100905.
Géron, A., 2017. Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems. O'Reilly Media, Inc.
Habumugisha, J.M., Chen, N., Rahman, M., Islam, M.M., Ahmad, H., Elbeltagi, A., Dewan, A., 2022. Landslide susceptibility mapping with deep learning algorithms. Sustain. 14(3), 1734.
Heaton, J., 2020. Applications of deep neural networks with keras. arXiv preprint arXiv:2009.05673.
Huang, J., Zhang, Z., Ling, S., Chen, K., Shi, G., Zhang, Y., 2025. Landslide susceptibility mapping using advanced ensemble learning techniques integrating a reduced error pruning tree. Advances in Space Research.
Indu, M., Barki, B.G., 2012. A study to integrate the differently abled through technical and vocational education in the polytechnic colleges in the southern region of India. Asian J. Res. Social Sci. Human. 2(4), 304-311.
Javidan, N., Kavyan, A., Rajabi, S., Pourghasemi, H., Jafarian, Z., 2023. Identification of prone areas to gully erosion and landslide in the form of a two-hazard map using machine learning models in Gorganrood watershed. Iranian J. Water. Manage. Sci. Engin. 17(62), 75-85 (in Persian).
Kalantar, B., Pradhan, B., Naghibi, S.A., Motevalli, A., Mansor, S., 2018. Assessment of the effects of training data selection on the landslide susceptibility mapping: A comparison between support vector machine (SVM), logistic regression (LR), and artificial neural networks (ANN). Geomat. Nat. Hazards Risk 9(1), 49-69.
Kleiman, R., Page, D., 2019. Aucμ: A performance metric for multi-class machine learning models. In International Conference on Machine Learning (3439-3447). PMLR.
Kornejady, A., Ownegh, M., Rahmati, O., Bahremand, A., 2018. Landslide susceptibility assessment using three bivariate models considering the new topo-hydrological factor: HAND. Geocarto Int. 33(11), 1155-1185.
Kornejady, A., Ownegh, M., Pourghasemi, H., Bahremand, A., Motamedi, M., 2020. Landslide susceptibility prediction using hybrid Mahalanobis distance and machine learning models (Case study: Oghan watershed, Golestan province). Earth Sci. Res. J. 11(2), 1-18 (in Persian).
Kumar, S., Lopez, D., 2016. A review on feature selection methods for high-dimensional data. J. Big Data. 3(1), 1-25.
Lokesh, P., Madhesh, C., 2025. Machine learning and deep learning-based landslide susceptibility mapping using geospatial techniques in Wayanad, Kerala state, India. Hydro Res. 8, 113-126.
Lokesh, P., Madhesh, C., Mathew, A., Shekar, P.R., 2025. Machine learning and deep learning-based landslide susceptibility mapping using geospatial techniques in Wayanad, Kerala state, India. Hydro Res. 8, 113-126.
Mastouri, A., Shataee Jouibari, S., Moayeri, M.H., Maghsoudi Mehrani, Y., 2022. Landslide susceptibility mapping using GIS-based MCDM method in Arabdagh forests of Iran. Environ. Resour. Res. 10(2), 165-182.
Melati, D.N., Umbara, R.P., Astisiasari, A., Wisyanto, W., Trisnafiah, S., Trinugroho, T., Anggreainy, M. S., 2024. A comparative evaluation of landslide susceptibility mapping using machine learning-based methods in the Bogor area of Indonesia. Environ. Earth Sci. 83(3), 86.
Mohammadi, M., Jolokhani Neyarki, M., 2023. Preparing landslide susceptibility map using statistical and machine learning models (Case study: Austria country). Geomat. Sci. Technol. 13(2), 79-94 (in Persian).
Mohammadyari, F., Mirsanjari, M., Zardean, A., 2018. Monitoring vegetation changes in Karaj watershed using normalized difference vegetation index and gradient analysis. Remote Sens. GIS in Nat. Resour. 9(4), 55-72 (in Persian).
Norouzi Goshbalag, H., Nadiri, A., 2018. Forecasting the underground water level of Bukan Plain using fuzzy logic, random forest, and neural network models. Pasture Watershed Quart. 72(1), 291-306 (in Persian).
Petley, D., 2012. Global patterns of loss of life from landslides. Geol. 40, 927-930.
Pourghasemi, H.R., Rahmati, O., 2018. Prediction of the landslide susceptibility: Which algorithm, which precision? Catena 162, 177-192.
Pourghasemi, H.R., Pouyan, S., Bordbar, M., Golkar, F., Clague, J.J., 2023. Flood, landslides, forest fire, and earthquake susceptibility maps using machine learning techniques and their combination. Nat. Hazards. 116(3), 3797-3816.
Rafiei Sardooi, E., 2022. Simulating landslide susceptibility with data mining models in Rabor region, Kerman province. Watershed Manage. Res. J. 35(2), 101-118 (in Persian).
Rodriguez, V., Ghimire, B., Rogan, J., Chica-Olmo, M., Rigol-Sánchez, J.P., 2012. An assessment of the effectiveness of a Random Forest classifier for land-cover classification. ISPRS J. Photogram. Remote Sens. 67, 93-104.
Sadeghi, S.H., Mousavi, S.R., Vahabzadeh Kabria, Gh., Roshan, S.H., 2024. Evaluation of random forest and support vector machine models in preparing landslide susceptibility map (Case study: Tajan watershed, Mazandaran province). Nat. Environ. Hazards 16(1), 1-15 (in Persian).
Sepahvand, A., Biranvand, N., 2024. Landslide susceptibility zonation using machine learning algorithms (Study area: part of Haraz watershed). Water Soil Model Manage. 4(2), 261-278 (in Persian).
Sepahvand, A., Sihag, P., Singh, B., Zand, M., 2018. Comparative evaluation of infiltration models. KSCE J. Civil Engin. 22(10), 4173-4184.
Shirani, K., Naderi Samani, R., 2022. Determining effective factors and evaluating landslide susceptibility with random forest and artificial neural network methods in Doab Samsami region of Chaharmahal and Bakhtiari province. Watershed Manage. Res. J. 35(1), 40-60 (in Persian).
Shirani, K., Peyrowan, H.R., Naderi Samani, R., 2024. Applied Principles of Zonation and Prediction of Land Susceptibility to Landslide Occurrence (Using Machine Learning and Programming in MATLAB). Soil Conservation and Watershed Management Research Institute (in Persian).
Singh, P., Singh, V.P., Angelaki, A., Kumar, V., Sepahvand, A., Golia, E., 2019. Modelling of infiltration using artificial intelligence techniques in semi-arid Iran. Hydrol. Sci. J. 64(13), 1647-1658.
Sun, X., Chen, J., Bao, Y., Han, X., Zhan, J., Peng, W., 2018. Landslide susceptibility mapping using logistic regression analysis along the Jinsha river and its tributaries close to Derong and Deqin County, southwestern China. ISPRS Int. J. Geo-Inform. 7(11), 438.
Taheri, V., Karam, A., Safari, A., Shataee Jouibari, Sh., 2020. Landslide zonation in the mountainous area of Golestan province using hybrid algorithm of least squares support vector machine and artificial bee colony. Geograph. Space Arrange. 10(37), 213-230 (in Persian).
Thammaboribal, P., Triapthti, N.K., Lipiloet, S., 2025. Using of Analytical Hierarchy Process (AHP) in Disaster Management: A Review of Flooding and Landslide Susceptibility Mapping. Int. J. Geoinform. 21(4), 177-196.
Wu, H., Niu, J., Li, Y., Wang, Y., Qiu, D., 2025. Landslide Susceptibility Prediction Based on a CNN–LSTM–SAM–Attention Hybrid Model. Applied Sci. 15(13), 7245.
Yang, K., Zhang, L., Wang, J., Chen, X., 2024. Displacement prediction method for rainfall-induced landslide using improved completely adaptive noise ensemble empirical mode decomposition, singular spectrum analysis, and long short-term memory on time series data. Water. 16(15), 2111.
Zhao, Z., Liu, Z.Y., Xu, C., 2021. Slope unit-based landslide susceptibility mapping using certainty factor, support vector machine, random forest, CF-SVM, and CF-RF models. Frontiers Earth Sci. 9, 589630.
Zhou, C., Yin, K., Cao, Y., Ahmed, B., Li, Y., Catani, F., Pourghasemi, H.R., 2018. Landslide susceptibility modelling applying machine learning methods: A case study from Longju in the Three Gorges Reservoir area, China. Comput. Geosci. 112, 23-37.