نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشآموخته دکتری آب و هواشناسی، دانشگاه اصفهان، اصفهان، ایران
2 استاد هیدرواقلیم ، دانشکده علوم جغرافیایی و برنامهرزی، دانشگاه اصفهان، اصفهان، ایران
3 دانشیار پژوهشکده حفاظت خاک وآبخیزداری، سازمان تحقیقات، آموزش و ترویج کشاورزی، تهران، ایران
4 دانشیار دانشکده اقتصاد، دانشگاه اصفهان، اصفهان، ایران
چکیده
مقدمه
کیفیت آب مصرفی در بخشهای شرب و کشاورزی از شاخصهای مهم توسعه پایدار است. فعالیتهای کشاوررزی و صنعتی انسان منجر به کاهش کیفیت آب شده است. از سوی دیگر، محدودیت منابع آب شیرین و با کیفیت مناسب از دیگر محدودیتهای منابع آب است. پیچیدگی سامانههای آبی، تغییرات آن در طول زمان و مکان، افزایش هزینه و زمانبر بودن آزمایش کیفیت آب و نیاز به پایش مداوم بر دشواری پایش و ارزیابی کیفیت آب اثرگذار است. استفاده از الگوریتمهای هوش مصنوعی، یادگیری ماشین و یادگیری عمیق، برای پیشبینی کیفیت آب بهدلیل پارامترهای متنوع، مفید بوده، در مقایسه با روشهای آزمایش سنتی، مقرون به صرفه است. هیچ الگوریتم یکنواختی برای پیشبینی کیفیت آب وجود ندارد. در این پژوهش تلاش میشود، کارایی این الگوریتم در تخمین عناصر فیزیکی و شیمیایی مورد ارزیابی قرار گیرد. در دهههای اخیر کیفیت رودخانههای رشته کوه زاگرس بهدلیل فرسایش سازندهای کارستیک، عبور از مناطق سکونتگاهی، تغییرات کاربری اراضی، خشکسالی و تغییر اقلیم کاهش یافته است. برخی از این رودخانهها مانند کرخه، کارون و دز منبع تأمین آب شرب جمعیتی بیش از 10 میلیون نفر هستند. بنابراین تغییر در کیفیت آب منجر به افزایش خطر و تهدید آب شرب این سکونتگاهها میشود. بنابراین بررسی کیفیت منابع آب و ارائه مدل مناسب آن نقش مؤثری در مدیریت تأمین آب مورد نیاز خواهد داشت. پژوهش حاضر، بر آن است، ضمن پایش کیفیت آب آبخیز چم انجیر، بهترین الگوریتم یادگیری ماشین در تخمین آن را ارزیابی کند.
مواد و روشها
حوزه آبخیز چم انجیر واقع در استان لرستان و در جنوب شرق حوزه آبخیز کرخه است و بین طولهای ΄40 ˚48 تا ΄10 ˚48 شرقی و عرضهای ΄10 ˚33 تا ΄36 ˚33 قرار دارد. سازندهای زمینشناسی یکی از منابع مؤثر در غلظت متغیرهای شیمیایی منابع آب سطحی بهویژه در مناطق کارستیک است. این سازند در تغییر کیفیت آبخیز چم انجیر بسیار مؤثر است. سه زیرحوضه همجوار الشتر، خرمآباد و بیرانشهر تحتتأثیر سنگشناسی منطقه، میزان ترکیب شیمیایی سنگهای آهک و دولومیت، 89-87 درصد و انحلال گچ 13-11 درصد و میزان انحلال کربنات کارست (بین 0.01 تا 0.40 میلیمتر) است. آهکی بودن جنس زمین و وجود سنگهای نفوذی در زیرحوضههای بالادست رودخانه دز منجر به تغییر متغیرهای کلسیم، پتاسیم، EC و TDS شده است. همچنین خشکسالی اقلیمی و هیدرولوژی کیفیت منابع آب را تحت تأثیر قرار داده، باعث افزایش درصد متغیرهای شیمیایی آب شده است. برای انتخاب مدل مناسب هوش مصنوعی و بررسی کیفیت منابع آب سطحی آبخیز چم انجیر، از 321 نمونه از متغیر دبی چم انجیر در دوره 2021-1969 استفاده شد. این نمونهها، از متغیرهای شیمیایی Na، SAR، TH، TDS، Cl، Ca و Mg ایستگاه هیدرومتریک چم انجیر انتخاب شدهاند. برای مدلسازی کیفیت آب سطحی چم انجیر از الگوریتمهای یادگیری ماشین استفاده شد. در پژوهش حاضر، متغیرهای شیمیایی با الگوریتمهای مختلف یادگیری ماشین بررسی شده، اعتبار و دقت مقادیر برآورد شده با مقادیر مشاهداتی متغیرهای شیمیایی آب با شاخصهای r، MSE و MAE ارزیابی شده است. بر اساس تکرار و آزمون مدلهای مختلف الگوریم یادگیری ماشین، الگوریتمهای ماشین بردار پشتیبان و رگرسیون درختی بهعنوان بهترین مدلها انتخاب شدهاند. برای ارزیابی و ارتباطسنجی بین متغیرها از ماتریس همبستگی استفاده و بر اساس همبستگی، از میان دبی رودخانه و متغیرهای ماهانه کیفیت آب، HCO3، pH، Na، EC، Cl، Ca، Mg، TH، TDS و سختی موقت، 321 نمونه ماهانه از دو متغیر TDS و TH در دوره آماری 2021-1969 بررسی شد. برای بررسی دقت الگوریتمهای یادگیری ماشین در مدلسازی کیفیت آب، از شاخصهای همبستگی، میانگین مربعات خطاها و میانگین خطای مطلق استفاده شده است.
نتایج و بحث
نتایج P-test وجود روند افزایشی در سطح اطمینان 95 درصد دو متغیرTDS و TH از سال 1985 را تأیید کرد. متوسط TDS در دوره اول (1984-1969)، 286.6 میلیگرم در لیتر و در دوره دوم (2021-1985) 422.08 میلیگرم در لیتر و متوسط TH در دوره اول (1984-1969) 181.5 میلیگرم در لیتر و در دوره دوم (2021-1985) 278.6 میلیگرم در لیتر است. نتایج ماتریس همبستگی نشان داد که TDS همبستگی قوی با EC و TH نشان میدهد. TH همبستگی مثبت با متغیرهای شیمیایی TDS، EC، HCO3، Ca، Cl و Mg و همبستگی معکوس با pH نشان میدهد. الگوریتمهای یادگیری ماشین SVM و CART روند افزایشی را برای دو متغیر سختی کل و غلظت مواد محلول آب در دبی آبخیز چم انجیر تخمین میزنند. الگوریتم SVM با مدل KernalLinear بهترین عملکرد را داشت. علاوهبر این، شاخص صحتسنجی RMSE نیز الگوریتم SVM را با مقادیر پایینتری نسبت به الگوریتم CART نشان داد. بنابراین، SVM در پیشبینی متغیرهای کیفیت آب دقیقتر است.
نتیجهگیری
الگوریتمهای یادگیری ماشین برای مدلسازی کیفیت آب مؤثر هستند. نتایج نشان داد، در آبخیز چم انجیر، روند رو به رشد در غلظتهای TDS و TH از سال 1985 وجود دارد. SVM در پیشبینی TDS و TH از CART بهتر عمل کرد. یافتهها نشان داد کاهش دبی رودخانه، افزایش مصرف آب و زمینشناسی کارست در میزان غلظت TH و TDS تأثیر دارند. پایش کیفیت آب برای مدیریت منابع آب ضروری است. برای تخمینهای آینده کیفیت آب در این مطالعه، الگوریتم SVM توصیه میشود.
کلیدواژهها
عنوان مقاله [English]
Application of machine learning algorithms for estimating surface water quality in the Cham Anjir Watershed
نویسندگان [English]
- Maryam AriaSadr 1
- Dariush Rahimi 2
- Mehran Zand 3
- Hadi Amiri 4
1 Ph.D Graduate of Cliamatology, University of Isfahan, Isfahan, Iran
2 Professor of Department of Physical Geography, University of Isfahan, Isfahan, Iran
3 Associate Professor, Soil Conservation and Watershed Management Research Institute, Agricultural Research, Education and Extension Organization (AREEO), Tehran, Iran
4 Associate Professor of Department of Economics, University of Isfahan, Isfahan, Iran
چکیده [English]
Introduction
The complexity of aquatic systems, their spatiotemporal variations, the high cost and time-consuming nature of traditional testing methods, and the need for continuous monitoring all contribute to the difficulty of monitoring and evaluating water quality. Therefore, artificial intelligence, machine learning, and deep learning approaches are useful for predicting water quality given the diverse parameters involved and are more cost-effective compared to traditional testing methods. There is no uniform algorithm that performs optimally for predicting water quality, and different algorithms exhibit superior performance in different contexts. The quality of rivers in the Zagros mountainous region has decreased due to the erosion of karst formations, their passage through residential areas, changes in land use, drought, and climate change. Some of these rivers, such as the Karkheh, Karun, and Dez, serve as the source of drinking water for a population of over 10 million people. Therefore, changes in water quality pose increased risks and threats to the drinking water supply of these settlements. Assessing the quality of water resources and developing a suitable model will play an effective role in managing the required water supply. The present study aims to identify the best machine learning algorithm for estimating the water quality parameters of the Cham Anjir watershed while facilitating ongoing monitoring of the resource.
Materials and methods
Data from 321 samples of discharge and water quality parameters at the Cham Anjir hydrometric station during the period 1969–2021 were used to select a suitable artificial intelligence model and to assessthe quality of surface water resources in the Cham Anjir watershed. These samples included physical and chemical indicators: TDS, TH, SAR, Na, Mg, Ca, and Cl. Machine learning algorithms were employed to model the water quality of the Cham Anjir watershed. Through iterative testing of different models, the Support Vector Machine (SVM) and Classification and Regression Tree (CART) models were selected as the best performers. A correlation matrix was used to evaluate relationships among the variables, and based on these correlations, monthly discharge and monthly water quality indices—including TDS, TH, SAR, Na, Mg, Ca, Cl, EC, %Na, pH, HCO₃, and temporary hardness—were analyzed. A total of 321 monthly samples of the two key indices, TDS and TH, were studied over the statistical period of 1969–2021. To evaluate the accuracy of the machine learning algorithms in water quality modeling, the following performance indices were used: coefficient of determination (R²), mean squared error (MSE), and mean absolute error (MAE).
Results and discussion
The p-value from trend tests confirmed the existence of an increasing trend at the 95% confidence level for the two variables TDS and TH (surface water quality parameters of the Cham Anjir watershed) since 1985. The average TDS in the first period (1969–1984) was 286.6 mg/L, and in the second period (1985–2021) it was 422.08 mg/L. The average TH in the first period (1969–1984) was 181.5 mg/L, and in the second period (1985–2021) it was 278.6 mg/L.
The results of the correlation matrix indicated that TDS has a strong correlation with EC and TH. TH has a positive correlation with TDS, EC, HCO₃, Ca, Cl, and Mg , and an inverse correlation with pH. The machine learning algorithms SVM and CART successfully captured the increasing trend for the two parameters of total hardness and total dissolved solids in the discharge of the Cham Anjir watershed. The SVM algorithm with the linear kernel exhibited the best performance. In addition, the root mean square error (RMSE) validation index also showed lower values for the SVM algorithm compared to the CART algorithm. Therefore, SVM is more accurate in predicting water quality indicators.
Conclusion
Machine learning algorithms are effective for water quality modeling. The results indicated an increasing trend in TDS and TH concentrations in the Cham Anjir watershed since 1985. SVM performed better than CART in predicting TDS and TH. The findings suggest that decreasing river flow, increasing water consumption, and karst geology influence TH and TDS concentrations in the quality of this watershed. Water quality monitoring is essential for water resource management. For future estimates of water quality in this context, the SVM algorithm is recommended.
کلیدواژهها [English]
- Decision tree
- Support vector machine
- Total hardness
- Validation
- Water quality