نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیار، پژوهشکده حفاظت خاک و آبخیزداری، سازمان تحقیقات، آموزش و ترویج کشاورزی، تهران
2 دانشیار، پژوهشکده حفاظت خاک و آبخیزداری، سازمان تحقیقات، آموزش و ترویج کشاورزی، تهران
چکیده
یکی از مشکلات شایع و تأثیرگذار در مطالعات اقلیمی، وجود کمبودهای فراوان در سریهای زمانی دادههای مختلف اقلیمی و هیدرولوژی است. این پژوهش، با هدف ارزیابی دقت روشهای بازسازی پارامترهای دمایی در مناطق خشک ایران انجام شده است. برای این منظور، دادههای روزانه دمای کمینه، متوسط و دمای بیشینه 73 ایستگاه همدیدی با پراکنش مناسب در مناطق خشک ایران از آرشیو سازمان هواشناسی کل کشور دریافت و پردازش شد. روشهای بازسازی مورد استفاده شامل روشهای نسبت نرمال، رگرسیون خطی، رگرسیون چندگانه و عکس مجذور فاصله (IDW) میشوند. در این تحقیق، کارایی هر یک از روشهای مذکور در بازسازی نبودهای آماری پارامترهای دمایی در مقیاسهای زمانی روزانه، ماهانه و سالانه مناطق خشک کشور متناسب با میزان نسبت کمبود دادههای گمشده (از پنج تا 50 درصد کمبود دادهها) مورد ارزیابی قرار گرفت. برای ارزیابی آماری روشهای نامبرده از آمارههای ضریب همبستگی R، معیار برآورد خطای RMSE و ضریب Nash استفاده شد. نتایج نشان داد که در حالت کلی، هر کدام از روشهای نامبرده شده در سطح خاصی از بازسازی و مقیاس زمانی از عملکرد مناسبی برخوردارند. در مقیاس سالانه و ماهانه روشهای رگرسیون خطی و نسبت نرمال بیشترین دقت در بازسازی دادههای دما در منطقه خشک ایران را دارند. مقدار همبستگی بین دادههای بازسازی و مشاهدهای در سطوح مختلف با استفاده از این روشها به بیش از 0.95 میرسد. در مقیاس روزانه تفاوت قابل توجهی بین دقت روشهای مورد استفاده در بازسازی دادههای دمایی وجود ندارد و تقریباً هر چهار روش یاد شده از دقت مناسبی برخوردارند؛ چرا که میزان همبستگی بین دادههای بازسازیشده و مشاهدهشده به بیش از 90 درصد میرسد. با وجود این، روش رگرسیون چندگانه با میانگین همبستگی 99/0 درصد در سطوح مختلف بازسازی از بیشترین دقت در بازسازی دادههای روزانه برخوردار است.
کلیدواژهها
عنوان مقاله [English]
Investigation of the efficiency of common methods of infilling missing data in the arid regions of Iran
نویسندگان [English]
- Morteza Miri 1
- Mohammadreza Kousari 1
- Mehran Zand 2
1 Assistant Professor, Soil Conservation and Watershed Management Research Institute (SCWMRI), Agricultural Research, Education and Extension Organization (AREEO), Tehran, Iran
2 Associate Professor,Soil Conservation and Watershed Management Research Institute,Tehran,Iran
چکیده [English]
One of the most common and effective problems in long-term climate studies is the presence of gaps in the time series of various climatic and hydrological data. Therefore, the present study evaluates the accuracy of methods for infilling missing data of daily, monthly and annual temperature time series in the arid regions of Iran. For this purpose, the observed daily minimum, average and maximum temperature data for the period 1987-2014 measured at 73 synoptic stations distributed all over arid regions of Iran were used. Methods of readjustment used include: Normal ratio method, linear regression, multivariate regression and Inverse Distance Weighting (IDW). In this study, the capability of each mentioned methods for infilling missing data of daily, monthly and annual precipitation time series in the arid regions of the Iran was investigated, while the proportion of missing data varies from 5 to 50% of total data. In order to compare and evaluate the accuracy of the four mentioned methods three statistical indicators, namely the correlation coefficient (R), the Root Mean Square Error (RMSE) and Nash coefficient were used. The results showed that in general, each of the methods mentioned had different functionalities at a special level of readjustment and time scale. On annual and monthly scales, linear regression and normal ratio methods are the most accurate method in readjustment temperature data in the arid region of Iran. The correlation value between the readjustment and observational data at different levels reaches more than 0.95 using these methods. On the daily scale, there is no significant difference between the accuracy of the methods used in the readjustment of temperature data, and almost all four of these methods have appropriate accuracy because in all methods the correlation between readjustment and observed data is more than 90%. However, multivariate regression methods with an average correlation of 0.99 showed the most accurate performance in readjustment daily data at different levels of readjustment. Generally, each method should be used in accordance with the conditions, and therefore it is recommended to develop a software package for infilling missing data.
کلیدواژهها [English]
- Gap in data
- Correlation coefficient
- Linear regression
- Normal ratio
- Temperature