با همکاری انجمن آبخیزداری ایران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استاد، دانشکده محیط زیست، دانشگاه تهران

2 دانشجوی دکتری آبخیزداری، دانشکده منابع طبیعی، دانشگاه هرمزگان

3 دانشیار، پژوهشکده چرخه سوخت سازمان انرژی اتمی

4 استادیار، دانشکده منابع طبیعی، دانشگاه هرمزگان

چکیده

کارایی روش منشأیابی با ردیاب­‌ها یا انگشت­‌نگاری به‌­عنوان روشی موفق و مؤثر برای تعیین منابع رسوبات به اثبات رسیده است. اولین و مهم­ترین مرحله روش منشأیابی رسوب، انتخاب ترکیب مناسبی از ردیاب است که قادر به جداسازی منابع رسوب باشند .وجود داده­‌های پرت بر انتخاب ترکیب مناسبی از ردیاب­‌ها اثر گذاشته، ممکن است مانع انتخاب متغیرهای مهم (ردیاب­‌های مؤثر) شده و توان جداسازی یا درصد طبقه­‌بندی صحیح را کاهش دهد. بنابراین داده­‌های یادشده باید شناسایی و در صورت وجود شواهد کافی دال بر پرت بودن، نسبت به تصحیح یا حذف آن­‌ها اقدام شود. در مطالعه حاضر هدف شناسایی داده­‌های پرت در بین مجموعه ردیاب­‌های اندازه­‌گیری شده در حوزه آبخیز تنگ­ بستانک، برای تشخیص بهترین ترکیب ردیاب­‌ها بود. بر این اساس از روش­‌های تک­‌متغیره شناسایی داده‌های پرت همچون آزمون گراب، آزمون گوس، آزمون دیکسون، نمودار جعبه­‌ای، میانه به اضافه یا منهای میانه انحراف­‌های تمام داده­‌ها از میانه و میانگین به اضافه و منهای سه برابر انحراف از معیار داده­‌ها و نیز از روش­‌های چندمتغیره شناسایی داده­‌های پرت همچون تحلیل مؤلفه­‌های اصلی، فاصله ماهالانوبیس، مربع فاصله ماهالانوبیس، نمودار چندک مربع فاصله ماهالانوبیس به ­روی درجه آزادی در برابر توزیع مربع کای، نمودارهای جعبه‌­ای مربع فاصله ماهالانوبیس استفاده شد. در مجموع داده­ای پرت شناخته شد که دست­کم نیمی از روش­‌های مذکور به پرت بودن آن اذعان داشته باشند. نتایج نشان داد روش میانه به اضافه و منهای میانه انحراف­‌های تمام داده­‌ها از میانه تعداد بیشتری از داده­‌ها را به­‌عنوان داده پرت معرفی می­‌کند و همچنین روش‌­های چندمتغیره اشتراک کمتری در تشخیص داده­‌های پرت با یکدیگر دارند. آزمون­‌های تک­‌متغیره اجماع بهتری نسبت به شناسایی و معرفی داده­‌های پرت دارند. برای استفاده از روش­‌های تک­‌متغیره برای شناسایی داده­‌های پرت روش­‌های میانه به اضافه یا منهای میانه انحراف­‌های تمام داده­‌ها از میانه، نمودار جعبه­‌ای و آزمون دیکسون به­‌ترتیب حساسیت آن­‌ها پیشنهاد می­‌شود. همچنین نتایج نشان داد، بیشینه اجماع روش­‌های به­‌کار رفته برای روش­‌های تک­‌متغیره چهار و برای روش­‌های چندمتغیره دو مورد هست و در کل اجماع نیمی از روش­‌ها برای پرت بودن داده­‌ها مشاهده نشد.

کلیدواژه‌ها

عنوان مقاله [English]

Using univariate and multivariate methods to detect outliers in sediment fingerprinting method, case study: Tange Bostanak Watershed

نویسندگان [English]

  • Ahmad Nohegar 1
  • Mohammad Kazemi 2
  • Seyed Javad Ahmadi 3
  • Hamid Gholami 4
  • Rasool Mahdavi 4

1 Professor, Faculty of Environment Sciences, Tehran University, Iran

2 PhD Student, Faculty of Natural Resources, Hormozgan University, Iran

3 Associate Professor, Fuel Cycle Research Institute of Atomic Energy Organization, Iran

4 Assistant Professor, Faculty of Natural Resources, Hormozgan University, Iran

چکیده [English]

Efficiency of sediment fingerprinting by using tracers as a successful method to determine the sources of sediment has been proved. Selection of the suite subset of tracers, capable of discriminating sediment sources, is the first and the most important step in the sediment fingerprinting method. The presence of outliers affects the selection of the suite subset and possibly prevents picking the important tracers and reducing the accuracy of classification. Therefore, the outliers must be detected in order to be corrected or omitted, if enough evidences were present. The present study aims to detect outliers in the subset of tracers, to identify the best combination. For detecting outliers, We used univariate methods such as Grubbs test, Gauss test, Dioxin test, box plot, the Median ± 3MAD, the mean ± 3standard deviation and also multivariate methods such as squared Mahalanobis distance, separate box plots of squared Mahalanobis distance for each of sediment sources, principal component analysis and plot of the squared Mahalanobis distances against the quantiles of the chi-square distribution. we consider an observation as the outlier that at least half of these methods have detected it as an outlier. The results showed that Median ± 3MAD method introduced a larger number of data as outliers Methods of multivariate outlier detection has low agreement with each other. Univariate methods to identify outliers show higher agreement with each other. To use univariate analysis techniques to detect outliers namely Median ± 3MAD, box plot, and Dioxin one can recommended to test their sensitivity. The results also showed that the maximum consensus for univariate analysis techniques is four samples (observations) and for multivariate methods is two samples (observations). In general, there is no observation that is identified as an outlier by half of the used methods.

کلیدواژه‌ها [English]

  • PCA
  • Sediment Fingerprinting
  • Tracers
  • Mahalanobis Distance
  • Grubbs' Test