نوع مقاله : مقاله پژوهشی
نویسندگان
1 استاد، دانشکده محیط زیست، دانشگاه تهران
2 دانشجوی دکتری آبخیزداری، دانشکده منابع طبیعی، دانشگاه هرمزگان
3 دانشیار، پژوهشکده چرخه سوخت سازمان انرژی اتمی
4 استادیار، دانشکده منابع طبیعی، دانشگاه هرمزگان
چکیده
کارایی روش منشأیابی با ردیابها یا انگشتنگاری بهعنوان روشی موفق و مؤثر برای تعیین منابع رسوبات به اثبات رسیده است. اولین و مهمترین مرحله روش منشأیابی رسوب، انتخاب ترکیب مناسبی از ردیاب است که قادر به جداسازی منابع رسوب باشند .وجود دادههای پرت بر انتخاب ترکیب مناسبی از ردیابها اثر گذاشته، ممکن است مانع انتخاب متغیرهای مهم (ردیابهای مؤثر) شده و توان جداسازی یا درصد طبقهبندی صحیح را کاهش دهد. بنابراین دادههای یادشده باید شناسایی و در صورت وجود شواهد کافی دال بر پرت بودن، نسبت به تصحیح یا حذف آنها اقدام شود. در مطالعه حاضر هدف شناسایی دادههای پرت در بین مجموعه ردیابهای اندازهگیری شده در حوزه آبخیز تنگ بستانک، برای تشخیص بهترین ترکیب ردیابها بود. بر این اساس از روشهای تکمتغیره شناسایی دادههای پرت همچون آزمون گراب، آزمون گوس، آزمون دیکسون، نمودار جعبهای، میانه به اضافه یا منهای میانه انحرافهای تمام دادهها از میانه و میانگین به اضافه و منهای سه برابر انحراف از معیار دادهها و نیز از روشهای چندمتغیره شناسایی دادههای پرت همچون تحلیل مؤلفههای اصلی، فاصله ماهالانوبیس، مربع فاصله ماهالانوبیس، نمودار چندک مربع فاصله ماهالانوبیس به روی درجه آزادی در برابر توزیع مربع کای، نمودارهای جعبهای مربع فاصله ماهالانوبیس استفاده شد. در مجموع دادهای پرت شناخته شد که دستکم نیمی از روشهای مذکور به پرت بودن آن اذعان داشته باشند. نتایج نشان داد روش میانه به اضافه و منهای میانه انحرافهای تمام دادهها از میانه تعداد بیشتری از دادهها را بهعنوان داده پرت معرفی میکند و همچنین روشهای چندمتغیره اشتراک کمتری در تشخیص دادههای پرت با یکدیگر دارند. آزمونهای تکمتغیره اجماع بهتری نسبت به شناسایی و معرفی دادههای پرت دارند. برای استفاده از روشهای تکمتغیره برای شناسایی دادههای پرت روشهای میانه به اضافه یا منهای میانه انحرافهای تمام دادهها از میانه، نمودار جعبهای و آزمون دیکسون بهترتیب حساسیت آنها پیشنهاد میشود. همچنین نتایج نشان داد، بیشینه اجماع روشهای بهکار رفته برای روشهای تکمتغیره چهار و برای روشهای چندمتغیره دو مورد هست و در کل اجماع نیمی از روشها برای پرت بودن دادهها مشاهده نشد.
کلیدواژهها
عنوان مقاله [English]
Using univariate and multivariate methods to detect outliers in sediment fingerprinting method, case study: Tange Bostanak Watershed
نویسندگان [English]
- Ahmad Nohegar 1
- Mohammad Kazemi 2
- Seyed Javad Ahmadi 3
- Hamid Gholami 4
- Rasool Mahdavi 4
1 Professor, Faculty of Environment Sciences, Tehran University, Iran
2 PhD Student, Faculty of Natural Resources, Hormozgan University, Iran
3 Associate Professor, Fuel Cycle Research Institute of Atomic Energy Organization, Iran
4 Assistant Professor, Faculty of Natural Resources, Hormozgan University, Iran
چکیده [English]
Efficiency of sediment fingerprinting by using tracers as a successful method to determine the sources of sediment has been proved. Selection of the suite subset of tracers, capable of discriminating sediment sources, is the first and the most important step in the sediment fingerprinting method. The presence of outliers affects the selection of the suite subset and possibly prevents picking the important tracers and reducing the accuracy of classification. Therefore, the outliers must be detected in order to be corrected or omitted, if enough evidences were present. The present study aims to detect outliers in the subset of tracers, to identify the best combination. For detecting outliers, We used univariate methods such as Grubbs test, Gauss test, Dioxin test, box plot, the Median ± 3MAD, the mean ± 3standard deviation and also multivariate methods such as squared Mahalanobis distance, separate box plots of squared Mahalanobis distance for each of sediment sources, principal component analysis and plot of the squared Mahalanobis distances against the quantiles of the chi-square distribution. we consider an observation as the outlier that at least half of these methods have detected it as an outlier. The results showed that Median ± 3MAD method introduced a larger number of data as outliers Methods of multivariate outlier detection has low agreement with each other. Univariate methods to identify outliers show higher agreement with each other. To use univariate analysis techniques to detect outliers namely Median ± 3MAD, box plot, and Dioxin one can recommended to test their sensitivity. The results also showed that the maximum consensus for univariate analysis techniques is four samples (observations) and for multivariate methods is two samples (observations). In general, there is no observation that is identified as an outlier by half of the used methods.
کلیدواژهها [English]
- PCA
- Sediment Fingerprinting
- Tracers
- Mahalanobis Distance
- Grubbs' Test