Outliers vs Robustness in Nonparametric Methods of Regression
Outliers vs Robustness in Nonparametric Methods of Regression
Author(s): Joanna TrzęsiokSubject(s): Business Economy / Management
Published by: Wydawnictwo Uniwersytetu Łódzkiego
Keywords: outliers; robustness; nonparametric regression methods; obserwacje odstające; odporność; nieparametryczne metody regresji
Summary/Abstract: The article addresses the question of how robust methods of regression are against outliers in a given data set. In the first part, we presented the selected methods used to detect outliers. Then, we tested the robustness of three nonparametric methods of regression: PPR, POLYMARS, and RANDOM FORESTS. The analysis was conducted applying simulation procedures to the data sets where outliers were detected. Contrary to a relatively common conviction about the robustness of nonparametric regression, the study revealed that the models built on the basis of complete data sets represent a significantly lower predictive capability than models based on the sets from which outliers were discarded. // Artykuł poświęcony jest zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na zbiorach danych, w których wykryto obserwacje odstające. Mimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej okazało się, że modele zbudowane na całych zbiorach danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorach, z których usunięto obserwacje nietypowe.
Journal: Acta Universitatis Lodziensis. Folia Oeconomica
- Issue Year: 4/2018
- Issue No: 337
- Page Range: 99-109
- Page Count: 11
- Language: English