Comparação entre medidas clássicas e robustas para identificação de outliers em regressão.

Autor(es) e Instituição: 
Gabriela Isabel Limoeiro Alves
Verônica Maria Cadena Lima
Apresentador: 
Gabriela Isabel Limoeiro Alves

A técnica da análise de regressão linear não está completa sem o estudo dos resíduos para a identificação de possíveis outliers e de alguns outros diagnósticos. Outliers estão presentes em praticamente todos os conjuntos de dados, em qualquer domínio de aplicação. Pesquisas realizadas com grandes quantidades de observações tornam mais difíceis sua detectação visual. O objetivo desse trabalho é comparar as medidas clássicas com as medidas robustas para identificação de outliers. Entre as medidas clássicas foram consideradas: Leverage, DFBeta DFFit, Cook, Covratio e a distância de Malahanobis. As medidas robustas consideradas foram Elipsóide de Volume Mínimo e Covariância de Determinante Mínimo. Através da análise de vários conjuntos de dados, os resultados revelaram que as medidas robustas, que utilizam estimadores que “resistem” a uma proporção de dados contaminados, mostraram-se mais eficientes na identificação de outliers.

Resumo estendido: