OUTLIERS

Função


id.outliers()

Entrada de dados: Será realizado por meio de uma tabela de classe data.frame no R. Essa tabela terá linhas correspondendo às observações medidas e as colunas corresponderão às variáveis. Somente as variáveis quantitativas (numéricas) poderão ser usadas nessa função.

Argumentos: a função terá 7 argumentos;

id.outliers (x, quant=, group= , id= , visual= , res= , csv= FALSE) 

Onde:

Objetos de Saída: Ao término da função serão geradas no máximo 3 tipos de objetos: tabelas em formato .csv, gráficos salvos em formato .jpeg e um objeto tipo list contendo os outliers.

Gráficos Gerados: Os gráficos para todas as variáveis indicadas pelo argumento quant serão apresentados em uma única prancha, e uma prancha para cada tipo de gráfico, no fim, se o argumento visual=“ALL” for escolhido serão gerados três pranchas.

Passos da Função: Para cada um dos grupos indicados pelo argumento group será criada uma pasta de diretório separada, onde serão salvos os objetos de saída. Essa pasta receberá o nome do grupo e dentro dela haverá um pasta para cada tipo de gráfico escolhido e para cada algoritmo utilizado se o argumento csv=TRUE for designado.

Utilidade da Função: A função poderá ser utilizada por qualquer pessoa que trabalhe com dados quantitativos e tenha o interesse de verificar a existência e identificar possível outliers.

Referências:
IGLWICZ, Boris; HOAGLIN, David. Volume 16: How to Detect and Handle Outliers. IN: MYKYTKA, Edward F.(ed.), The ASQC Basic References in Quality Control: Statistical Techniques, 1993.

ROSNER, Bernard. Percentage Points for a Generalized ESD Many-Outlier Procedure. Technometrics, 25(2), pp. 165-172, 1983.

ZUUR, Alain F.; IENO, Elena N.; ELPHICK, Chris S. A protocol for data exploration to avoid common statistical problems. Methods in Ecology and Evolution, v. 1, n. 1, p. 3-14, 2010.

Fórmulas para os Algoritmos:
Generalized ESD test
Modified Z-Score test