Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

--- 02_tutoriais:tutorial6:start [2020/09/29 23:01]
rafael.melhem [Estatísticas de interesse]
+++ 02_tutoriais:tutorial6:start [2023/08/29 16:22]
@@ Linha 1: / Linha 1: @@
-<WRAP tabs>
-  * [[02_tutoriais:tutorial6:start|Tutorial]]
-  * [[01_curso_atual:exercicios6| Exercícios]]
-  * [[03_apostila:06-significa| Apostila]]
-</WRAP>
-====== 6a. Teste de Hipótese ======
-[[https://www.explainxkcd.com/wiki/index.php/882:_Significant|{{:02_tutoriais:tutorial6:significant.png?400  |}}]]
-O teste de hipótese é um instrumento poderoso para a tomada de decisão e parte fundamental do procedimento científico de experimentos. Os testes estão baseados no conceito de variável aleatória, que são aquelas em que o resultado de um evento pode variar. Ou seja, quase tudo o que nos rodeia. Por exemplo, //Eucalyptus saligna// em talhão de cultivo terão uma taxas de crescimento similar, mas não exatamente a mesma. O diâmetro do tronco, após sete anos de plantio, não será o mesmo para todas as árvores. Essa variabilidade tem várias fontes, genética, ambiental ou acidental, e é inerente aos dados biológicos. O esforço no cultivo é justamente no sentido de buscar as melhores taxas de crescimento e menor variação possível, para que o resultado seja eficiente e previsível. Por isso se usa mudas provenientes de clones a partir de cultura de tecido, para controlar pelo menos essa fonte de variabilidade.  No teste de hipótese partimos do fato que os dados podem variar e avaliamos se o resultado encontrado pode ter sido gerado pelo acaso e não pelo tratamento que estamos testando. No caso do //Eucalyptus// poderíamos estar interessados no efeito, por exemplo, de um tipo específico de adubo. Comparando mudas que foram colocadas em tratamentos com e sem adubo iremos, quase certamente, encontrar diferenças nos tamanhos das árvores dos dois grupos. A pergunta subjacente é: será que essa diferença encontrada poderia ter sido gerada apenas por outros fatores ou o acaso?
-Por exemplo, por sorte, poderíamos ter amostrado uma proporção de árvores que cresceram mais em um dos tratamentos e uma proporção menor no outro. Isso simplesmente por acaso! Considerando que há  variação no crescimento dos indivíduos, há uma probabilidade desse padrão emergir, nesse caso, simplesmente porque fizemos uma amostra das árvores nas duas condições. O teste de hipótese é o instrumento para nos guiar nessa interpretação.
-Vamos visitar estes e outros conceitos associados, utilizando as ferramentas disponíveis no R.
-===== Chacal Dourado =====
-{{:02_tutoriais:tutorial6:Golden_wolf_sa02.jpg?400  |}} Vamos utilizar o exemplo de tamanho de mandíbulas de chacal dourado que se encontra no livro do [[https://onlinelibrary.wiley.com/doi/abs/10.1002/sim.4780110117|Bryan Manly]]((Manly B. F. J., 2007 Randomization, bootstrap and Monte Carlo methods in biology. 3nd Ed., Chapman and Hall, London)) sobre randomização e outros métodos que iremos ver mais a frente.
-Os dados são provenientes da coleção do Museu Britânico de História Natural em Londres e foram publicados em um artigo de 1980. Aqui estamos interessados apenas nos <wrap hi>tamanhos das mandíbulas e se há diferença entre fêmeas e machos</wrap>.
-Como foram avaliados apenas 10 machos e 10 fêmeas, vamos entrar esses dados diretamente no R:
-<code rsplus>
-macho <- c(120, 107, 110, 116, 114, 111, 113, 117, 114, 112)
-femea <- c(110, 111, 107, 108, 110, 105, 107, 106, 111, 111)
-chacal <- c(macho, femea)
-sexo <- factor(rep(c("macho", "femea"), each=10))
-</code>
-===== Dois Gráficos para ver os mesmos dados =====
-Vamos avaliar esses dados graficamente. O código abaixo produz um gráfico de caixa (boxplot) e também um gráfico, pouco usual, mas que nos permite visualizar a variação que existe nos dados. Vamos usar esse tipo de representação gráfica ao longo desse tutorial. Tenha certeza que entendeu o que está representado nessa figura!
-<code rsplus>
-x11(width = 12, heigh = 6)
-par(mfrow = c(1, 2), cex = 1.5)
-boxplot(chacal ~ sexo, ylab = "Comprimento da mandíbula (mm)")
-plot(1:20, chacal, pch = rep(c(15, 16), each = 10), col = rep(1:2, each = 10), xlab = "Observações", ylab = "Comprimento da mandíbula (mm)")
-medsex <- c(mean(macho), mean(femea))
-segments(x0 = 1:20, y0 =  chacal, y1 =  rep(medsex, each = 10), col= rep(1:2, each = 10))
-lines(c(1,10), c(medsex[1], medsex[1]),col=1)
-lines(c(11,20),c(medsex[2], medsex[2]),col=2)
-</code>
-<WRAP center round box 90%>
-{{  :02_tutoriais:tutorial6:chacal.png?900  |}}
-</WRAP>
-Agora que já visualizou o gráfico, vamos retornar os parâmetros globais para o padrão e fechar o dispositivo de tela:
-<code rsplus>
-par(mfrow = c(1,1), cex = 1)
-dev.off()
-</code>
-===== Pergunta =====
-{{:02_tutoriais:tutorial6:questions.png?400  |}}
-Por que estamos olhando para esses dados? Por que estou fazendo esse curso? Podemos nos perguntar tantas coisas... O importante é saber o que estamos fazendo e para quê. Qual a nossa hipótese?! Neste tutorial, a pergunta é usada para ilustrar o teste de hipótese. Mesmo assim, é a condutora de toda a lógica do teste. Podemos fazer uma pergunta simples, por exemplo: se o tamanho da mandíbula difere entre machos e fêmeas. Uma outra pergunta poderia ser se os <wrap em>machos tem mandíbulas maiores que as fêmeas</wrap>.
-A princípio vamos nos ater à segunda. Nesse caso, uma medida que nos fornece informações sobre nossa pergunta é a diferença entre as mandíbulas de machos e fêmeas. Mas qual valor iremos usar para calcular esse diferença? Há várias possibilidades, vamos usar a mais intuitiva, a média! E nossa pergunta passa a ser um pouco diferente e mais precisa: será que <wrap em>a mandíbula de machos são em média maiores que as das fêmeas</wrap>?
-Vamos olhar para esses valores e armazenar essa diferença entre médias:
-<code rsplus>
-tapply(chacal, sexo, summary)
-tapply(chacal, sexo, mean)
-tapply(chacal, sexo, sd)
-diff(tapply(chacal, sexo, mean))
-difsex <- diff(tapply(chacal, sexo, mean))
-</code>
-==== Estatísticas de interesse ====
-A estatística de interesse é um valor que resume nossa hipótese, nesse caso, a diferença do tamanho médio entre sexo. Nossa resposta está dada: as mandíbulas de machos são em média maiores que as das fêmeas!
-Além disso, temos uma estimativa do efeito associado: em média os machos tem mandíbulas ''4.8 mm'' maiores que as fêmeas.
-Algumas indagações emergem a partir desta afirmação:
-  * **Essa diferença pode ser gerada pelo acaso?**
-Ou ainda mais precisamente:
-  * <wrap em>Qual a possibilidade desta diferença ser gerada pelo acaso?</wrap>
-==== Variável Aleatória ====
-A pergunta acima pode ser respondida se tomarmos algumas pressupostos sobre a variabilidade dos dados. Por exemplo, que a variável aleatória, tamanho de mandíbula, se ajusta a uma distribuição normal.  Vamos olhar os valores e compará-lo com a distribuição normal com mesma média e desvio padrão dos dados.
-<code rsplus>
-hist(chacal, freq=FALSE,xlim=c(95,125))
-curve(exp=dnorm(x, mean=mean(chacal),sd=sd(chacal)),from=95,to=125, col="red", add=TRUE)
-</code>
-Como só temos 20 valores, vamos ser generosos com os dados e considerar que estão bem acoplados a uma distribuição probabilística normal, para fins didáticos((Este é um pressuposto sério e deve ser avaliado para definir o tipo de análise que será usada)).
-===== Simulando Dados =====
-Tendo a premissa acima podemos utilizar a função ''rnorm'' para simular amostras com as mesmas características dos nossos dados. Mais que isso, podemos simular o cenário associado à nossa hipótese e calcular a estatística de interesse:
-<code rsplus>
-## 10 valores de um distribuicao normal
-rnorm(10,mean = mean(chacal),sd = sd(chacal))
-## diferenca entre as medias de 10 valores
-mean(rnorm(10, mean = mean(chacal), sd = sd(chacal))) - mean(rnorm(10, mean = mean(chacal), sd = sd(chacal)))
-</code>
-Para deixar o código mais compacto, vamos atribuir a média e o desvio padrão dos dados ao objeto ''mch'' e ''sdch''.
-<code rsplus>
-(mch <- mean(chacal))
-(sdch <- sd(chacal))
-(mean(rnorm(10, mean = mch,sd = sdch)) - mean(rnorm(10, mean = mch), sd = sdch))
-</code>
-===== Cenário Nulo =====
-{{:02_tutoriais:tutorial6:null_hypothesis.png?200  |}}
-O cenário acima simula a situação em que os valores de machos e fêmeas são provenientes da mesma distribuição normal. Portanto, qualquer diferença encontrada é devida apenas ao acaso. A fonte nesse caso é o procedimento de amostra. Justamente o caso descrito na abertura desse tutorial.  Percebam como os valores resultantes variam:
-<code rsplus>
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-</code>
-Fazendo isso muitas vezes podemos comparar o valor observado com a distribuição esperada devido ao acaso. Com isso podemos responder nossa pergunta: será que o acaso poderia gerar a diferença observada? Copiar esse linha de comando 1000 vezes seria tedioso! Para resolver isso, vamos aprender uma ferramenta poderosa e um clássico na linguagem de programação: a <wrap em>iteração</wrap> ou ciclos.
-==== Criando Ciclos ====
-A função ''for()'' cria ciclos de eventos que se repetem, sua sintaxe é simples, basta eleger uma variável, no exemplo abaixo ''i''((pode ser qualquer nome como quando criamos um objeto. Classicamente, em programação utiliza-se ''i'', ''j'', ''ii'', ''jj''... )) e indicar em um vetor, quais os valores que essa variável vai assumir em cada ciclo. No caso do código abaixo, os valores de 1 a 10. Entre ''{ }'' colocamos o procedimento que queremos repetir. A cada novo ciclo, ''i'' assume o valor seguinte do vetor que foi definido (''1:10'').
-Veja o efeito do código abaixo. A função ''cat()'' mostra na tela (no console do R) o valor atribuído ao objeto que fornecemos. Os símbolos "\t" e "\n" são os caracteres no R que definem  tabulação e quebra de linha em uma cadeia de caracteres, respectivamente.
-<code rsplus>
-for(i in 1:10)
-{
-    cat("\n\t", i)
-}
-</code>
-Pronto! <wrap em>Acabaram de aprender uma das ferramentas mais poderosa em programação!</wrap>
-Vamos utiliza-la então para simular, muitas e muitas vezes, o nosso cenário nulo. Aqui, o pulo do gato é preparar um objeto, antes de iniciar o ciclo, para guardar os resultados de cada iteração.
-A variável ''i'', neste caso, serve tanto como contador dos ciclos, quanto para posicionar o resultado no objeto onde iremos guardar a informação. Uma boa prática é preencher o objeto que irá guardar o resultado com ''NA''s ao criá-lo. Assim, se algo sair errado na iteração, iremos perceber logo que tentarmos operar o resultado!
-<code rsplus>
-nsim <- 1000
-## criando o objeto para guardar o resultado
-cenaNula <- rep(NA, nsim)
-## ciclo de iteração
-cenaNula[1] <- difsex
-for(i in 2:nsim)
-{
-    cenaNula[i] <- mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch))
-}
-str(cenaNula)
-</code>
-==== Visualizando a simulação ====
-Vamos agora usar a ** animada** função chamada {{:02_tutoriais:tutorial6:simula.r|}} que produzimos para ilustrar a simulação:
-<WRAP center round alert 60%>
-Atenção usuários do RStudio: a função ''simula()'' não é tão animada assim na janela do RStudio.  Para que ela funcione, antes de usá-la abra uma janela gráfica com o comando ''x11()''
-</WRAP>
-Primeiro precisamos carregá-la no espaço de trabalho, com o comando ''source''.
-Depois, é só simular!
-<code rsplus>
-x11(width = 10, height = 10)
-source("simula.r")
-simula(chacal[sexo == "macho"], chacal[sexo == "femea"])
-</code>
-==== Probabilidade do Acaso ====
-Vamos usar os valores que produzimos para gerar um histograma da nossa simulação.
-<code rsplus>
-par(las = 1, cex = 1.2)
-hist(cenaNula, col = rgb(0, 0, 1, 0.3))
-</code>
-Agora, podemos calcular agora quantas vezes o cenário nulo, ou o acaso, gerou diferenças iguais ou maiores que a observada nos dados, assim como, a probabilidade associada a este valor:
-<code rplus>
-sum(cenaNula >= difsex)
-</code>
-Vamos indicar esses valores no gráfico:
-<code rplus>
-histNull <- hist(cenaNula, plot = FALSE, breaks = c(min(floor(cenaNula)), -4.6:4.6, max(ceiling(cenaNula))))
-str(histNull)
-histNull$breaks
-cols <- rep(c(rgb(0, 0, 1, 0.3), rgb(1, 0, 0, 0.3)),   c(10, 2))
-plot(histNull,  main = "Cenário Nulo", xlab = "Diferença entre médias (mm)",  ylab = "Frequência", col = cols)
-abline(v = difsex, lty = 2)
-</code>
-<WRAP center round box 40%>
-{{  :02_tutoriais:tutorial6:cenaNula.png?400|  }}
-</WRAP>
-Dividindo esse valor pelo número de simulações que foram feitas temos uma estimativa da **probabilidade do acaso**.
-<code rsplus>
-sum(cenaNula >= difsex)/length(cenaNula)
-</code>
-<WRAP center round tip 90%>
-<WRAP center round box 90%>
-==== Interpretado o resultado ====
-O cenário nulo, onde não há diferenças entre os sexos, gerou valores maiores ou iguais à diferença observada em 3 casos((no caso da minha simulação. Esse valor irá variar tendo em vista que o cenário nulo é construido com valores aleatórios, mas ficará próximo de 2 a 5. Além disso, ele tende a convergir para o valor próximo a 3 com o aumento do número de simulações)) em 1000. Isso significa uma proporção de <wrap em>0.003</wrap> ou <wrap em>0.3%</wrap> dos casos.
-</WRAP>
-</WRAP>
-Como essa probabilidade é muito baixa, eu particularmente, me sinto confortável em afirma que:
-<wrap em>Os machos de chacal dourado apresentam mandíbulas maiores que as fêmeas.</wrap>
-E posso dizer ainda, que posso estar errado, mas a probabilidade de incorrer em erro ao fazer essa afirmação é pequena, cerca de ''0.3%''.
-O valor de probabilidade que acabamos de calcular é, sem dúvida, a estatística mais famosa e polêmica do teste de hipótese: o <wrap em>p-valor</wrap>.
-<WRAP center round box 90%>
-===== I CAN SEE CLEAR NOW! =====
-{{:02_tutoriais:tutorial6:p_values.png?300  |}}
-O p-valor está em crise! Muitos artigos tem sido publicados recentemente discutindo o <wrap em>p-valor</wrap>. Um dos pontos mais atacados é o já consagrado limite de 5% de probabilidade para a significância do resultado. Outro ponto atacado é a própria palavra
-<wrap em>significância</wrap> que é mal interpretada ou pior, não define bem o que o resultado do p-valor significa! Alguns autores sugerem que usemos algo como **clareza** do resultado. Por exemplo, o nosso resultado é claro, as mandíbulas de machos, em média, são maiores que as das fêmeas. Entretanto, será que essa diferença de ''4.8 mm'' é relevante ou significante?  Será que essa diferença, tão pequena, condiciona alguma variação biologicamente significativa?
-Aqui uma seleção de artigos sobre o tema:
-  *  [[http://labtrop.ib.usp.br/lib/exe/fetch.php?media=cursos:planeco:material:Methods%20Ecol%20Evol%202019%20Dushoff.pdf|I can see clearly now: reinterpreting statistical significance.]] Dushoff J.; Klain M.P. & Bolker B.M. 2019.Methods in Ecology and Evolution 10(6): 756-759.
-  * [[http://labtrop.ib.usp.br/lib/exe/fetch.php?media=cursos:planeco:material:The%20ASA%20Statement%20on%20p%20Values%20Context%20Process%20and%20Purpose.pdf|The ASA Statement on p Values Context Process and Purpose. Wasserstein R.L. & Lazar, N.A. 2016. The ASA Statement on p-Values: context, process, and purpose. The American Statistician 70(2): 129-133.
-]]
-  * [[http://labtrop.ib.usp.br/lib/exe/fetch.php?media=cursos:planeco:material:Nature%202019%20Amrhein.pdf|Retire statistical significance.]] Amrhein.pdf |Amrhein V.; Greenland S.; McShane B. et al. 2019.  Nature 567:305-307.
-  * [[http://labtrop.ib.usp.br/lib/exe/fetch.php?media=cursos:planeco:material:Chernobyl.pdf|Field effects studies in the Chernobyl exclusion zone:lessons to be learnt.]] Beresford N.A.; Scott E.M. & Copplestone D.2020.  Journal of Environmental Radioactivity 211 105893.
-</WRAP>
-===== Bicaudal e Unicaudal =====
-A outra pergunta simples que poderíamos fazer sobre esses dados é:
-  * <wrap em>Existe diferença entre machos e fêmeas?</wrap>
-Neste caso, não estamos preocupados se a diferença é macho maior que fêmea ou fêmea maior que macho. Apenas nos perguntamos se há diferença entre os sexos. Nesse caso, o calculo do ''p-valor'' é diferente, pois podemos encontrar diferenças para qualquer dos dois lados da nossa distribuição de diferenças. Vamos calcular o ''p-valor'' para esse caso, para tanto, precisamos apenas fazer a mesma operação com os  [[https://pt.wikipedia.org/wiki/Valor_absoluto_(%C3%A1lgebra)|valores absolutos]].
-<code rsplus>
-sum(Mod(cenaNula) >= abs(difsex))
-sum(Mod(cenaNula) >= abs(difsex))/length(cenaNula)
-</code>
-O resultado deve ser por volta de ''6'' simulações com valores iguais ou maiores que ''4.8''. O que significa um ''p-value ≈ 0.006''. Apesar de pequeno (''0.6%''), esse valor é o dobro do que encontramos com o teste uni-caudal. Vamos representar esses valores no nosso histograma:
-<code rsplus>
-cols <- rep(c(rgb(1, 0, 0, 0.3), rgb(0, 0, 1, 0.3), rgb(1, 0, 0, 0.3)),   c(1, 9, 2))
-plot(histNull,  main = "Cenário Nulo", xlab = "Diferença entre médias (mm)",  ylab = "Frequência", col = cols)
-abline(v = c(difsex, -1* difsex), lty = 2)
-savePlot("biNula.png", type = "png")
-</code>
-<WRAP center round box 40%>
-{{  :02_tutoriais:tutorial6:biNula.png?400  |}}
-</WRAP>
-Acabamos de recriar um dos teste mais famosos da estatística frequentista clássica: <wrap em>o teste t de Student</wrap>, apenas usamos  a diferença entre médias e não a estatística ''t'' criada por [[https://en.wikipedia.org/wiki/William_Sealy_Gosset| William Gosset]].
-===== O teste t de Gosset =====
-William Gosset trabalhava na cervejaria [[https://en.wikipedia.org/wiki/Guinness|Guinness]] em 1907 quando inventou o teste t.  Como havia cláusulas no contrato de trabalho que proibiam a publicação de dados da cervejaria, ele usou o pseudônimo de **Student**. Hoje o teste é conhecido como <wrap em>teste t de Student</wrap>. Esse teste está baseada na distribuição da estatística ''t'':
-A estatística ''t'' expressa o quanto que a diferença observada é maior que a variação média dos dados. Essa variação média dos dados é similar à média dos seguimentos que apresentamos no gráfico do início desse tutorial e reproduzido novamente abaixo.
-<WRAP center round box 40%>
-{{:02_tutoriais:tutorial6:desvChacal.png?400|}}
-</WRAP>
-Vamos calcular a estatística ''t''.
-<code rsplus>
-## variancias
-(varMacho <- var(macho))
-(varFemea <- var(femea))
-## residuos medios
-(resMF <- sqrt((varMacho/10)+(varFemea/10)))
-## statistica t
-(tsex  <- difsex/resMF)
-</code>
-Vamos agora calcular a probabilidade associada ao teste t, para este valor, usando a função ''pt'' da mesma forma como usamos a função ''pnorm'':
-<code rsplus>
-pt(tsex, df = 8, lower.tail = FALSE)
-</code>
-Podemos também fazer o teste usando a função ''t.test'' diretamente nos dados:
-<code rsplus>
-sexoFator <- factor(sexo, levels = c("macho", "femea"))
-t.test(chacal ~ sexo, alternative = "greater")
-</code>
-As diferenças entre o valor do ''t.test'' e o ''pt'' deve-se ao ajuste do teste para amostra pequenas. Perceba como o ''df'' (graus de liberdade) que o ''t.test'' retorna é diferente do que colocamos no ''pt''. A diferença entre o nosso teste com a diferença entre as médias e o teste t está relacionada a diferença das estatísticas utilizadas, entretanto, os resultados tendem a convergir quando as estatísticas são robustas.
-<WRAP center round todo 60%>
-Siga os [[01_curso_atual:exercicios6|exercícios 6a]] e em seguida para o [[02_tutoriais:tutorial6b:start|Tutorial de ANOVA]].
-</WRAP>

ecoR

Ferramentas do usuário

Ferramentas do site

Diferenças

Ferramentas da página