Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior Próxima revisão Ambos lados da revisão seguinte | ||
02_tutoriais:tutorial6:start [2020/09/27 20:47] adalardo [Bicaudal e Unicaudal] |
02_tutoriais:tutorial6:start [2020/10/02 17:41] adalardo |
||
---|---|---|---|
Linha 5: | Linha 5: | ||
</WRAP> | </WRAP> | ||
====== 6a. Teste de Hipótese ====== | ====== 6a. Teste de Hipótese ====== | ||
+ | <WRAP center round tip 60%> | ||
+ | Video de aula síncrona gravada no google meet em 28/09/2020, não editado. | ||
+ | <WRAP center round box 40%> | ||
+ | {{youtube>8U0VDXTPR3A}} | ||
+ | </WRAP> | ||
+ | |||
+ | |||
+ | </WRAP> | ||
+ | |||
[[https://www.explainxkcd.com/wiki/index.php/882:_Significant|{{:02_tutoriais:tutorial6:significant.png?400 |}}]] | [[https://www.explainxkcd.com/wiki/index.php/882:_Significant|{{:02_tutoriais:tutorial6:significant.png?400 |}}]] | ||
- | O teste de hipótese é um instrumento poderoso para a tomada de decisão e parte fundamental do procedimento científico de experimentos. Os teste estão baseados no conceito de variável aleatória que são aquelas em que o resultado de um envento pode variar. Ou seja, quase tudo o que nos rodeia. Por exemplo, //Eucalyptus saligna// em talhão de cultivo terão uma taxas de crescimento similar, mas não exatamente a mesma. O diâmetro do tronco, após sete anos de plantio, não será o mesmo para todas as árvores. Essa variabilidade tem várias fontes, genética, ambiental ou acidental, e é inerente aos dados biológicos. O esforço no cultivo é justamente no sentido de buscar as melhores taxas de crescimento e menor variação possível, para que o resultado seja eficiente e previsível. Por isso se usa mudas provenientes de clones a partir de cultura de tecido, para controlar pelo menos essa fonte de variabilidade. No teste de hipótese partimos do fato que os dados podem variar e avaliamos se o resultado encontrado pode ter sido gerado pelo acaso e não pelo tratamento que estamos testando. No caso do //Eucalyptus// poderíamos estar interessado no efeito, por exemplo, de um tipo específico de adubo. Comparando mudas que foram colocadas em tratamentos com e sem adubo iremos, quase certamente, encontrar diferenças nos tamanhos das árvores dos dois grupos. A pergunta subjacente é: será que essa diferença encontrada poderia ter sido gerada apenas por outros fatores ou o acaso? | + | O teste de hipótese é um instrumento poderoso para a tomada de decisão e parte fundamental do procedimento científico de experimentos. Os testes estão baseados no conceito de variável aleatória, que são aquelas em que o resultado de um evento pode variar. Ou seja, quase tudo o que nos rodeia. Por exemplo, //Eucalyptus saligna// em talhão de cultivo terão uma taxas de crescimento similar, mas não exatamente a mesma. O diâmetro do tronco, após sete anos de plantio, não será o mesmo para todas as árvores. Essa variabilidade tem várias fontes, genética, ambiental ou acidental, e é inerente aos dados biológicos. O esforço no cultivo é justamente no sentido de buscar as melhores taxas de crescimento e menor variação possível, para que o resultado seja eficiente e previsível. Por isso se usa mudas provenientes de clones a partir de cultura de tecido, para controlar pelo menos essa fonte de variabilidade. No teste de hipótese partimos do fato que os dados podem variar e avaliamos se o resultado encontrado pode ter sido gerado pelo acaso e não pelo tratamento que estamos testando. No caso do //Eucalyptus// poderíamos estar interessados no efeito, por exemplo, de um tipo específico de adubo. Comparando mudas que foram colocadas em tratamentos com e sem adubo iremos, quase certamente, encontrar diferenças nos tamanhos das árvores dos dois grupos. A pergunta subjacente é: será que essa diferença encontrada poderia ter sido gerada apenas por outros fatores ou o acaso? |
Por exemplo, por sorte, poderíamos ter amostrado uma proporção de árvores que cresceram mais em um dos tratamentos e uma proporção menor no outro. Isso simplesmente por acaso! Considerando que há variação no crescimento dos indivíduos, há uma probabilidade desse padrão emergir, nesse caso, simplesmente porque fizemos uma amostra das árvores nas duas condições. O teste de hipótese é o instrumento para nos guiar nessa interpretação. | Por exemplo, por sorte, poderíamos ter amostrado uma proporção de árvores que cresceram mais em um dos tratamentos e uma proporção menor no outro. Isso simplesmente por acaso! Considerando que há variação no crescimento dos indivíduos, há uma probabilidade desse padrão emergir, nesse caso, simplesmente porque fizemos uma amostra das árvores nas duas condições. O teste de hipótese é o instrumento para nos guiar nessa interpretação. | ||
Vamos visitar estes e outros conceitos associados, utilizando as ferramentas disponíveis no R. | Vamos visitar estes e outros conceitos associados, utilizando as ferramentas disponíveis no R. | ||
Linha 23: | Linha 32: | ||
macho <- c(120, 107, 110, 116, 114, 111, 113, 117, 114, 112) | macho <- c(120, 107, 110, 116, 114, 111, 113, 117, 114, 112) | ||
- | femea <- c(110,111,107, 108, 110, 105, 107, 106, 111, 111) | + | femea <- c(110, 111, 107, 108, 110, 105, 107, 106, 111, 111) |
- | chacal <- c(macho,femea) | + | chacal <- c(macho, femea) |
- | sexo <- factor(rep(c("macho","femea"),each=10)) | + | sexo <- factor(rep(c("macho", "femea"), each=10)) |
</code> | </code> | ||
- | ===== Dois Gráfico para ver os mesmos dados ===== | + | ===== Dois Gráficos para ver os mesmos dados ===== |
Vamos avaliar esses dados graficamente. O código abaixo produz um gráfico de caixa (boxplot) e também um gráfico, pouco usual, mas que nos permite visualizar a variação que existe nos dados. Vamos usar esse tipo de representação gráfica ao longo desse tutorial. Tenha certeza que entendeu o que está representado nessa figura! | Vamos avaliar esses dados graficamente. O código abaixo produz um gráfico de caixa (boxplot) e também um gráfico, pouco usual, mas que nos permite visualizar a variação que existe nos dados. Vamos usar esse tipo de representação gráfica ao longo desse tutorial. Tenha certeza que entendeu o que está representado nessa figura! | ||
Linha 94: | Linha 103: | ||
<code rsplus> | <code rsplus> | ||
hist(chacal, freq=FALSE,xlim=c(95,125)) | hist(chacal, freq=FALSE,xlim=c(95,125)) | ||
- | curve(exp=dnorm(x, mean=mean(chacal),sd=sd(chacal)),from=95,to=125, col="red", add=T) | + | curve(exp=dnorm(x, mean=mean(chacal),sd=sd(chacal)),from=95,to=125, col="red", add=TRUE) |
</code> | </code> | ||
Linha 124: | Linha 133: | ||
<code rsplus> | <code rsplus> | ||
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
- | mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
+ | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) | ||
+ | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) | ||
+ | mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) | ||
</code> | </code> | ||
Linha 157: | Linha 169: | ||
<code rsplus> | <code rsplus> | ||
- | ## criando um objeto para guardar o numero de simulacoes | ||
nsim <- 1000 | nsim <- 1000 | ||
## criando o objeto para guardar o resultado | ## criando o objeto para guardar o resultado | ||
cenaNula <- rep(NA, nsim) | cenaNula <- rep(NA, nsim) | ||
## ciclo de iteração | ## ciclo de iteração | ||
- | for(i in 1:nsim) | + | cenaNula[1] <- difsex |
+ | for(i in 2:nsim) | ||
{ | { | ||
- | cenaNula[i] <- mean(rnorm(10, mean = mch),sd = sd(sdch)) - mean(rnorm(10, mean = mch), sd = sd(ch)) | + | cenaNula[i] <- mean(rnorm(10, mean = mch, sd = sdch)) - mean(rnorm(10, mean = mch, sd = sdch)) |
+ | |||
} | } | ||
str(cenaNula) | str(cenaNula) | ||
Linha 212: | Linha 224: | ||
str(histNull) | str(histNull) | ||
histNull$breaks | histNull$breaks | ||
- | cols <- rep(c(rgb(0, 0, 1, 0.3), rgb(1, 0, 0, 0.3)), c(11, 2)) | + | cols <- rep(c(rgb(0, 0, 1, 0.3), rgb(1, 0, 0, 0.3)), c(10, 2)) |
plot(histNull, main = "Cenário Nulo", xlab = "Diferença entre médias (mm)", ylab = "Frequência", col = cols) | plot(histNull, main = "Cenário Nulo", xlab = "Diferença entre médias (mm)", ylab = "Frequência", col = cols) | ||
abline(v = difsex, lty = 2) | abline(v = difsex, lty = 2) |