#7.2 O modelo mais simples possível library(MASS) data(Animals) str(Animals) anim.m2 <- lm(log(brain)~log(body),data=Animals, subset=!(log(Animals$body)>8&log(Animals$brain)<6)) #Agora ajuste este modelo: anim.m0 <- lm(log(brain)~1, data=Animals, subset=!(log(Animals$body)>8&log(Animals$brain)<6)) #E compare os dois: anova(anim.m0,anim.m2) #Perguntas #1. Qual a relação do comando 'anova' acima com: anova(anim.m2) # No primeiro caso fizemos anova para comparar as variancias dos desvios em relação a media, do modelo mais complexo com o nulo (ausência de efeito de qualquer preditora). No segundo caso fizemos a anova do modelo mais complexo #(para analisar a variancia dos seus desvios), o que da na mesma que o comando anterior, porque ele também compara com o modelo mais simples o possível (sem o efeito de variáveis preditoras). #Por isso os valores que apareceram na anova do modelo 2 tambem aparecerem nas comparacoes dos modelos. #2. Qual a relação entre os valores obtidos por estes comandos: summary(anim.m0) mean(log(Animals$brain[!(log(Animals$body)>8&log(Animals$brain)<6)])) sd(log(Animals$brain[!(log(Animals$body)>8&log(Animals$brain)<6)])) #Dica #Um comando mais curto para ajustar o modelo deste exercício, e que ajuda a interpretá-lo: anim.m0 <- update(anim.m2, .~. -log(body)) #Quando calculamos a media e o desvio padrao estamos calculando, respectivamente, o valor "estimate" do intercept, que #eh o "a" da equacao y=a+bx+N(0,sigma), e o desvio dos residuos da reta (sigma) calculados no summary. Isso porque estamos comparando o nosso modelo com o nulo, então o valor previsto para a variável resposta é simplesmente sua média.