##Galileu estava Certo? Partindo do tutorial Ajuste de Polinômios, avalie se um polinômio de terceiro grau é um melhor modelo para descrever os dados do experimento de Galileu. A equação para este modelo é: init.h=c(600,700,800,950,1100,1300,1500) h.d.=c(253,337,395,451,495,534,573) init.h h.d. plot(h.d.~init.h) ## tende a uma assíntota modelo.1= lm(h.d.~init.h) modelo.2= lm(h.d.~init.h+I(init.h^2)) modelo.3= lm(h.d.~init.h+I(init.h^2)+I(init.h^3)) modelo.1 modelo.2 modelo.3 anova(modelo.1) anova(modelo.2) anova(modelo.3) summary(modelo.1) summary(modelo.2) summary(modelo.3) anova(modelo.1,modelo.2,modelo.3) anova(modelo.1,modelo.2) ##Quanto mais aumenta o grau melhor os dados são descritos? modelo.4= lm(h.d.~init.h+I(init.h^2)+I(init.h^3)+I(init.h^4)) anova(modelo.4) summary(modelo.4) ##Até o terceiro grau isso parece ser verdade Resposta: O polinômio de terceiro grau parece ser o melhor modelo para descrever os dados de Galileu ###Massa de Recém-Nascidos Experimente todas as variáveis disponíveis no conjunto de dados Massa ao Nascer e Dados da mãe para chegar ao melhor modelo de previsão da massa de bebês ao nascer. Antes de começar elimine as observações com dados faltantes ,veja na descrição do arquivo. getwd() bebes=read.table("baby.csv",as.is=T,sep=",",header=T) head(bebes) summary(bebes) str(bebes) tail(bebes) summary(bebes) bebes$gestation[bebes$gestation==999]=NA bebes$bwt[bebes$bwt==999]=NA bebes$parity[bebes$parity==9]=NA bebes$smoke[bebes$smoke==9]=NA bebes$weight[bebes$weight==999]=NA par(mfrow=c(3,2)) anova(lm(bwt~gestation,data=bebes)) plot(bebes$bwt~bebes$gestation) anova(lm(bwt~parity,data=bebes)) plot(bebes$bwt~bebes$parity) anova(lm(bwt~age,data=bebes)) plot(bebes$bwt~bebes$age) anova(lm(bwt~height,data=bebes)) plot(bebes$bwt~bebes$height) anova(lm(bwt~weight,data=bebes)) plot(bebes$bwt~bebes$weight) anova(lm(bwt~smoke,data=bebes)) plot(bebes$bwt~bebes$smoke) anova(lm(bwt~age,data=bebes)) plot(bebes$bwt~bebes$age) par(mfrow=c(1,1)) ##Pode ser: par(mfrow=c(3,2)) plot(bebes$bwt~bebes$gestation+bebes$height+bebes$weight+bebes$smoke) par(mfrow=c(1,1)) modelo.1=lm(bwt~gestation+height+weight+smoke,data=bebes) ##resíduos anova(modelo.1) summary(modelo.1) plot(modelo.1) ## A idade e o peso da gestante parece não importar; parity e o fato da gestante ser ou não fumante explicam parte da variação. Há ainda uma variação residual não explicada.