====== Exercícios de Leitura e Manipulação de Dados ====== ===== Distância entre cidades ===== Releia((pois você sempre lê o capítulo correspondente da apostila antes de fazer os exercícios ;- )) o tópico sobre matrizes na [[bie5782:03_apostila:04-dados#entrada_de_dados_diretamente_no_r|seção sobre entrada de dados]] da apostila online. Abaixo as distâncias por estradas entre quatro cidades da Europa, em quilômetros: * Atenas a Madri: 3949 * Atenas a Paris: 3000 * Atenas a Estocolmo: 3927 * Madri a Paris: 1273 * Madri a Estocolomo: 3188 * Paris a Estocolmo: 1827 - Construa uma matriz de distâncias com esses valores. - Compare sua matriz com o objeto ''eurodist'', disponível no pacote ''datasets''. **DICA:** as funções ''lower.tri'', ''upper.tri'' e ''diag'' podem lhe ajudar. ===== Criação de um data frame ===== Imagine um experimento em que hamsters de dois fenótipos (claros e escuros) recebem três tipos diferentes de dieta, e no qual as diferenças dos pesos (g) entre o fim e o início do experimento sejam: | ^ DIETA A ^ DIETA B ^ DIETA C ^ ^CLAROS| 0.1 , 1.1 , 3.7 | 5.7, -1.2, -1.5 | 3.0, -0.4, 0.6 | ^ESCUROS| 1.5, -0.1, 2.0 | 0.6, -3.0, -0.3 | -0.2, 0.3, 1.5 | - Crie um //data frame// com esses dados, na qual cada hamster seja uma linha, e as colunas sejam as variáveis cor, dieta e variação do peso. - Qual a media por dieta e por fenótipo? **DICA:** Use as funções de gerar repetições para criar os vetores dos tratamentos. ===== Criando uma Matriz ==== - Crie um objeto da classe matriz com 5 colunas e 3 linhas contendo uma amostra de uma distribuição normal de média 10 e variância 3,6. - Mude os nomes das linhas para "L1" a "L3" e das colunas para "C1" a "C5". **Dica**: A função [[http://finzi.psych.upenn.edu/R/library/base/html/paste.html|paste]] combinada com funções de repetições podem lhe poupar trabalho. - Calcule a média e a variância por colunas e depois por linhas. Guarde os resultados em um //dataframe// , cujas colunas são a média e a variância de cada subconjunto dos dados. ===== Lendo e Salvando seus dados ===== - Leia um arquivo de dados de sua autoria e faça um sumário das variáveis independentes. Caso tenha variáveis qualitativas faça tabelas de contagem para cada uma e duas a duas. Caso não tenha dados, poderá ir a campo ou utilize alguns dos dados da área [[dados:start|Arquivos de dados]] do nosso wiki LOL. **Dica:** veja o help da função //read.table()// - Faça uma seleção de um estado de atributo de um vetor fator dos seus dados e salve em um objeto (uma espécie, uma localidade...), mantendo o objeto original intacto. Em seguida selecione apenas três colunas no objeto resultante e salve em um arquivo de formato .txt, separado por tabulação e sem nome de linhas. Lembre-se de olhar o help antes de surtar! Para verificar se o arquivo está correto abra-o no EXCEL, //URGG!// ===== Classes de Objetos ===== O pacote "datasets" contém vários conjuntos de dados para uso em treinamento com a linguagem R. O conjunto "iris" é distribuído de duas formas diferentes, nos objetos ''iris'' e ''iris3''. São quatro medidas de flores de três espécies de //Iris// (Iridaceae). - Quais são as classes desses dois objetos? - Calcule a média de cada uma das quatro medidas por espécie, dos dois objetos. **DICAS:** as funções da família ''apply'' e a função ''by''irão te ajudar. - Os nomes das variaveis estão em inglês. Mude-os para português no objeto ''iris''. **DICA:** Como tudo mais no R, os resultados da função ''names'' podem ser armazenados em um objeto. ===== Acrescentando Dados de Síntese ===== - Crie um objeto com os dados do arquivo-texto [[dados:dados-esaligna|Biomassa de Árvores de Eucalyptus saligna]]. - Verifique o conteúdo do objeto resultante, com a função ''summary''. - Acrescente uma nova coluna ao data frame resultante, com a soma das biomassas de folhas e do tronco de cada árvore. - Acrescente outra coluna, com o valor da área basal de cada árvore. - Calcule a área basal total por talhão e salve em um objeto - Calcule a média da área basal por talhão - Selecione apenas os dados relativos à árvores com mais de 10 cm de diâmetro - Salve em um arquivo //txt//, separado por tabulação. UFA!8-O