\documentclass[a4paper, oneside, 10pt]{article} \usepackage[unicode]{hyperref} \usepackage[utf8x]{inputenc} \usepackage[english]{babel} \date{\today} \title{} \author{} \begin{document} \section{\texorpdfstring{Danilo Vicensotto Bernardo}{Danilo Vicensotto Bernardo}} \label{sec:danilo_vicensotto_bernardo} Aluno de Doutorado do Departamento de Genética e Biologia Evolutiva do Instituto de Biociências da Universidade de São Paulo. Minha pesquisa é direcionada ao estudo da diversidade morfocraniana humana e seus padrões microevolutivos. Meus interesses englobam ainda Evolução Humana, Arqueologia e Antropologia Biológica. \subsection{\texorpdfstring{meus exercícios}{meus exercicios}} \label{sec:meus_exercicios} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício1.txt}{exercicio1.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício2.txt}{exercicio2.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício3.txt}{exercicio3.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício4.txt}{exercicio4.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício5.txt}{exercicio5.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício6.txt}{exercicio6.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício7.txt}{exercicio7.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exer7.txt}{exer7.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício8.txt}{exercicio8.txt} \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/exercício9.txt}{exercicio9.txt} \subsection{\texorpdfstring{trabalho final}{trabalho final}} \label{sec:trabalho_final} \subsubsection{\texorpdfstring{Proposta A}{Proposta A}} \label{sec:proposta_a} ,,É muito comum a presença de valores faltantes (\emph{missing values}) em bancos de dados extensos, que prejudicam a aplicação de determinadas técnicas analíticas, como a Análise de Componentes Principais, por exemplo, à esses bancos. Para contornar esse problema, sem eliminar as observações que apresentam NAs, normalmente se procede a substituição desses valores por um número estimado. A estimativa desse novo número pode ser feita por diferentes critérios, como a média geral de todas as observações, a média de um determinado grupo da amostra, um valor regredido para toda a amostra ou um valor regredido para o grupo da amostra". \textbf{A proposta consiste em desenvolver uma função que opere um data.frame qualquer, destaque os NAs presentes e faça a substituição desses valores por critérios escolhidos no argumento da função.} \paragraph{\texorpdfstring{Comentários PI}{Comentarios PI}} \label{sec:comentarios_pi} Execelente problema! Muito bem dimensionado e claramente apresentado. \paragraph{\texorpdfstring{Help da função}{Help da funao}} \label{sec:help_da_funao} limpa.missing \{base\} R Documentation \begin{verbatim} Remove NA's de um data.frame \end{verbatim} Descrição: limpa.missing remove valores NA presentes em data frame, substituindo-os pela média global de cada variável do frame. Retorna os valores do data frame e produz um arquivo ,,.txt" com a nova matriz. Uso: limpa.missing(...) Argumentos: ... O Objeto (data.frame) que deve ter os valores faltantes removidos. Detalhes: O data.frame deve ser composto por nomes (ID's) na primeira coluna, seguido pelas variáveis nas colunas seguintes. Função em desenvolvimento! Author: Danilo V Bernardo danvb@ib.usp.br Referencias: Crawley, M.J. (2007). The R book. Wiley, Wiley, Imperial College London, UK. Exemplo: limpa.missing(dados) \paragraph{\texorpdfstring{Código da função}{Codigo da funao}} \label{sec:codigo_da_funao} limpa.missing $\leftarrow$ function(x) \{ \begin{verbatim} x -> mx ### cria o objeto a ser manipulado n=dim(mx)[2] ### descobre o número de colunas do objeto s=seq(2,(dim(mx)[2])) ### cria uma sequência de 2 até o número final de colunas do objeto medias_g=c("médias_geral", round(mean(mx[,s],na.rm=TRUE), 3)) ### cria um vetor contendo as médias das variáveis (colunas) independente dos grupos (geral), excluindo apenas os NAs mx -> MX for (i in s) { replace(mx[i], is.na(mx[i]), medias_g[i]) -> MX[i] MX[i] } \end{verbatim} return(MX) write.table(MX, ,,dados.txt", sep=,,\textbackslash{}t") \} \paragraph{\texorpdfstring{arquivos}{arquivos}} \label{sec:arquivos} Arquivo do help \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/help.txt}{help.txt} Arquivo do código \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/limpamissing_v1.0_.txt}{limpamissing\_v1.0\_.txt} Arquivo para teste \href{media/bie5782/01_curso_atual/alunos/trabalho_final/danvb/crandatar.txt}{crandatar.txt} \subsubsection{\texorpdfstring{Proposta B}{Proposta B}} \label{sec:proposta_b} \paragraph{\texorpdfstring{Comentários PI}{Comentarios PI}} \label{sec:comentarios_pi2} Cadê o plano B? Professores: A cabeça esvaziou (sim, sim, síndrome do Pink) mas prometo que até amanhã posto alguma coisa para o plano B, pode ser? Penso em fazer alguma função para simulação que se aplique à genética de populações. \subsection{\texorpdfstring{pensamentos}{pensamentos}} \label{sec:pensamentos} \emph{\textbf{,,Quem mexe com R não precisa de playstation"}} \end{document}