Traduções desta página:

Ferramentas do usuário

Ferramentas do site


05_curso_antigo:r2016:alunos:trabalho_final:luizgualmeida:propostas

Propostas de trabalho final

Proposta A: Função Impeachment

“Inspirado” pelos acontecimentos de domingo eu gostaria de criar uma função que gerasse uma tabela a patir dos seguintes vetores:

Nome dos deputados: Voto: sorte de “sim” ou “não” Justificativa dos votos: esse vetor será gerado pela função sort em dois vetores que tenha uma combinação de palavras. Exemplo:

	“Pela” , “minha porca Pepa”
	“Contra” “uva-passa na comida”
	“A favor” “belas, recatadas e do lar”

A função conta os votos e se forem maior que 2/3 do número de deputados, retorna o resultado e uma lista dos motivos que votaram a favor e dos que votaram contra.

Se os resultados forem menor que 2/3 do número de deputados, retorna para o usuário colocar o argumento “influencia = TRUE”, que aumentara a proporção de sair mais “sim” do que “não” no sort dos votos.

Comentários Renata Orofino

Luiz, entendo a motivação, mas não sei se entendo a função. Me ajude a entender, ok?
  • O vetor com os nomes dos deputados será criado por você, ou você vai puxa-lo de algum site/tabela?
  • A ideia é que sejam atribuídos 'sim' ou 'não' para cada deputado aleatoriamente?
  • O vetor Justificativa dos votos será baseado nas justificativas dadas, ou será inventado? Também não ficou claro se você vai entrar com esses dados ou puxa-los de algum site.
  • Agora a dúvida mais geral é: temos o ocorrido, vc precisa de uma função para recalcular, ou bastaria escrever esse script uma vez?

Olá Renata,

A lista vai ser baixada daqui Lista Deputados A justificativa vai ser baseada nas justificativas verdadeiras retiradas daqui: Lista Justificativa. A ideia é dar um sort nessa lista para gerar mais justificativas. Pensando um pouco mais na função, pensei em retornar também a porcentagem de votos por estado. Talvez esteja simples de mais mesmo.

Comentários Renata Orofino

Ela pode ficar mais divertida…
Dá pra achar informações sobre os tipos de justificativa por grupos específicos (estado,gênero,religião) e gerar sorteios que se mantém fieis aos tipos de justificativa indicados realmente. Assim vc não corre o risco de indicar que uma deputada hetero mandou um beijo pra esposa, por exemplo.
Se influencia==TRUE, as justificativas serão selecionadas dentro do pool geral? Seria melhor que para um voto “sim” fossem buscadas apenas justificativas dadas pelo “sim”, concorda? Senão teríamos alguém usando uma justificativa 'Bolsonaro like' para votar “não” (bastante bizarro).
Por fim, eu tendo a achar a B mais legal, mas apenas pq ela é mais científica. Para que as funções sejam um desafio pra vc, vc precisa pensar nas dicas informadas pra deixa-las mais bacanudas. Veja o que escolhe e bom trabalho. Se precisar de ajuda, escreva: renata.orofino@gmail.com Abs.

Proposta B: Resistência a antibióticos

Criar uma função que pega os dados de resistência a antibióticos gerados no site http://ecdc.europa.eu/en/healthtopics/antimicrobial_resistance/database/Pages/table_reports.aspx

E compara os dados de consumo de antibióticos com as tabelas geradas no site http://ecdc.europa.eu/en/healthtopics/antimicrobial_resistance/esac-net-database/Pages/database.aspx

Plotar gráficos e se possível gerar modelos lineares.

Exemplo de funcionalidade: Compara o consumo do antibiótico “X” na Alemanha desde 1998 até 2014, com a resistência desse mesmo antibiótico pela bactéria “Y” no mesmo período.

Plota gráficos e modelos lineares.

Comentários Renata Orofino

Achei a ideia promissora, mas vamos entender melhor os elementos a serem trabalhados na função.
  • Quais os argumentos dados pelo usuário ao chamar a função?
  • Você quer comparar os dados de resistência do organismo Y a um antibiótico e o consumo do mesmo antibiótico no país? Qual(is) das 5 tabelas será(ão) usada(s)?
  • O gráfico plotado é resistência(no ano x, país z) por consumo (no ano x, país z)?
  • A hipótese por trás da história é que qto maior o consumo, maior terá sido a resistência ao antibiótico?

Pensei em armazenar as tabelas em um e no help da função pedir para que o usuário carregasse a tabela. Os argumentos seriam:

  • Tabela de resistência e tabela de consumo
  • Organismo
  • Antibiótico
  • País
  • Período: Ano x até Ano y

Eu quero comparar a resistência a um antibiótico “y” de uma bactéria “z” ao longo de “x” anos pelo consumo do mesmo antibiótico “y” em um determinado país. O gráfico plotado seria ano no eixo x e consumo e resistência em dois eixos y. A hipótese é que, no decorrer dos anos o aumento no consumo de antibióticos, aumentou a resistência das bactérias aos antibióticos. Verificar para qual antibiótico e qual bactéria isso ocorre.

Comentários Renata Orofino

A vantagem de usar as bases de dados direto do site é que você se mantém atualizado a cada inserção de dados na tabela original. É possível pegar os dados direto da fonte.
Os produtos da função parecem muito simples. Ideias para incrementa-la:
  • Com base em seu modelo linear construído, prever os valores de resistência para um consumo indicado pelo usuário no início da função,
  • Comparação entre organismos suscetíveis ao mesmo antibiótico.
  • Comparação entre dois países
  • Comparação entre um organismo e todos os antibióticos aos quais ele é suscetível (mesmo que o usuário não saiba todos, no que ele coloca sim em um argumento indicado na função, isso retorna para ele.
  • Se o usuário nao sabe para quais antibióticos o organismo é suscetível, sua função poderia contar pra ele?

Proposta C: Função compara

Criar uma função que compare o melhor modelo linear automaticamente. Como no exemplo dos dados de poluição, em vez de comparar um modelo de cada vez com o modelo anterior, automatizar tudo e retorna o melhor modelo e todos os testes feitos com os resultados da função ANOVA.

Comentários Renata Orofino

Achei essa proposta menos interessante que a anterior. Qual o desafio que ela te impõe?
  • Quais são os argumentos dessa função?
  • Que tipo de vetor ela aceita?
  • Eu posso escolher quais os modelos que eu quero comparar?
  • Como indicar qual é a variável resposta?

Na aula de comparações de modelos lineares com diversos elementos que poderiam estar afetando a variável resposta, nós fizemos as comparações sempre analisando o modelo anterior. Pensei em automatizar essa tarefa.

Os argumentos seriam o vetor que tenha pelo menos 3 variáveis preditoras e uma variável resposta. Outro argumento seria o teste a ser feito. Bicaudal ou unicaudal.

No help da função eu pediria para que a variável resposta sempre fosse colocada na primeira coluna da tabela.

Comentários Renata Orofino

Não acho que vale a pena investir nessa. Vai ser facinho e sem graça de brincar com ela…

Olá Luiz,

Sobre as propostas: A é divertida mas precisa considerar os comentários da Rena. B é legal e viável. C é muito simples. Se for continar com a A, você precisa pensar melhor em como seria o sample. Entendo a motivação de misturar tudo com tudo, mas pode ficar mais legal se for um sample dentro de categorias (bancada religiosa, ruralistas, simpatizantes de militares, governistas, esquerda…). Ainda assim, parece simples demais e mais interessante pelo tema do que pela função em si. A proposta B é bem interessante e implementar para a função fazer a busca no site é sempre algo elegante. Combinar isto com as análises da eficácia do antibiótico é muito legal. Recomendo persistir com esta proposta! — Sara

05_curso_antigo/r2016/alunos/trabalho_final/luizgualmeida/propostas.txt · Última modificação: 2020/08/12 06:04 (edição externa)