Ferramentas do usuário

Ferramentas do site


05_curso_antigo:r2019:alunos:trabalho_final:israelneto:start

Israel L. Cunha Neto

alta-82.jpg

Doutorando em Botânica na Universidade de São Paulo (IB-USP), atua na área de Anatomia Vegetal com ênfase na diversidade e evolução do sistema vascular caulinar em plantas vasculares. Atualmente realiza estudos com a família Nyctaginaceae, simbolizada pela “primavera”, espécies do gênero Bougainvillea.

Em Anatomia Vegetal, muitos dos resultados são apresentados através das fotomicrografias. Veja um exemplo em anexo. fotomicrografia_israel_l._cunha_neto.pdf

http://lattes.cnpq.br/4464035824316701

https://www.researchgate.net/profile/Israel_Cunha_Neto2

Exercícios

script_exercicio_1-3.r

exercicios_4_israel_l._cunha_neto.r

5.1_editando_alguns_parametros_graficos_israel.r

7.2_o_modelo_mais_simples_possivel.r

exercicios_regressao_multipla.r

exercicios_8._reamostragem_e_simulacao.r

exercicio_9.r



Trabalho Final: Criando Uma Função


PLANO A: Prospectando o dimorfismo de vasos

Contextualização

Em Anatomia Vegetal, o dimorfismo de vasos é uma característica da madeira (xilema secundário) e pode ser definida como a coocorrência de elementos de vaso de pequeno e de grande calibre (diâmetro) em uma mesma amostra (Carlquist, 1985). Essa característica é encontrada especialmente em caules de lianas (ou trepadeiras) que podem ter vasos variando de <10 µm à >500 µm – enquanto plantas autossuportantes (e.g., arbustos e árvores) comumente não apresentam dimorfismo e possuem uma menor variância nos diâmetros de vasos, exceto para espécies com anel poroso. Na literatura, diferentes estratégias têm sido utilizadas para tentar expressar o dimorfismo de vasos de forma matemática. As metodologias utilizadas até o presente podem ser classificadas da seguinte forma: a) divisão arbitrária em classes de diâmetros, usualmente uma de 0>50 µm e a outra de >50 µm (Pace & Angyalossy, 2013; Gerolamo & Angyalossy, 2017); b) separação em uma ou duas classes de diâmetro dado se as distribuições de frequência são (aparentemente) uni- ou bimodais (Pelissari et al., 2018); c) caracterização da amplitude de diâmetro de vasos expresso pela razão do diâmetro máximo pelo diâmetro mínimo (DVmax/DVmin) em cada espécie, associado à um teste estatístico de uni ou multimodalidade (Gerolamo & Angyalossy, 2017). Diante desse cenário, podemos considerar que a integração dos diferentes métodos já utilizados seja uma maneira de facilitar a compreensão dos dados e a tomada de decisão sobre a presença do dimorfismo de vasos quando analisado de forma quantitativa. Além disso, é válido considerar cenários em que o dimorfismo possa ser analisado em estudos evolvendo espécies com diferentes hábitos. Desse modo, a função aqui proposta tem como objetivo otimizar a análise da variação de dimorfismos de vasos e/ou caracteres similares (e.g., comprimento de vasos, espessura das fibras).

Planejamento da função

Entrada: vessel.dimorfism (Dados, …)

Onde: Dados = um data.frame com as espécies e hábitos discriminados nas colunas e as observações nas linhas (classe: numeric, com 2 casas decimais);

Pressupostos: O número de observações (N) deveria ser ≥ 30;

Verificando os parâmetros:

1.O número de observações é ≥ 30? Se não, escreve: “O número de observações deveria ser ≥ 30”.

2.Os dados são numéricos? Se não, escreve: “Os dados precisam ser números.”

Argumentos:

graphics = se True, retorna o histograma com as informações associadas plotadas no graáfico; se False, o histograma não é apresentado e a função retorna somente o sumário com os valores;

habits = se True, indica que existem espécies de diferentes hábitos, retornando um teste de médias entre as espécies ao final.

Pseudo-código:

  1. Abre o arquivo de ‘dados’
  2. Indexa as colunas para análises individuais por espécie
  3. Carrega o pacote dip.test
  4. Calcula o dip.test
    1. Se significativo para multimodalidade, divide as observações em classes (0>50 µm e >50)
      1. Utiliza a função summary
      2. Calcula as médias do 1º e 3º quartis, e calcula o IDV
    2. Se unimodal, realiza as demais análises para uma única classe
      1. Utiliza a função summary
      2. Calcula as médias do 1º e 3º quartis, e calcula o IDV
  5. Se houver diferentes hábitos (habits = True), realizar um teste de médias para comparar as diferentes espécies
  6. Construir um diagrama para plotar o histograma e demais informações
  7. Fazer o histograma
  8. Plotar as informações do dip.test e IDV no histograma
  9. Construir o data.frame contendo o sumário dos resultados incluindo valores máximo, mínimo, média, desvio, dip.test (“D”, e p-value), IDV.
  10. Construir um data.frame contendo o sumário dos resultados do IDV e o teste de médias associado.

Saída:

a)Uma lista incluindo:

  1. Histograma com a distribuição dos diâmetros de vasos para cada espécie; o valor do Índice de Dimorfismo de Vasos (IDV) e o valor ‘D’ e p-value do dip.test serão plotados no histograma.
  2. Um sumário (=data.frame) listando os valores mínimo, máximo, médio e desvio-padrão para cada classe de diâmetro; incluindo também os valores do IDV e os valores do dip.test com o teste de significância associado.
  3. Quando houver espécies com diferentes hábitos, e o usuário optar por essa possibilidade, retornar também um sumário (=data.frame) listando os valores mínimo, máximo, médio e desvio-padrão para cada espécie, e um teste de médias comparando o IDV.

Referências

Carlquist, S. 1985. Observations on functional wood histology of vines and lianas: vessel dimorphism, tracheids, vasicentric tracheids, narrow vessels, and parenchyma. Aliso, 11: 139–157.

Gerolamo, C.S & Angyalossy, V. 2017. Wood anatomy and conductivity in lianas, shrubs and trees of Bignoniaceae. IAWA J., 38: 412–432.

Pace, M.R. & Angyalossy, V. 2013. Wood evolution: a case study in the Bignoniaceae. International Journal of Plant Sciences, 174: 1014–1048.

Pellissari, L.C.O., Barros, C.F., Medeiros, H. & Tamaio, N. 2018. Cambial patterns of Paullinia (Sapindaceae) in southwestern Amazonia, Brazil. Flora, 246-247: 71–82.


PLANO B Anatomia e hidráulica de plantas: o que correlaciona com o que?

Contextualização

O estudo da diversidade morfológica dos organismos a partir de duas ou mais características qualitativas é sempre desafiador do ponto de vista da explicação biológica. Na botânica, os pesquisadores comumente analisam uma série de caracteres morfológicos e anatômicos, principalmente relacionados ao xilema e floema secundários, o que lhes permite fazer inferências sobre diferentes aspectos da morfologia, hidráulica, biomecânica e fisiologia das plantas. Nesses estudos, as análises multivariadas são muito importantes para descrever de maneira resumida o conjunto de dados, sendo a “Principal Component Analysis (PCA)” a mais simples e mais amplamente utilizada a fim de resumir o conjunto de dados em um número menor de variáveis, possibilitando assim identificar características possivelmente correlacionadas e determinar o quanto da variação é explicada por elas. Uma outra abordagem utilizada são as regressões, na qual é utilizado variáveis preditoras para explicar a variação de uma variável resposta. Nesses casos, pode-se predizer uma variável resposta ‘Y’ em função de uma variável preditora ‘X’ (regressão simples), ou mesmo a partir de três ou mais estimadores (regressão múltipla). Assim, a integração entre essas diferentes metodologias é uma forma de ampliar o modo pelo qual os dados podem ser explicados de forma matemática e, para tanto, análises recorrentes são realizadas para avaliar como a interação de características do xilema e floema podem responder perguntas sobre a biologia de plantas vasculares. Esta proposta tem como objetivo integrar as duas metodologias em uma única função, a fim de otimizar as análises de dados em investigações que buscam identificar correlações entre características anatômicas do xilema e floema secundários e os distintos hábitos das plantas. A ideia é realizar uma análise de PCA com dados anatômicos e, a partir dos dados de autovalores dos eixos da PCA com valor maior do que 1 de autovetor, ou seja, que explicam a maior quantidade de variação dos dados, relacionar com os dados de condutividade hidráulica através de uma regressão linear simples ou múltipla.

Planejamento da função

Entrada: hidraulica (Dados,…)

Onde:

Dados = um data.frame com as observações dos diferentes caracteres para vários indivíduos.

Pressupostos:

  1. O número de observações (N) deve ser ao menos 5 vezes maior que o número de variáveis.

Verificando os parâmetros:

  1. As variáveis são quantitativas (= numeric)? Se não, escreve: “As variáveis devem ser quantitativas do tipo “numeric”.
  2. O número de observações é ao menos 5 vezes maior que o número de variáveis? Se não, escreve: “O número de observações deve ser ao menos 5 vezes maior que o número de variáveis”.

Pseudo-código:

  1. Organiza os dados para realizar o PCA
    1. Indexa os valores das variáveis anatômicas a partir do data.frame
    2. Normaliza os dados
    3. Exclui os NA
    4. Faz a PCA (utilizando covariância)
      1. Gera a tabela resumida de eigenvector e autovetores para os eixos com eigenvector superior a 1
      2. Constrói argumento para apresentar ou não o bitplot (eixo 1 x eixo 2)
  2. Organizar dados para Regressão
    1. Construção de um data.frame com os respectivos autovalores de cada amostra para cada um dos eixos da PCA (eigenvector superior a 1)
    2. Inclusão dos valores de condutividade hidráulica (variável funcional) no data.frame
    3. Relaciona os autovalores de cada eixo da PCA com dados de hidráulica através de regressão simples ou múltipla
    4. Análise dos resíduos do modelo (normalidade e homocedasticidade).
  3. Criar gráficos simples ou parcial da regressão

Saída:

  1. Uma lista contendo:
    1. Um sumário (data.frame) com os dados de de eigenvector e autovetores para os eixos com eigenvector superior a 1;
    2. Bitplot (eixo 1 x eixo 2)
    3. Gráficos simples ou parcial da regressão, caso não tenha normalidade e homogeneidade de variância, escreve “modelo não se adequa aos pressupostos de normalidade e homogeneidade de variância)

Olá Israel

Sua proposta A é interessante, mas eu tenho algumas perguntas:

1. não entendi onde entra a informação sobre o calibre dos vasos.

2. Como o data.frame terá informações sobre as espécies E os hábitos nas colunas?

3. Não entendi o que é o dip.test

Tenho também duas sugestões sobre a proposta A:

1. eu sugiro que vc use o formato “long” de armazenamento de dados. Assim para cada observação o input teria uma coluna sobre o calibre, uma sobre a o hábito (no mínimo) e uma sobre a espécies.

2. Tbm sugiro que a função decida sozinha (através dos dados “inputados”) se as espécies tem mais de um hábito, o que torna desnecessário a inclusão do argumento “habits”

Pelo que entendi de sua proposta B (corrija-me se eu estiver errado, por favor) essa proposta não parece usar muito do controle de fluxo (que e necessário para a função do trabalho da disciplina). Se entendi bem, só há controle de fluxo (uso de “if” “for”, “while”… etc) durante a verificação dos inputs.

Será que não é possível incluir mais opções de controle de fluxo na proposta?

De qualquer forma, acredito que sua proposta A está bem perto de estar adequada à proposta do trabalho (tente ver a possibilidade de fazer as inclusões que eu pedi) e portanto acho que é tranquil você começar por ela. A proposta B talvez precisaria de mais

Se quiser conversar mais sobre as funções (ou pedir conselhos, dicas etc) é só escrever aqui que pretendo revisar esta página dia 20/06. Vc tbm pode me mandar uma mensagem por whatsapp (11) 9-9199-3842.

Matheus Januario

Olá Matheus, Por mim tudo bem seguir com a proposta A. Sobre suas dúvidas:

1 e 2 - Mudei a forma de apresentar os dados de acordo com a sua sugestão 1. Acho que responde as suas dúvidas 1 e 2. Veja abaixo.

3- O dip.test é uma função já existente. Ele realiza um teste para saber se o conjunto de dados tem uma ou mais modas. Pretendo incorporar essa função pra me dar esse resultado e a partir disso a função decide se faz as outras analises para uma classe de diâmetro ou duas.

Sobre as sua sugestões:

1- Com a sua sugestão, os dados estariam organizados como na figura abaixo, correto?

capture.png

2- Concordo, vou fazer isso.

Obrigado pelas sugestões. Aguardo sua confirmação das modificações.

Olá Israel, entendi suas respostas e com as novas implementações acho que sua função está adequada ao esperado pela disciplina, assim acho que você tem um bom plano para a aexecução da proposta A.

Boa sorte e bom trabalho nessa etapa final da disciplina

Matheus Januario

Trabalho Final

Função vessel.dimorfism funcao_vessel.dimorfism.r

Help função: vessel.dimorfism help_funcao_vessel.dimorfism.r

05_curso_antigo/r2019/alunos/trabalho_final/israelneto/start.txt · Última modificação: 2020/08/12 06:04 (edição externa)