Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
| — | 05_curso_antigo:r2018:alunos:trabalho_final:willbertani:start [2020/09/23 20:16] (atual) – criada - edição externa 127.0.0.1 | ||
|---|---|---|---|
| Linha 1: | Linha 1: | ||
| + | ====== William Bertani Torres ====== | ||
| + | {{: | ||
| + | |||
| + | Mestrando em Aconselhamento Genético pelo IB-USP | ||
| + | |||
| + | O título do meu trabalho é “Sequenciamento de nova geração e sua aplicação no aconselhamento genético na Síndrome de Waardenburg” | ||
| + | |||
| + | |||
| + | http:// | ||
| + | |||
| + | |||
| + | |||
| + | [[.:exec]] | ||
| + | |||
| + | **Proposta A:** | ||
| + | |||
| + | A função irá calcular a probabilidade de nascer uma criança afetada a partir de Herança Autossomica Recessiva, utilizando-se da frequências do gene (x), levando-se em conta também os | ||
| + | possíveis cruzamentos entre genótipos heterozigotos e homozigotos. | ||
| + | |||
| + | Ao final será dado uma lista com a probabilidade para cada cruzamento, o risco final único e uma tabela exemplificando o risco em função de valores pre-estabelecidos de q e s (coeficiente de seleçao) para observar a mudança do risco de acordo com a mudança desses dois parametros. | ||
| + | |||
| + | Essa função é útil no aconselhamento genético de famílias onde há risco de ocorrencia/ | ||
| + | |||
| + | A idéia para essa função foi baseada na aula do Professor Dr. Paulo Otto, onde ele discorre sobre este assunto no livro (http:// | ||
| + | |||
| + | Planejamento da função: | ||
| + | |||
| + | Entrada: a função ira requerer a frequencia do gene e o coeficiente de seleçao. | ||
| + | |||
| + | Argumentos: | ||
| + | x = Frequencia do gene recessivo (se 1%, então x=1) | ||
| + | s = Coeficiente de seleção (varia de 0 a 1) | ||
| + | |||
| + | Pseudo – codigo: | ||
| + | |||
| + | 1- insere em “q” o valor da frequencia do gene em porcentagem (q=x/100) | ||
| + | 2- tira-se o valor de “p” a partir do valor de “q” (p=1-q) | ||
| + | 3- é adicionado as formulas para o valor adaptativo (w) e taxa de mutação (µ) (w=1-s | ||
| + | 4- a seguir são utilizadas as formulas do Professor Paulo Otto para estipular as probabilidades desejadas para cada cruzamento: | ||
| + | AA x AA = (p^4)*(µ^2) | ||
| + | AA x Aa = (2*p^3)*q*µ | ||
| + | AA x aa = 2*(p^2)*(q^2)*µ*w | ||
| + | Aa x Aa = (p^2)*(q^2) | ||
| + | Aa x aa = 2*p*(q^3)*w | ||
| + | aa x aa = q^4*w^2 | ||
| + | 5-o resultado final faz o calculo das probabilidades de haver criança afetada para cada tipo de cruzamento, fornece o risco final geral, e será gerado uma tabela exemplificando a variação do risco quando se variam os dois parametros da função. | ||
| + | |||
| + | Saída: | ||
| + | - probabilidades de haver criança afetada para cada tipo de cruzamento | ||
| + | - risco final geral | ||
| + | - tabela exemplificando a variação do risco quando se variam os dois parametros da função. | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | **Proposta B:** | ||
| + | |||
| + | A funçao irá filtrar variantes em tabelas geradas pela tecnica do sequenciamento do exoma **a partir do modo de herança** (dominante ou recessivo (0/1 e 1/1 respectivamente)) e **da localização cromossomica** (se em autossomos ou se em cromossomos sexuais). Como default, a função filtra os **tipos de mutação** mais comumente pertinentes (mutaçoes em exons e regiao de splicing). Ainda é possível filtrar a **frequencia** dessas variantes nos bancos de dados, que na funçao é representado pelo banco exac. | ||
| + | |||
| + | **Para sua utilização, | ||
| + | |||
| + | Essa função é uma versão resumida do que uma função para filtrar exoma faria, já que a tabela gerada pela técnica é muito extensa e seria inviável a sua conclusão no curto espaço de tempo disponivel pela matéria, mas demonstra que a função pode ser expandida para os outros parâmetros que utilizariam codigos muito similares, alterando-se apenas os caracteres os quais desejam-se filtrar (um exemplo disso são os diversos outros bancos de dados de frequencia, cuja filtragem seria também abaixo de 1%, logo, pouco seria alterado em termos de código para essas outras colunas). | ||
| + | |||
| + | A função é de extrema importância na busca por variantes patogênicas que expliquem quadros sindrômicos não solucionados por técnicas tanto mais simples quanto mais baratas, mas que no entanto, sua interpretação é dificultada pela grande abrangência da técnica, que retorna todas as variantes encontradas no indivíduo, inclusive as comuns não patogênicas sem relevância para a clínica. | ||
| + | |||
| + | Planejamento da função: | ||
| + | |||
| + | Entrada: a função irá requerer o nome do arquivo ou o caminho dos diretorios até o arquivo, a indentificação do que se quer filtrar quanto aos cromossomos, | ||
| + | |||
| + | |||
| + | Argumentos: | ||
| + | |||
| + | tabela: requer o nome do arquivo ou o caminho dos diretorios até o arquivo e deve estar entre áspas | ||
| + | cromossomo | ||
| + | heranca | ||
| + | exac valor a ser dado para a filtragem da frequencia das variantes nos bancos de dados (padronizado em abaixo de 1%) | ||
| + | |||
| + | Pseudo código: | ||
| + | |||
| + | 1- le o arquivo onde se encontram as variantes | ||
| + | 2- filtra a coluna cromossomo a partir de autossomico ou sexual (para autossomico, | ||
| + | 3- filtra a coluna do paciente, que indica a presença em um dos alelos (dominante 0/1) ou em ambos os alelos (recessiva 1/1) ou a ausencia (0/0) da variante. | ||
| + | 4- estabelecido como default, os tipos de mutação a serem filtradas são as mutações que ocorrem em exons e em região de splicing. | ||
| + | 5- a filtragem da frequencia das variantes nos bancos de dados também está estabelecida em abaixo de 1%, mas a função permite que esse valor seja alterado quando a função é requisitada | ||
| + | |||
| + | Saída: | ||
| + | |||
| + | Tabela com as linhas que preenchem os critérios de filtragem estabelecidos. | ||
| + | Referencia: | ||
| + | |||
| + | ERGUN, M. A new method for analysis of whole exome sequencing data (SELIM) depending on variant prioritization. Informatics in Medicine Unlocked 8 (2017) 51-53. | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | <WRAP center round box 60%> | ||
| + | |||
| + | Achei a proposta A simples demais, e também não entendi como ela pode ser generalizável para vários tipos de usuários. | ||
| + | |||
| + | Meu conselho é que vc torne o plano A mais amplo (por exemplo, fornecendo opções de mais análises e interpretações -que vão exigir manipulações diferentes e mais complexas -, mas que sejam relevantes aos mesmos usuários e que usem dados parecidos ou os mesmos) e apresente algum plano B, que está ausente no arquivo .otf que vc lincou em sua wiki. | ||
| + | |||
| + | É muito importante também que você poste seus planos diretamente na wiki, e não na forma de um arquivo .otf (cheque a página do [[http:// | ||
| + | |||
| + | Para ajudar um pouco mais nesse detalhamento, | ||
| + | |||
| + | Matheus Januario | ||
| + | </ | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | **Trabalho final** | ||
| + | |||
| + | Minha função > <code rsplus> #tabela de exemplo | ||
| + | tabela <- data.frame(" | ||
| + | tabela[7, | ||
| + | tabela[8, | ||
| + | write.table(tabela, | ||
| + | |||
| + | |||
| + | filtrar = function(tabela, | ||
| + | { | ||
| + | #warning para input correto do nome do arquivo e consequente leitura | ||
| + | if(typeof(tabela) != " | ||
| + | tabela <- read.table(tabela) | ||
| + | #warning para input correto dos argumentos | ||
| + | if(cromossomo != " | ||
| + | | ||
| + | | ||
| + | #filtrando o cromossomo | ||
| + | if(cromossomo == " | ||
| + | tabela = tabela[tabela$cromossomo %in% 1:22, ] | ||
| + | } else { | ||
| + | tabela = tabela[tabela$cromossomo == " | ||
| + | } | ||
| + | | ||
| + | | ||
| + | #warning para input correto dos argumentos | ||
| + | if(heranca != " | ||
| + | | ||
| + | | ||
| + | #filtrando a heranca (se a variante esta presente no paciente em um alelo ou em ambos) | ||
| + | if(heranca == " | ||
| + | tabela = tabela[tabela$paciente == " | ||
| + | } else { | ||
| + | tabela = tabela[tabela$paciente == " | ||
| + | } | ||
| + | | ||
| + | | ||
| + | | ||
| + | #### | ||
| + | | ||
| + | #filtrando o tipo de mutaçao | ||
| + | tabela = tabela[tabela$mutacao == " | ||
| + | | ||
| + | | ||
| + | #filtrar exac | ||
| + | | ||
| + | tabela = tabela[tabela$exac <= exac | is.na(tabela$exac), | ||
| + | |||
| + | |||
| + | return(tabela) | ||
| + | | ||
| + | } | ||
| + | |||
| + | filtrar(tabela = " | ||
| + | </ | ||
| + | |||
| + | Help da função > <code rsplus> | ||
| + | modelo | ||
| + | |||
| + | Função para filtrar variantes possivelmente patogênicas em arquivos de Exoma | ||
| + | |||
| + | Description: | ||
| + | |||
| + | A função filtra as variantes de arquivos de exoma baseando-se pela variável de a doença ser ligada aos cromossomos autossomicos, | ||
| + | |||
| + | |||
| + | Usage: | ||
| + | |||
| + | | ||
| + | |||
| + | Arguments: | ||
| + | |||
| + | tabela: requer o nome do arquivo ou o caminho dos diretorios até o arquivo e deve estar entre áspas | ||
| + | cromossomo | ||
| + | heranca | ||
| + | exac valor a ser dado para a filtragem da frequencia das variantes nos bancos de dados (padronizado em abaixo de 1%) | ||
| + | |||
| + | Value: | ||
| + | |||
| + | | ||
| + | Na filtragem, o valor dos bancos de dados (exac) podem ser alterados, para permitir que fariantes com frequencias mais altas também apareçam na filtragem, caso desejado. | ||
| + | |||
| + | |||
| + | Warning: | ||
| + | |||
| + | É exibido um warning para que o nome correto do arquivo a ser filtrado seja colocado de forma correta na função. | ||
| + | Outros dois warnings podem surgir caso os argumentos para cromossomo e herança sejam digitados de forma errônea. | ||
| + | |||
| + | |||
| + | |||
| + | Author(s): | ||
| + | |||
| + | | ||
| + | e-mail: wiilliiam@hotmail.com | ||
| + | |||
| + | |||
| + | References: | ||
| + | |||
| + | ERGUN, M. A new method for analysis of whole exome sequencing data (SELIM) depending on variant prioritization. Informatics in Medicine Unlocked 8 (2017) 51-53. | ||
| + | |||
| + | Examples: | ||
| + | |||
| + | | ||
| + | | ||
| + | | ||
| + | filtrar(tabela = " | ||
| + | |||
| + | |||
| + | </ | ||