🐮 Mini trabalho de somático 🐮

VEPSomatico

Como utilizar VEP -ensembl 105.0 em um VCF somático no Colab

Introdução
Preparação do ambiente de trabalho
Utilizando o VEP

Introdução

Ensembl Variant Effect Predictor ou VEP te ajuda a determinar os efeitos das variantes encontradas nos dados a serem analisados; sendo eles genes, transcritos ou sequências proteicas. Precisando apenas das coordenadas das variantes e a mudança nucleica que foi observada.

O processo para utilização do VEP segue por:

Montar o drive no Colab
Instalar o VEP
Fazer a anotação das variantes

Preparação do ambiente de trabalho

Começar criando um novo notebook no seu Google Colab, uma vez no colab:

Montar o drive no ambiente de trabalho, que permite criar e gerenciar os dados:

from google.colab import drive
drive.mount('/content/drive')

Agora montamos um diretório específico para os documentos gerados. Utilizamos o "%%bash" para indicar ao Colab que este código está em bash e utilizamos o "%cd" para fixar esse diretório como o diretório principal:

%%bash
mkdir vepsomatico
%cd somatico

Para confirmar que o diretório que será utilizado é o que queremos, podemos usar:

%%bash
pwd

Com isso o ambiente de trabalho está preparado para receber o VEP.

Utilizando o VEP

Agora que temos nosso ambiente de trabalho preparado, podemos utilizar o próximo comando para instalar o VEP. Em ordem, cada linha do comando pode ser interpretada da seguinte forma:

Instalação dos pacotes necessários para utilizar o VEP
Fazer download do VEP na versão esembl-vep 105.0
Descompactar o documento baixado
As duas últimas linhas indicam ao colab para entrar no diretório do VEP onde foi descompactado e fazer a instalação

%%bash
sudo apt install unzip curl git libmodule-build-perl libdbi-perl libdbd-mysql-perl build-essential zlib1g-dev
wget -c https://github.com/Ensembl/ensembl-vep/archive/refs/tags/105.0.tar.gz
tar -zxvf 105.0.tar.gz
cd ensembl-vep-105.0
./INSTALL.pl --NO_UPDATE

Pronto, instalação comcluida. Podemos utilizar o código abaixo para testar se tudo ocorreu como o planejado:

%%bash
cd ensembl-vep-105.0
./vep

Por fim, com o ambiente de trabalho preparado e o VEP instalado, podemos fazer a anotação das variantes com o seguinte comando:

%%bash
/ensembl-vep-105.0/vep  \
  --fork 4 \
  -i /caminho_documento_vcf/nome_documento_vcf.vcf.gz \
  -o nome_desejado.filtered.vcf.tsv \
  --dir_cache /caminho_dir_cashe/ \
  --fasta /caminho_documento_fasta/nome_documento_fasta.fasta \
  --cache --offline --assembly GRCh37 --refseq  \
	--pick --pick_allele --force_overwrite --tab --symbol --check_existing --variant_class --everything --filter_common \
  --fields "Uploaded_variation,Location,Allele,Existing_variation,HGVSc,HGVSp,SYMBOL,Consequence,IND,ZYG,Amino_acids,CLIN_SIG,PolyPhen,SIFT,VARIANT_CLASS,FREQS" \
  --individual all

Vamos interpretar os caminhos e nomes necessários para preencher corretamente o comando acima:

em '-i' o 'caminho_documento_vcf' se refere ao caminho do diretório onde o arquivo vcf a ser analisado está localoizado e 'nome_documento_vcf' se refere ao nome do documento VCF que será analisado
em '-o' o 'nome_desejado' se refere ao nome que você deseja utilizar no output do arquivo filtrado gerado pelo VEP
em '--dir_cache' o 'caminho_dir_cashe' se refere ao caminho do diretório cashe
em '--fasta' o 'caminho

< Imagina fazer o próximo trabalho todo no github>
 -----------------------------
     \   ^__^
      \  (oo)\_______
         (__)\       )\/\
            ||----w |
            ||     ||

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🐮 Mini trabalho de somático 🐮

VEPSomatico

Introdução

Preparação do ambiente de trabalho

Utilizando o VEP

About

Releases

Packages

GuilhermeBPinheiro/VEPSomatico

Folders and files

Latest commit

History

Repository files navigation

🐮 Mini trabalho de somático 🐮

VEPSomatico

Introdução

Preparação do ambiente de trabalho

Utilizando o VEP

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages