Dados de monitoramento da pandemia COVID-19 no Brasil, fornecidos pelo Ministério da Saúde no site http://plataforma.saude.gov.br/novocoronavirus/.
O script (Python/Jupyter Notebook) baixa os dados com a série histórica do Ministério de Saúde das informações relativas ao coronavírus no Brasil. Isto é feito acessando os dados da Plataforma Integrada de Vigilância em Saúde (IVIS) deste órgão. Através da interface do site disponibilizada ao usuário, só é possível ter acesso aos dados do dia atual.
Os dados são armazenados dentro de um arquivo JavaScript (.js
). O script os transforma para .json
e então converte em um CSV.
Para facilitar a interpretação dos dados, é adicionada uma coluna, baseada no arquivo indice.csv
, com a sigla da UF correspondente ao campo identificador (uid
) assinalado no banco original.
O arquivo é exportado no formato CSV, com a data de execução do script.
Atenção: Todos os dados relativos aos casos são extraídos do site do Ministério da Saúde. Não nos responsabilizamos por eventuais erros e inconsistências. Sempre confira e cheque seus dados, através do site da IVIS ou caches do Web Archive.
Os dados em formato aberto podem ser acessados na pasta dados
.
A base de dados corona-br
é disponibilizada sob a licença Open Database License: http://opendatacommons.org/licenses/odbl/1.0/.
É possível realizar a validação contínua dos dados extraídos através do Goodtables. No dia 16 de março, por exemplo, existiam 15 registros duplicados.
O CSV é composto das colunas abaixo:
- uid = Número de identificação da UF
- suspects = Casos suspeitos
- refuses = Descartados
- confirmado = A coluna não é utilizada até o momento
- deads = Mortes
- local = Aparentemente, não é utilizada. Vide as observações.
- cases = Casos confirmados
- comments = Comentário sobre os dados (Ex: "Transmissão comunitária no município do Rio de Janeiro" ou "1 Portador assintomático")
- broadcast = ?
- date = Data de registro dos dados (%dd/%mm/%yyyy)
- time = Hora do registro dos dados (%hh:%mm)
- uf = Coluna adicionada pelo script, com a sigla da UF
Dentro da pasta do projeto, crie um abiente virtual com o comando
python3 -m venv env
Ative o ambiente virtual:
source env/bin/activate
Instale as dependências no seu ambiente Python usando o comando
pip install -r scripts/IVIScraper/requirements.txt
Só é necessário fazer isso uma única vez, exceto se o arquivo
requirements.txt
for alterado.
Com o ambiente virtual ativo (veja os passos acima), instale o pacote ipykernel
:
pip install -U ipykernel
Em seguida, instale o seu ambiente virtual no Jupyter:
python3 -m ipykernel install --user --name=coronabr
Ao abrir o caderno Jupyter, selecione no canto superior direito o ambiente
"coronabr
". Isso só é necessário fazer uma única vez pois, ao salvar o
caderno, o Jupyter se lembra de qual foi o ambiente utilizado.
O mesmo dataset da plataforma IVIS encontra-se disponível neste repositório do Kaggle.
Para um levantamento realizado manualmente de casos em nível municipal, confira este projeto de Wesley Cota.