DOI para citação: 10.1590/SciELOPreprints.362
Mais informações: README.en.md
Em geral, os arquivos estão no formato CSV, um formato livre e aberto de fácil acesso. Os nomes dos arquivos podem não ser os ideais, mas foram mantidos para não quebrar a compatibilidade de acesso por pessoas que já usavam os nomes antigos.
Exemplo de acesso aos dados com pandas no Python: https://colab.research.google.com/drive/1H1N387IIAGV-3YRtyxzPz94vSiLrhE0M?usp=sharing
| nome | descrição | url |
|---|---|---|
| CC BY | Licença Creative Commons CC BY 4.0 | https://creativecommons.org/licenses/by/4.0/ |
| CC BY-SA | Licença Creative Commons CC BY-SA 4.0 | https://creativecommons.org/licenses/by-sa/4.0/ |
| MS | Ministério da Saúde | https://covid.saude.gov.br/ |
| IBGE | Instituto Brasileiro de Geografia e Estatística | https://www.ibge.gov.br/ |
| SES | Secretarias Estaduais de Saúde | Diversos |
| BrIO | Brasil.IO | https://brasil.io/covid19/ |
| Bra1 | @coronavirusbra1 | https://coronavirusbra1.github.io/ |
| Gi | GISCARD | http://www.giscard.com.br/coronavirus |
| OSM | OpenStreetMap | https://www.openstreetmap.org/ |
Essa coluna corresponde ao número da semana epidemiológica. Ela vai de 1 até 53 para o ano de 2020. Em 2021, os números vão de 101 até 152. O primeiro dígito é utilizado para indicar que corresponde ao ano de 2021. Para obter a semana epidemiológica bruta, utilize a operação módulo. Por exemplo, no Python:
semana_epidemiologica = 152 % 100 # = 52Os intervalos são definidos pelo Ministério da Saúde no Calendário Epidemiológico:
- 2020: http://portalsinan.saude.gov.br/calendario-epidemiologico-2020
- 2021: http://www.portalsinan.saude.gov.br/calendario-epidemiologico
Esses são os arquivos com os dados principais. Os arquivos cases-brazil-states.csv e cases-brazil-total.csv possuem dados em nível de unidades federativas, apenas. Já cases-brazil-cities*.csv possuem dados em nível municipal.
Todas métricas por 100 mil habitantes são calculadas dividindo o número pela população e multiplicando por 10⁵; veja cities_info.csv.
Os dois arquivos possuem colunas iguais. A linha do tempo completa está disponível em cases-brazil-states.csv, enquanto cases-brazil-total.csv possui os números do último registro.
| nome | descrição | fontes | licença |
|---|---|---|---|
| epi_week | Número da semana epidemiológica | MS | |
| date | Data de divulgação | ||
| country | Nome do país (sempre Brazil) |
||
| state | Nome da unidade federativa | IBGE | |
| city | Sempre “TOTAL” | ||
| newDeaths | Número de novos óbitos divulgados | MS,BrIO,Gi | CC BY, CC BY-SA |
| deaths | Número acumulado de óbitos | MS,BrIO,Gi | CC BY, CC BY-SA |
| newCases | Número de novos casos divulgados | MS,BrIO,Gi | CC BY, CC BY-SA |
| totalCases | Número acumulado de casos | MS,BrIO,Gi | CC BY, CC BY-SA |
| deathsMS | Número acumulado de obitos pelo Ministério da Saúde | MS | CC BY |
| totalCasesMS | Número acumulado de casos pelo Ministério da Saúde | MS | CC BY |
| deaths_per_100k_inhabitants | Número de óbitos por 100 mil habitantes | CC BY | |
| totalCases_per_100k_inhabitants | Número de casos por 100 mil habitantes | CC BY | |
| deaths_by_totalCases | Razão entre número de óbitos e casos (deaths/totalCases) |
CC BY | |
| recovered | Número de recuperados | Bra1,Gi | CC BY |
| suspects | Número de suspeitos | Bra1 | CC BY |
| tests | Número de testes realizados | Bra1,Gi | CC BY |
| tests_per_100k_inhabitants | Número de testes realizados por 100 mil habitantes | CC BY | |
| vaccinated | Número de pessoas que receberam a primeira dose | Bra1 | CC BY |
| vaccinated_per_100_inhabitants | Porcentagem de pessoas que receberam a primeira dose | CC BY | |
| vaccinated_second | Número de pessoas que receberam a segunda dose | Bra1 | CC BY |
| vaccinated_second_per_100_inhabitants | Porcentagem de pessoas que receberam a segunda dose | CC BY | |
| vaccinated_single | Número de pessoas que receberam a dose única | Bra1 | CC BY |
| vaccinated_single_per_100_inhabitants | Porcentagem de pessoas que receberam a dose única | CC BY | |
| vaccinated_third | Número de pessoas que receberam a dose de reforço | Bra1 | CC BY |
| vaccinated_third_per_100_inhabitants | Porcentagem de pessoas que receberam a dose de reforço | CC BY |
Por municípios: cases-brazil-cities.csv, cases-brazil-cities-time*.csv.gz e cases-brazil-cities-time_changesOnly.csv
Todos os arquivos possuem colunas iguais. Não há a coluna epi_week em cases-brazil-cities.csv. Não há as colunas cod_RegiaoDeSaude e name_RegiaoDeSaude em cases-brazil-cities-time.csv.gz e cases-brazil-cities-time_changesOnly.csv.
A linha do tempo completa está nos arquivos cases-brazil-cities-time*.csv.gz (compactação gzip, sem as colunas country, _source, last_info_date), e os dados do último dia em cases-brazil-cities.csv. Neste caso, os dados para os anos anteriores ao corrente estão em cases-brazil-cities-time_20xx.csv.gz, enquanto para o ano corrente estão no arquivo cases-brazil-cities-time.csv.gz. O arquivo cases-brazil-cities-time_changesOnly.csv é um subconjunto de cases-brazil-cities-time.csv, onde as colunas newCases e/ou newDeaths são não nulas.
Para ler toda a série temporal dos municípios com pandas e glob, use:
pd.concat([pd.read_csv(x) for x in sorted(glob.glob('cases-brazil-cities-time_2*.csv.gz')) + ['cases-brazil-cities-time.csv.gz']])| nome | descrição | fontes | licença |
|---|---|---|---|
| epi_week | Número da semana epidemiológica | MS | |
| date | Data de divulgação | ||
| country | Nome do país (sempre Brazil) |
||
| state | Nome da unidade federativa | IBGE | |
| city | Nome do município | IBGE | |
| ibgeID | Código IBGE do município | IBGE | |
| newDeaths | Número de novos óbitos divulgados | MS,BrIO | CC BY, CC BY-SA |
| deaths | Número acumulado de óbitos | MS,BrIO | CC BY, CC BY-SA |
| newCases | Número de novos casos divulgados | MS,BrIO | CC BY, CC BY-SA |
| totalCases | Número acumulado de casos | MS,BrIO | CC BY, CC BY-SA |
| deaths_per_100k_inhabitants | Número de óbitos por 100 mil habitantes | CC BY | |
| totalCases_per_100k_inhabitants | Número de casos por 100 mil habitantes | CC BY | |
| deaths_by_totalCases | Razão entre número de óbitos e casos (deaths/totalCases) |
CC BY | |
| _source | Fonte do dado: pode ser MS ou SES (via Brasil.IO) | ||
| last_info_date | Data de divulgação do último boletim da unidade federativa | MS,BrIO | CC BY, CC BY-SA |
| nome | descrição | fontes | licença |
|---|---|---|---|
| ibge | Código IBGE do município | IBGE | |
| city | Nome do município | IBGE | |
| state | Nome da unidade federativa | IBGE | |
| region | Nome da região | IBGE | |
| pop2019 | Estimativa da população em 2019 | IBGE | |
| pop2020 | Estimativa da população em 2020 | IBGE | |
| pop2021 | Estimativa da população em 2021 | IBGE | |
| isCountryside | Igual a 1 se está no interior do Brasil, ou 0 se em região metropolitana |
IBGE | |
| cod_RegiaoDeSaude | Código identificador da região de saúde do municipio | ||
| name_RegiaoDeSaude | Nome da região de saúde do município |
| nome | descrição | fontes | licença |
|---|---|---|---|
| ibgeID | Código IBGE do município | IBGE | |
| id | Nome do município | IBGE | |
| lat | Latitude | OSM | ODbL 1.0 |
| lon | Longitude | OSM | ODbL 1.0 |
| longName | Nome longo do município | OSM | ODbL 1.0 |
_control.csv: contém o último número de óbitos (deve ser deletado em algum momento)_fixes_meta.csv: correções nos registros do Ministério da Saúde_tests_meta.csv: metadados sobre os números de testes, por data e unidade federativasources.csv: fontes dos dadosgps_cities.csv: casos e óbitos por município, junto com as coordenadas GPS.