Um pacote R rápido e controlado de acessar os dados do DATASUS em R.
O dtsus foi desenvolvido para simplificar o acesso aos microdados públicos disponibilizados pelo DATASUS. O pacote permite baixar, salvar e ler arquivos disponibilizados pelo DATASUS, com aplicação prévia de filtros e seleção de colunas, tornando o processo mais eficiente e reduzindo o processamento desnecessário.
Além disso, o dtsus mantém explícito o que foi efetivamente realizado na extração e preparação dos dados, favorecendo fluxos de trabalho reprodutíveis e com total controle sobre as etapas executadas.
O pacote dtsus depende do pacote read.dbc, que não está disponível no CRAN.
Primeiro, instale a dependência:
install.packages("remotes")
# Instalar read.dbc
remotes::install_github("danicat/read.dbc")Em seguida, instale o dtsus:
# Instalar dtsus
remotes::install_github("LucasRFontes/dtsus")Download da base contendo os leitos cadastrados no CNES, referente a janeiro de 2023, para o estado do Rio de Janeiro:
library(dtsus)
CNES <- dtsus_download(
fonte = "CNES",
tipo = "LT",
uf = "RJ",
Data_inicio = 202301
)
files <- CNES$files # arquivos baixados
dados <- CNES$data # base de dados carregadaDownload dos dados de Internação Hospitalar do Pará, de novembro de 2024 a fevereiro de 2025, selecionando apenas as colunas de CNES, Diagnóstico Principal e Município de Residência:
library(dtsus)
SIH <- dtsus_download(
fonte = "SIH",
tipo = "RD",
Data_inicio = 202411,
Data_fim = 202502,
uf = "PA",
colunas = c("CNES", "DIAG_PRINC", "MUNIC_RES")
)
files <- SIH$files # arquivos baixadosDownload dos dados do Sistema de Informações sobre Mortalidade (SIM) de Minas Gerais, ano de 2020.
Neste exemplo:
- O download é realizado, mas os dados não são carregados no R (
open = FALSE) - Os arquivos são salvos no formato original
.dbc(save.dbc = TRUE) - É possível definir o diretório onde os arquivos serão armazenados (
pasta.dbc = "caminho/da/pasta")
library(dtsus)
SIM <- dtsus_download(
fonte = "SIM",
tipo = "DO",
uf = "MG",
Data_inicio = 2020,
open = FALSE,
save.dbc = TRUE
)Download da Produção Ambulatorial (SIA) do estado de São Paulo, de setembro a dezembro de 2024, aplicando:
- Filtro para procedimentos específicos (
PA_PROC_ID) - Seleção de colunas
- Salvamento dos arquivos no formato
.dbc - Carregamento automático da base no R
library(dtsus)
SIA <- dtsus_download(
fonte = "SIA",
tipo = "PA",
uf = "SP",
Data_inicio = 202409,
Data_fim = 202412,
filtro = list(
coluna = "PA_PROC_ID",
valor = c("0301060096", "0301060037")
),
open = TRUE,
save.dbc = TRUE,
colunas = c(
"PA_PROC_ID",
"PA_CODUNI",
"PA_QTDAPR",
"PA_QTDPRO"
),
pasta.dbc = "Arquivo"
)
dados <- SIA$data- Os dados são obtidos diretamente das bases públicas do DATASUS
- A disponibilidade pode variar conforme o sistema e período
- O pacote utiliza internamente o pacote
read.dbcpara leitura dos arquivos .dbc
Agradecimento aos desenvolvedores do pacote read.dbc, que viabilizam a leitura eficiente dos dados do DATASUS no R.