Skip to content

Latest commit

 

History

History
449 lines (312 loc) · 46.8 KB

readme.md

File metadata and controls

449 lines (312 loc) · 46.8 KB

DESDE QUE COMENZÓ LA PANDEMIA EXTRAEMOS, ORGANIZAMOS Y LIMPIAMOS DIARIAMENTE DECENAS DE SERIES DE DATOS. NECESITAMOS TU AYUDA PARA PODER SEGUIR HACIENDO ESTE TRABAJO. SÚMATE A DATADISTA POR 36 EUROS/AÑO Y RECIBE NUESTRA NEWSLETTER

LEA DETENIDAMENTE ESTE README ANTES DE UTILIZAR LOS DATOS

Datasets relacionados con la incidencia de la COVID-19 en España realizado por DATADISTA, medio especializado en periodismo de investigación y datos para salir del ruido.

  • Extracción, limpieza y normalización de las tablas de la situación diaria acumulada de la enfermedad por el coronavirus SARS-CoV-2 (COVID-19) en España en un formato accesible y reutilizable. Datos actualizados diariamente según el calendario y ritmo de publicación del Ministerio de Sanidad y el Instituto de Salud Carlos III.

  • Datasets accesorios para cubrir la crisis por COVID-19 en España

Fuente de los datos:

PDFs originales de resumen de situación: Carpeta con los PDFs originales de los informes oficiales publicados por el Ministerio de Sanidad.

Serie antigua de datasets: Carpeta con la serie de datasets mantenida hasta finales de mayo de 2020. Los documentos con la nomeclatura "old" son actualizados hasta el 30-04-2020. A partir del 2020-05-01 la serie histórica es permanentemente corregida según los datos facilitados periódicamente por las CCAA al Ministerio de Sanidad. Los datos disponibles en la serie antigua para los días 29 de febrero, 1 de marzo, 7 de marzo y 8 de marzo provienen de las notas de prensa del Departamento de Seguridad Nacional y del gabinete de prensa del Ministerio de Sanidad.

Licencia de uso:

Puedes reutilizarlos para elaborar nuevas historias, análisis, proyectos o visualizaciones siempre y cuando nos cites como fuente.

Si quieres avisarnos de tus reutilizaciones o tienes cualquer duda, puedes ponerte en contacto con nosotros en hola@datadista.com o en Twitter en @datadista.

Notas y cambios metodológicos:

IMPORTANTE: Documento con las notas publicadas por el Ministerio de Sanidad y DATADISTA

Formato de los datos:

IMPORTANTE: Tabla con las fechas de modificación de los archivos csv | Table with files modification dates

Descripción: Evolución de la serie histórica de casos, fallecimientos, hospitalizados e ingresos UCI.
Nombre del archivo: nacional_covid19.csv
Nivel administrativo: Nacional

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-03-25
casos_total Total de casos confirmados acumulados incluye PCR y Test de anticuerpos Accumulated total confirmed cases (included PCR and Antibody test) Número 7
casos_prc Total de casos confirmados acumulados por PCR Accumulated total confirmed cases by PCR Número 7
casos_test Total de casos confirmados acumulados por test de anticuerpos Accumulated total confirmed cases by Antibody test) Número 7
altas Personas curadas acumuladas Accumulated recovered Número 7
fallecimientos Personas fallecidas acumuladas Accumulated deceased Número 7
ingresos_uci Casos acumulados que han precisado ingreso en UCI(**) Accumulated cases that have required admission to the IC(**) Número 7
hospitalizados Casos acumulados que han precisado hospitalización (incluyen UCI)(**) Accumulated cases that have required hospitalization (include admitted to the IC)(**) Número 7



Nombre del archivo: nacional_covid19_datos_sanidad_nueva_serie.csv
Nivel administrativo: Nacional

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-03-25
Casos Casos confirmados acumulados Accumulated confirmed cases Número 7
Fallecidos Personas fallecidas acumuladas Accumulated deceased Número 7
Hospitalizados Casos acumulados que han precisado hospitalización (incluyen UCI) Accumulated cases that have required hospitalization (include admitted to the IC) (Data obtained from the analysis of a daily variable percentage of cases reported) Número 7
UCI Casos acumulados que han precisado ingreso en UCI Accumulated cases that have required admission to the IC Número 7




Nombre del archivo: nacional_covid19_rango_edad.csv
Nivel administrativo: Nacional
IMPORTANTE: Datos obtenidos sobre los casos notificados con información de edad y sexo. Dataset con las notas de los casos analizados cada día por rango de edad y sexo

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-03-25
rango_edad Grupos de edad age range Texto 0-9
sexo Sexo gender Texto Mujeres
casos_confirmados Casos confirmados acumulados Accumulated confirmed cases (Data obtained from the analysis of a daily variable percentage of cases reported) Número 7
hospitalizados Casos acumulados que han precisado hospitalización (incluyen UCI) Accumulated cases that have required hospitalization (include admitted to the IC) (Data obtained from the analysis of a daily variable percentage of cases reported) Número 7
ingresos_uci Casos acumulados que han precisado ingreso en UCI Accumulated cases that have required admission to the IC (Data obtained from the analysis of a daily variable percentage of cases reported) Número 7
fallecidos Personas fallecidas acumuladas Accumulated deceased (Data obtained from the analysis of a daily variable percentage of cases reported) Número 7



Descripción: Evolución de la serie histórica de casos, fallecimientos, hospitalizados e ingresos UCI por Comunidad Autónoma.
Nivel administrativo: Comunidad Autónoma
Nombre del archivo: ccaa_covid19_datos_sanidad_nueva_serie.csv

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-05-01
cod_ine Código INE de CCAA National Statistics Institute code of the autonomous community Texto 1
ccaa Comunidad autónoma Autonomous community Texto Madrid
Casos casos confirmados number of total confirmed cases Número 7
Fallecidos Personas fallecidas deceased Número 7
Hospitalizados Casos que han precisado hospitalización (incluyen UCI) Cases that have required hospitalization (include admitted to the IC) Número 7
UCI Casos que han precisado ingreso en UCI Cases that have required admission to the IC Número 7



Descripción: Número de casos confirmados registrados registrados diarios por Comunidad Autónoma y tipo de prueba.
Description: Number of confirmed cases recorded recorded daily by Autonomous Community and type of test.
Nivel administrativo: Comunidad Autónoma
Nombre del archivo: ccaa_covid19_datos_isciii_nueva_serie.csv

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-05-01
cod_ine Código INE de CCAA National Statistics Institute code of the autonomous community Texto 1
ccaa Comunidad autónoma Autonomous community Texto Madrid
num_casos número de casos totales, confirmados o probables number of total confirmed or probable cases Número 7
num_casos_prueba_pcr número de casos con prueba de laboratorio PCR o técnicas moleculares number of cases with PCR laboratory test or molecular techniques Número 8
num_casos_prueba_test_ac número de casos con prueba de laboratorio de test rápido de anticuerpos number of cases with laboratory rapid antibody test Número 9
num_casos_prueba_otras número de casos con otras pruebas de laboratorio, mayoritariamente por detección de antígeno o técnica Elisa number of cases with other laboratory tests, mostly by antigen detection or Elisa technique Número 10
num_casos_prueba_desconocida número de casos con una prueba desconocida (sin información) number of cases with an unknown test (no information) Número 11



Descripción: Número de casos confirmados registrados registrados diarios por Comunidad Autónoma y tipo de prueba.
Description: Number of confirmed cases recorded recorded daily by Autonomous Community and type of test.
Nivel administrativo: Comunidad Autónoma
Nombre del archivo: ccaa_de_declaracion_covid19_datos_isciii_nueva_serie.csv

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-05-01
cod_ine Código INE de CCAA National Statistics Institute code of the autonomous community Texto 1
ccaa Comunidad autónoma Autonomous community Texto Madrid
num_casos número de casos totales, confirmados o probables number of total confirmed or probable cases Número 7
num_casos_prueba_pcr número de casos con prueba de laboratorio PCR o técnicas moleculares number of cases with PCR laboratory test or molecular techniques Número 8
num_casos_prueba_test_ac número de casos con prueba de laboratorio de test rápido de anticuerpos number of cases with laboratory rapid antibody test Número 9
num_casos_prueba_ag número de casos con pruebas ag number of cases with other laboratory tests, mostly by antigen detection Número 10
num_casos_prueba_elisa número de casos con otras pruebas con técnica Elisa number of cases with Elisa technique Número 10
num_casos_prueba_desconocida número de casos con una prueba desconocida (sin información) number of cases with an unknown test (no information) Número 11



Nombre del archivo: ccaa_vacunas.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Fecha publicación,cod_ine,CCAA,Dosis entregadas Pfizer,Dosis entregadas Moderna,Dosis entregadas AstraZeneca,Dosis entregadas totales,Dosis administradas,Porcentaje de dosis administradas por 100 habitantes,Porcentaje sobre entregadas,Personas con pauta completa,Porcentaje con pauta completa,Fecha de la última vacuna registrada,Última fecha de actualización.
Nota: Las columnas Porcentaje de dosis administradas por 100 habitantes y Porcentaje con pauta completa está calculada por DATADISTA en base a los datos de cifras de población oficiales por CCAA publicadas en el INE con fecha 2021-07-01.

Nombre del archivo: ccaa_vacunas_personas_institucionalizadas.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Evolución de la vacunación contra la COVID-10 entre la población institucionalizada

Nombre del archivo: ccaa_ia14d.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Evolución de la incidencia acumulada en los últimos 14 días por cada 100.000 habitantes.



Nombre del archivo: ccaa_ingresos_camas_convencionales_uci.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Evolución de los pacientes hospitalizados e ingresados en UCI, ingresos en las últimas 24 horas y porcentaje de camas ocupadas por COVID-19 respecto al total de ingresos por comunidad autonoma

Nombre del archivo: ccaa_pcr_realizadas_diarias.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Evolución de las pruebas PCR realizadas y el porcentaje de positividad por comunidad autonoma (Datos hasta 06-10-2020)

Descripción: Evolución de la serie histórica de casos, fallecimientos, hospitalizados e ingresos UCI por provincias.
Nivel administrativo: Provincias
Nombre del archivo: provincias_covid19_datos_sanidad_nueva_serie.csv

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-05-01
cod_ine Código INE de provincia National Statistics Institute code of the provinces Texto 1
provincia Provincia Autonomous community Texto Madrid
Casos casos confirmados number of total confirmed cases Número 7
Fallecidos Personas fallecidas deceased Número 7
Hospitalizados Casos que han precisado hospitalización (incluyen UCI) Cases that have required hospitalization (include admitted to the IC) Número 7
UCI Casos que han precisado ingreso en UCI Cases that have required admission to the IC Número 7



Descripción: Número de casos confirmados registrados registrados diarios por provincia y tipo de prueba.
Description: Number of confirmed cases recorded recorded daily by province and type of test.
Nivel administrativo: Provincia
Nombre del archivo: provincias_covid19_datos_isciii_nueva_serie.csv

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-05-01
cod_ine Código INE de provincia National Statistics Institute code of the province Texto 1
provincia Provincia Province Texto Madrid
num_casos número de casos totales, confirmados o probables number of total confirmed or probable cases Número 7
num_casos_prueba_pcr número de casos con prueba de laboratorio PCR o técnicas moleculares number of cases with PCR laboratory test or molecular techniques Número 8
num_casos_prueba_test_ac número de casos con prueba de laboratorio de test rápido de anticuerpos number of cases with laboratory rapid antibody test Número 9
num_casos_prueba_otras número de casos con otras pruebas de laboratorio, mayoritariamente por detección de antígeno o técnica Elisa number of cases with other laboratory tests, mostly by antigen detection or Elisa technique Número 10
num_casos_prueba_desconocida número de casos con una prueba desconocida (sin información) number of cases with an unknown test (no information) Número 11



Nivel administrativo: Comunidad Autónoma
Descripción: Acumulado del número de fallecidos registrados por Comunidad Autónoma y fecha de defunción. (NUEVA SERIE)
Description: Accumulated number of deceased cases registered by Autonomous Community and deceased date (NEW SERIES)
Archivo original normalizado: ccaa_covid19_fallecidos_por_fecha_defuncion_nueva_serie_original.csv

Nombre del archivo: ccaa_covid19_fallecidos_por_fecha_defuncion_nueva_serie.csv

Campo Descripción Description Formato Ejemplo
cod_ine Código INE de CCAA National Statistics Institute code of the autonomous community Texto 01
CCAA Comunidad autónoma Autonomous community Texto Madrid
2020-03-25 Fecha de defunción Deceased date YYYY-MM-DD 2020-03-25

Nombre del archivo: ccaa_covid19_fallecidos_por_fecha_defuncion_nueva_serie_long.csv

Campo Descripción Description Formato Ejemplo
fecha Fecha de publicación Publication date YYYY-MM-DD 2020-03-25
cod_ine Código INE de CCAA National Statistics Institute (INE) code of the autonomous community Texto 01
CCAA Comunidad autónoma Autonomous community Texto Madrid
total Fallecidos por fecha de defunción Deceased by date of death Número 7





Nombre del archivo: nacional_casos_personal_sanitario.csv
Nivel administrativo: Nacional
Descripción: Número de casos confirmados por COVID-19 entre el personal sanitario.



Nombre del archivo: ccaa_covid19_test_realizados.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Número acumulado de test PCR y test de anticuerpos realizados por comunidad autonoma hasta el 2020-04-23.



Nombre del archivo: ccaa_covid19_mascarillas.csv
Nivel administrativo: Comunidad Autónoma
Descripción: Número acumulado de mascarillas repartidas por CCAA por el Ministerio de Sanidad desde 2020-03-10 a 2020-03-22.



Nombre del archivo: ccaa_camas_uci_2017.csv
Nivel administrativo: Comunidad Autónoma
Año de publicación: 2017
Descripción: Número de camas UCI por CCAA. Dato extraído de los microdatos de la Estadística de Centros Sanitarios de Atención Especializada (SIAE) de 2017. Último dato oficial disponible. Utilizado en el articulo: Incidencia de la COVID-19 en las camas UCI en España



Nombre del archivo: alojamientos_turisticos_boe_2020_4194.csv
Nivel administrativo: Municipio
Descripción: Alojamientos turísticos declarados servicio esencial por COVID-19. Destinados al alojamiento del personal sanitario, de abastecimiento, mantenimiento, reparación y obras de interés general y todos los ligados a las actividades consideradas esenciales.
Fuente: Orden TMA/305/2020



Nombre del archivo: puntos_restauracion_comida_para_llevar.csv
Nivel administrativo: Municipio
Descripción: Listado con los puntos de restauración y tiendas con venta de comida preparada para llevar para trabajadores cuyo trabajo es básico para mantener servicios esenciales y de abastecimiento.
Fuente: Ministerio de Transportes, Movilidad y Agenda Urbana



Nombre del archivo: EESS_horario_flexible_habitual.csv
Nivel administrativo: Municipio
Descripción: Gasolineras abiertas durante el estado de alarma. Listado de estaciones de servicio con horario habitual y estaciones de servicio que pueden flexibilizar* sus horarios durante el estado de alarma.
Fuente: Ministerio para la Transición Ecológica y el Reto Demográfico



Nombre del archivo: talleres_reparacion_vehiculos_industriales.csv
Nivel administrativo: Municipio
Descripción: Listado de los talleres abiertos para vehículos industriales durante el estado de alarma.
Fuente: Ministerio de Transportes, Movilidad y Agenda Urbana



Nombre del archivo: areas_descanso_carreteras.csv
Nivel administrativo: Municipio
Descripción: Listado áreas de descanso en carreteras disponibles durante el estado de alarma.
Fuente: Ministerio de Transportes, Movilidad y Agenda Urbana



Nombre del archivo: contratos_emergencia_sanidad.csv
Nivel administrativo: Nacional
Descripción: Listado de todas las empresas adjudicatarias de contratos por parte del Ministerio de Sanidad para hacer frente a la crisis sanitaria de la COVID-19.
Fuente: Plataforma de Contratación del Estado: Dirección General de Cartera común de servicios del Sistema Nacional de Salud y Farmacia e INGESA



Nombre del archivo: ERTE_fuerza_mayor_sectores.csv
Nivel administrativo: Nacional
Descripción: Listado del número de personas afectadas por un ERTE por fuerza mayor por sectores. Media mensual.
Fuente: Ministerio de Inclusión, Seguridad Social y Migraciones: http://prensa.mitramiss.gob.es/WebPrensa/noticias/seguridadsocial/detalle/3798



Nombre del archivo: ccaa_covid19_ERTE.csv
Nivel administrativo: CCAA
Descripción: Número de personas afectadas por un ERTE por comunidad autónoma
Fuente: Ministerio de Inclusión, Seguridad Social y Migraciones: http://prensa.mitramiss.gob.es/WebPrensa/noticias/seguridadsocial/detalle/3798



Nombre del archivo: provincia_covid19_ERTE.csv
Nivel administrativo: Provincial
Descripción: Número de personas afectadas por un ERTE por provincias
Fuente: Ministerio de Inclusión, Seguridad Social y Migraciones: http://prensa.mitramiss.gob.es/WebPrensa/noticias/seguridadsocial/detalle/3798



Nombre del archivo: provincias_estudio_prevalencia_anticuerpos_primera_ronda.csv
Nivel administrativo: Provincial
Descripción: Estudio de seroprevalencia. Datos de la primera ronda (preliminares). Prevalencia de anticuerpos IgG anti SARS-COv2 por provincia
Fuente: La Moncloa: https://www.lamoncloa.gob.es/serviciosdeprensa/notasprensa/sanidad14/Paginas/2020/130520-seroprevalencia.aspx



Nombre del archivo: provincias_estudio_prevalencia_anticuerpos_primera_y_segunda_ronda.csv
Nivel administrativo: Provincial
Descripción: Estudio de seroprevalencia. Datos de la primera y segunda ronda. Prevalencia de anticuerpos IgG anti SARS-COv2 por provincia.
Fuente: La Moncloa: https://www.lamoncloa.gob.es/serviciosdeprensa/notasprensa/sanidad14/Paginas/2020/040620-seroprevalencia.aspx

br>
Nombre del archivo: provincias_estudio_prevalencia_anticuerpos_primera, segunda_y tercera ronda.csv
Nivel administrativo: Provincial
Descripción: Estudio de seroprevalencia. Datos de la primera, segunda y tercera ronda. Prevalencia de anticuerpos IgG anti SARS-COv2 por provincia.
Fuente (PDF): https://www.mscbs.gob.es/ciudadanos/ene-covid/docs/ESTUDIO_ENE-COVID19_INFORME_FINAL.pdf



Listado de reutilizaciones, análisis, visualizaciones y artículos realizados:

Dataverse. Harvard University. Coronavirus Disease 2019 (COVID-19) in Spain

Numeroteca: R Scripts for COVID-19 analysis Plots - Propagación del COVID-19 en España. Análisis por comunidades autónomas

JJ Merelo: Working on covid timeseries and trying to find stuff about them - Evolución casos COVID19 en España - Filling the gaps: trying to predict cases in the weekendof March 7-8th in Spain

Ramiro Aznar: Python Scripts para desagregar y añadir geometrias a los datos del covid-19

Computational Biology and Complex Systems. BIOCOMSC - Daily Report

Carlos J. Gil Bellosta: Modelización de los casos en Madrid a partir de las defunciones

Lucas Valentin: notebook de Google Colab

Ruben Diaz: CoronaApp

Laura Aragó - La Vanguardia: Así evoluciona la curva del coronavirus en cada comunidad autónoma

Victòria Oliveres - CatalunyaPlural: 5 gràfics actualitzats per seguir l’evolució del coronavirus a Catalunya, Espanya i el món

Carlos Bort: Coronavirus: ¿podría haber 100 veces más contagiados de los reportados?

@SVQCapEcon: Confirmado hecho diferencial vasco. El dato de nº de contagiados coronavirus

@gallir: predicción de nuevos casos con series temporales y datos oficiales

@ALbertcarles: visualització de l'evolució de casos de #covid19 a #Catalunya,

Belén Remacha/Ana Ordaz Eldiario.es: La gravedad de la epidemia en España la marcan las personas que acaban en el hospital: casi el 50% de los diagnosticados

neherlab.org/covid19, a planning tool based on an SIR model that simulates a COVID19 outbreak.

José Luis Cañadas Reche: Corona virus dashboard

Danilo Delizia: Spain covid-19 dashboard.

Carlos Cámara: COVID-19 in Spain - Code

Maarten van Reek: Coronavirus COVID-19 in Spain, a Power BI report

Dashboard COVID-19 #yomequedoencasa

David Jimeno: global pandemic study

Evolución COVID-19 en Canarias

Javier Álvarez Medina (tinybird.co): API endpoints

Pedro del Río Marrón: Data from Spain of COVID-19 (by Datadista) as a service

@alvarospm: COVID-19 Situación en Castilla y León

Roke Alvarez Masso: Resumen de la Situación en España

El País: El coronavirus ya ha desbordado la capacidad normal de camas de UCI en ocho comunidades

El Confidencial: El mapa de la ocupación de las UCI: las camas crecen un 73% para combatir el colapso y El colapso del sistema sanitario

Elnacional.cat: Las UCI de Catalunya, saturadas y al 200% por el coronavirus

COVID-19 TRACKER

COVID-19 by BiGeek

COVID19 - Plataforma de Bioestadística y Epidemiología del ISPA

SARS-CoV-2 Análisis de datos (ESPAÑA)

COVID-19 por el Departamento de Matemática Aplicada de la Universidad de Valencia

#COVIDobservatorioMAD

Dashboard Evolución COVID-19 por Samnuel Moreno

Análisis de casos COVID-19 en España por edad y sexo por Agustí Perez

Situación de COVID-19 en España

COVID-19 en España

El Independiente: Compras de Sanidad: 726 millones de mascarillas, 115 millones de guantes, 2.500 respiradores...

COVID-19 Spain

Worldmeters Spain

SAN ROQUE FONTACIERA Covid-19 en España

nosquedamosencasa.es

Análisis del COVID-19 en España por edad y sexo

COVID-19 (SARS-CoV-2): Datos Nacionales, por CCAA, mundiales y simulación epidemiológica

COVID19-Tracker: una aplicación Shiny para analizar datos de la epidemia de SARS-CoV-2 en España DOI: 10.1016/j.gaceta.2020.04.002

COVID-19 Modeling: Predicciones del alcance del COVID-19

COVID-19 Spain

COnVIDa - Monitorización de datos de COVID19 en España

Reutilización de datos por la asignatura Desarrollo en Tecnologías Emergentes del Grado en Ingeniería en Sistemas de la Información - Universidad de Alcalá

Prediction COVID-19: SIR based model in Spain

Assessing the age- and gender-dependence of the severity and case fatality rates of COVID-19 disease in Spain DOI: 10.12688/wellcomeopenres.15996.1

A scaling approach to estimate the COVID-19 infection fatality ratio from incomplete data | arXiv:2006.02757 [q-bio.PE]

A Spatio‐Temporal Analysis of the Environmental Correlates of COVID‐19 Incidence in Spain | doi.org/10.1111/gean.12241

Trabajar con datos abiertos en tiempos de pandemia: uso de covidDATA-19 | https://doi.org/10.3145/epi.2020.jul.21

DatAC: A visual analytics platform to explore climate and air quality indicators associated with the COVID-19 pandemic in Spain |https://doi.org/10.1016/j.scitotenv.2020.141424

DatAC: Data Against COVID-19