Methodology
Ingestion pipeline, automated extraction, geocoding, deduplication and verification.
Every 30 minutes the Cuba Radar pipeline collects articles from nine independent outlets and public infrastructure data. An automated process extracts event type, location, date, severity and confidence, geolocates the place, and applies deduplication within a 24-hour window. In parallel, it reads public electricity reports and connectivity measurements to detect anomalies, outages and trends. Everything is stored in a database for traceability and queries.
Pipeline
- Ingesta: 9 medios independientes + Unión Eléctrica + Cloudflare Radar cada 30 min.
- Extracción: proceso automatizado con salida estructurada (tipo, ubicación, fecha, gravedad, confianza).
- Geocodificación: servicios públicos de mapas → ciudad/municipio → coordenadas → provincia.
- Deduplicación: solapamiento léxico en ventana de 24 h.
- Persistencia: base de datos con historial de 30/90 días.
- Salida pública: mapa y páginas del sitio, con enlaces a las fuentes.
Open data
Si usas Cuba Radar como fuente, por favor enlaza al evento concreto (/evento/{id}) y cita el medio original listado en el campo sources.