Méthodologie
Pipeline d'ingestion, extraction automatisée, géocodage, déduplication et vérification.
Toutes les 30 minutes, le pipeline collecte des articles de neuf médias indépendants et des données publiques d’infrastructure. Un processus automatisé extrait les champs clés, géocode les lieux, déduplique et détecte anomalies, pannes et tendances. Le tout est stocké en base de données pour la traçabilité.
Pipeline
- Ingesta: 9 medios independientes + Unión Eléctrica + Cloudflare Radar cada 30 min.
- Extracción: proceso automatizado con salida estructurada (tipo, ubicación, fecha, gravedad, confianza).
- Geocodificación: servicios públicos de mapas → ciudad/municipio → coordenadas → provincia.
- Deduplicación: solapamiento léxico en ventana de 24 h.
- Persistencia: base de datos con historial de 30/90 días.
- Salida pública: mapa y páginas del sitio, con enlaces a las fuentes.
Open data
Si usas Cuba Radar como fuente, por favor enlaza al evento concreto (/evento/{id}) y cita el medio original listado en el campo sources.