ELT (Extract Load Transform) gana en 9 de cada 10 pymes LATAM en 2026 porque los data warehouses modernos (Snowflake, BigQuery, Supabase) tienen compute escalable y SQL avanzado dentro del warehouse. Cargas datos crudos y los transformas con dbt o SQL nativo. ETL (Extract Transform Load) sigue siendo válido cuando tu warehouse destino es legacy, los datos tienen información sensible que no puede llegar cruda, o tu equipo solo sabe Python. El patrón canónico para pyme LATAM es Airbyte o Fivetran más Supabase o BigQuery más dbt más Metabase, con costo operacional entre 200 y 800 USD al mes. Sin retainers, sin licencias atadas cuando el código del warehouse es tuyo.
Si eres CTO, CIO o head de datos de pyme LATAM y estás decidiendo cómo armar tu pipeline de datos en 2026, esta guía te da el patrón ganador y cuándo apartarse.
ETL: el patrón clásico
ETL nació en los 90 cuando los warehouses (Teradata, Oracle, SQL Server) cobraban caro por compute. El patrón era:
- Extract: leer datos de fuentes (ERP, CRM, archivos)
- Transform: limpiar, normalizar, calcular agregados en un servidor intermedio (Python, Talend, Informatica)
- Load: empujar resultados ya transformados al warehouse
Beneficios: el warehouse solo recibe datos listos para consumir, no se carga con compute pesado. Útil cuando tu warehouse es lento o cuesta por GB.
Costos: necesitas servidor intermedio robusto, equipo Python o Java fuerte, lógica de transformación encerrada en código fuera del warehouse (más difícil de auditar). Si una transformación falla, debugging es complejo porque vive entre la fuente y el warehouse.
ELT: el patrón moderno
ELT invierte el orden:
- Extract: leer datos de fuentes
- Load: cargar datos crudos directo al warehouse en capa Bronze
- Transform: con SQL dentro del warehouse, construir capas Silver y Gold
Funciona porque warehouses modernos (Snowflake, BigQuery, Databricks, Supabase) tienen compute elástico y SQL avanzado (window functions, JSON parsing, ML inline). Pagas por compute solo cuando transformas.
Beneficios:
- Stack simple: Airbyte o Fivetran extrae y carga, dbt transforma con SQL versionado
- Capa Bronze guarda datos crudos auditables (puedes reprocesar siempre)
- Transformaciones versionadas en Git (no en servidor opaco)
- Equipo solo necesita SQL avanzado (más común que Python o Java)
- Escala vertical y horizontal según volumen
Tabla comparativa rápida
| Criterio | ETL | ELT |
|---|---|---|
| Compute | Servidor intermedio | Dentro del warehouse |
| Lenguaje | Python, Java, Talend, Informatica | SQL más dbt |
| Reprocesamiento | Difícil | Trivial (SQL sobre Bronze) |
| Auditabilidad | Limitada | Total (Git más dbt docs) |
| Costo licencias | Talend, Informatica caros | Open source disponible |
| Velocidad implementación | Lento (4 a 8 semanas) | Rápido (1 a 3 semanas) |
| Mejor para | Warehouse legacy o datos sensibles | Pyme moderna con warehouse cloud |
El stack ELT canónico para pyme LATAM 2026
| Capa | Herramienta | Costo mensual |
|---|---|---|
| Extracción y carga | Airbyte self hosted o Fivetran | 0 a 500 USD |
| Warehouse | Supabase Pro o BigQuery | 25 a 300 USD |
| Transformación | dbt Core (gratis) o dbt Cloud | 0 a 100 USD |
| Orquestación | Airflow, Prefect o Dagster | 0 a 100 USD |
| Visualización | Metabase, Looker Studio | 0 a 50 USD |
| Total pyme mediana | 200 a 800 USD |
Capas Bronze Silver Gold
Sin capas, el data lake se vuelve pantano. El patrón:
- Bronze: datos crudos como llegaron de la fuente. Schema poco normalizado. Nunca borrar. Reprocesar desde aquí cuando descubres bug.
- Silver: datos normalizados, deduplicados, con tipos correctos. Una fila por entidad de negocio (cliente, orden, factura). Útil para análisis ad hoc.
- Gold: datos agregados para decisiones. Materialized views o tablas calculadas. KPIs, dashboards, reportes ejecutivos. Optimizado para velocidad de query.
Sin estas capas, mezclas crudos con métricas y nadie sabe qué versión es correcta.
El caso real: 13 millones de filas migradas con Bronze Silver Gold
Una distribuidora multi sucursal en Ciudad de Guatemala llegó a Catalizadora con 13 millones de filas legacy en SQL Server 2019, 197 tablas inconsistentes y 10 años de datos desorganizados. En 12 semanas Catalizadora entregó:
- Data Lake arquitectura Bronze a Silver a Gold sobre Supabase
- 3.6 millones de filas migradas a Supabase en 48 horas
- 1.17 TB en GCS (Bronze parquet raw)
- 197 tablas snapshot más 825 vistas Silver más 75 vistas Gold materializadas
- Verificación fila a fila: source igual Bronze igual Silver igual Gold
- 73 Gold tables finales normalizadas
- 57 RLS policies más 17 roles RBAC
- 100 franquicias operativas con pipeline multi tenant
- Inversión 26,000 USD fija, sin retainers
Cuando los datos se unifican, los problemas se anuncian solos. El stack: Supabase más Python más dbt más BigQuery más PyArrow. ELT puro.
Cuándo elegir ETL en 2026
Tres escenarios reales:
- Warehouse legacy: si tu destino es Oracle on premise, SQL Server licenciado por core, o un appliance Teradata, ETL sigue siendo válido porque el warehouse no escala compute elástico
- Datos sensibles: cuando contratos o regulación prohíben enviar datos crudos al warehouse (PII en países con LGPD, salud regulada), ETL con anonimización previa es la única opción
- Equipo solo Python o Java: si tu equipo no domina SQL avanzado y no quiere migrar, ETL con Python o Spark es más viable que forzar dbt
Fuera de estos casos, ELT gana siempre.
Lo que NO debes hacer
- Mezclar Bronze, Silver y Gold en mismo schema: cuando otro analista entra, no sabe qué es crudo y qué es métrica
- Sin versionado dbt o Git para transformaciones: cuando algo se rompe en producción nadie sabe qué cambió
- Sin lineage entre capas: cuando una métrica Gold cambia, no puedes rastrearla a sus fuentes Silver y Bronze
- Pagar Fivetran o Stitch para cargar 100 GB al mes: Airbyte self hosted hace lo mismo gratis
Próximos pasos
Si tu pyme LATAM apenas empieza con datos dispersos en ERP, CRM, ecommerce y hojas de cálculo, ELT con Airbyte más Supabase más dbt cubre el 90 por ciento de los casos a un costo razonable.
Catalizadora arma el diagnóstico en una llamada de 30 minutos, sin pitch deck, conversación real sobre tu operación.
- MAGIA Core entrega Data Lake unificado Bronze a Silver a Gold con dashboards por rol en 12 semanas por 15,000 USD. Código a tu nombre, datos a tu nombre, infraestructura a tu nombre.
- Para casos donde necesitas plataforma a medida con motor de IA, guardrails y observabilidad de primer día, MAGIA Forge entrega en 12 semanas por 20,000 USD.