Para una empresa mediana colombiana en 2026, Supabase es una opción seria de data lake hasta 5 TB con queries moderadas: arquitectura Bronze/Silver/Gold limpia, 150 a 300 USD al mes para 1 TB, Postgres puro sin lock-in, escalado horizontal hasta el punto donde BigQuery o Snowflake ganan. En una distribuidora cliente nuestra normalizamos 3.6 millones de filas legacy de SQL Server 2019 con 197 tablas inconsistentes en 48 horas, todo en Supabase con verificación fila-a-fila. Cuando los datos se unifican, los problemas se anuncian solos.
¿Supabase sirve realmente para data lake?
Sí, Supabase sirve para data lake hasta volúmenes de 1 a 5 TB con queries moderadas. Supabase es Postgres puro (PostgreSQL 17 al momento) con extensiones (pg_vector, postgis, pg_graphql), storage S3-compatible con buckets públicos o privados, edge functions Deno, auth con RLS row-level security, y realtime via WAL.
Para una empresa mediana colombiana (50 a 300 empleados, 100 GB a 2 TB de datos operativos), Supabase es alternativa seria a AWS data lake o BigQuery. Pasado los 5 TB con queries pesadas analíticas, conviene migrar a un warehouse columnar como BigQuery, Snowflake o ClickHouse.
Arquitectura Bronze, Silver, Gold sobre Supabase
El patrón estándar Bronze/Silver/Gold se implementa con esquemas Postgres separados:
Esquema bronze: datos crudos como llegan. Tablas espejo de los sistemas fuente, sin modificación. Storage barato (puede ir a Supabase Storage como parquet si es muy grande). Útil para auditabilidad y reprocesamiento.
Esquema silver: datos normalizados, deduplicados, con tipos correctos y joins de referencia aplicados. Vistas o tablas según volumen. Es la capa que tu equipo de datos consulta directamente.
Esquema gold: tablas de decisión listas para BI y reportería ejecutiva. KPIs precalculados, vistas materializadas para sub-segundo, agregados por dimensión. Es lo que conecta tu dashboard.
El flujo es: ingesta → bronze → transformación dbt → silver → agregación → gold → BI. dbt orquesta las transformaciones con tests y lineage automático.
Comparativa 2026: Supabase vs AWS vs BigQuery para empresa mediana
| Criterio | Supabase Pro | AWS (S3+Athena+Glue) | BigQuery |
|---|---|---|---|
| Costo entry mensual | 25 USD | 50 a 150 USD | 0 + storage 20 USD/TB |
| Storage 1 TB | 100 USD/mes | 23 USD/mes | 20 USD/mes (active) |
| Compute base | 25 USD incluido | Pay-per-query | Pay-per-query |
| Implementación inicial | 12,000 a 25,000 USD | 18,000 a 40,000 USD | 15,000 a 30,000 USD |
| Curva de equipo | Baja (Postgres puro) | Alta | Media |
| Lock-in | Bajo | Alto | Medio |
| Total mensual 1 TB | 150 a 300 USD | 400 a 1,000 USD | 200 a 500 USD |
| Escalado más de 5 TB | Llega a límite | Excelente | Excelente |
El caso real: migración 3.6 millones de filas en 48 horas
En una distribuidora cliente nuestra (control de plagas, 100 franquicias multi-país) implementamos data lake completo en Supabase con arquitectura Bronze/Silver/Gold:
- Reto inicial: 13 millones de filas legacy en SQL Server 2019 con 197 tablas inconsistentes, 10 años de datos desorganizados.
- Stack: Supabase Pro, Python 3.12, pymssql, PyArrow, parquet, dbt, BigQuery espejo.
- Snapshot worker: chunking 8 paralelo, batch 50K, throttle 10 queries por segundo, bronze parquet 2.7 GB subido a Supabase Storage.
- Verificación triple: source SQL Server = bronze parquet = silver views = gold materialized views.
Resultado:
- 3.6 millones de filas migradas a Supabase en 48 horas.
- 197 tablas snapshot legacy preservadas en bronze.
- 825 silver views, 75 gold materialized views.
- 73 gold tables finales normalizadas.
- 57 RLS policies y 17 roles RBAC.
- 1.17 TB en GCS como bronze parquet raw.
- 2,528 archivos en Storage bucket.
Inversión total del proyecto completo (no sólo data lake): 26,000 USD pago único en 12 semanas. La parte de data lake en sí cabe en el rango 12,000 a 18,000 USD si se cotiza por separado. Operación mensual: cerca de 150 USD en Supabase Pro más storage adicional.
Cómo arrancar data lake en Supabase paso a paso
- Crear proyecto Supabase Pro: 25 USD al mes, región us-east-1 o sa-east-1 (Brasil) para latencia LATAM.
- Definir esquemas:
CREATE SCHEMA bronze; CREATE SCHEMA silver; CREATE SCHEMA gold;. Roles separados para cada esquema (RBAC). - Diseñar ingesta: snapshot workers Python para sistemas legacy (SQL Server, MySQL), webhooks o Airbyte/Fivetran para SaaS (HubSpot, Stripe), uploads manuales para Excel/CSV.
- dbt para transformaciones: proyecto dbt con
bronzecomo source,silvercomo staging,goldcomo marts. Tests de unicidad, no nulos, referencias. - Vistas materializadas en gold: para KPIs ejecutivos con refresh programado (cada 5 min, cada hora, diario).
- Conectar BI: Metabase, Power BI o dashboard a medida sobre gold. RLS si necesitás multi-tenant por usuario.
- Monitoreo: Supabase logs, métricas de query performance, alertas en degradación.
¿Cuándo dejar Supabase y migrar a BigQuery o Snowflake?
Llegás al límite de Supabase como data lake cuando:
- Pasás los 5 TB con queries analíticas pesadas (JOINs sobre 100M filas).
- Tu BI tarda más de 5 segundos en queries con cache caliente.
- Necesitás columnar storage o particionamiento específico.
- Tu equipo de datos quiere features de warehouse moderno (time travel, zero-copy clones).
Para una empresa mediana colombiana típica, ese punto no llega antes de 3 años de crecimiento serio. Hasta entonces, Supabase entrega.
Próximos pasos
Si tenés data en 5 sistemas o más sin unificar, arrancá con un workshop de 1 día sobre la arquitectura Bronze/Silver/Gold y diseñá el blueprint. Si ya tenés data lake pero rendimiento o costo te preocupa, podemos hacer auditoría. Si querés data lake como parte de transformación operativa completa, agendá una llamada de 30 minutos sobre tu operación.
- MAGIA Core si querés data lake unificado más sistema a medida en 12 semanas, código a tu nombre.
- MAGIA Forge si tu operación requiere multi-tenant con IA y guardrails sobre data lake.
Sin retainers, sin licencias atadas, código a tu nombre.