¿Supabase sirve para un data lake real o sólo para apps web?

Supabase sirve para data lake hasta volúmenes de 1 a 5 TB con queries moderadas. Es Postgres puro con storage S3-compatible y compute escalable. Para una empresa mediana colombiana con 100 GB a 2 TB, sale más simple y económico que AWS o BigQuery. Pasado 5 TB con queries pesadas, BigQuery o Snowflake ganan.

¿Cuánto cuesta operar un data lake en Supabase para empresa mediana?

Supabase Pro arranca en 25 USD al mes con 8 GB Postgres y 100 GB de storage S3 incluidos. Para 1 TB total entre Postgres y Storage, esperá pagar 150 a 300 USD al mes. Comparado con AWS equivalente (400 a 1,000 USD al mes), es 50 a 70 por ciento más barato.

¿Qué significa arquitectura Bronze, Silver, Gold en Supabase?

Bronze son datos crudos como llegan (esquema bronze en Postgres o parquet en Supabase Storage). Silver son datos normalizados y limpios (esquema silver con vistas). Gold son tablas de decisión listas para BI (esquema gold con vistas materializadas). El patrón se implementa con esquemas separados y dbt.

¿Cómo migro datos legacy de SQL Server a Supabase?

El patrón estable es: snapshot worker en Python con pymssql y PyArrow, chunking paralelo por PK range, parquet intermedio en Supabase Storage, carga a bronze, transformación a silver via dbt, gold con vistas materializadas. Una distribuidora cliente nuestra migró 3.6 millones de filas en 48 horas con verificación fila-a-fila.

¿Cuándo conviene Supabase sobre AWS o BigQuery para data lake?

Supabase gana para empresa mediana colombiana con 100 GB a 2 TB que ya conoce Postgres, quiere arranque rápido y simplicidad operativa. AWS gana en más de 10 TB con servicios ML avanzados. BigQuery gana cuando ya estás en Google Cloud o tu equipo tiene experiencia SQL columnar.

Data Lake en Supabase: guía 2026 empresa mediana

Cómo construir un data lake con Supabase para empresa mediana en Colombia: arquitectura Bronze/Silver/Gold, costos reales, alternativa a AWS y BigQuery.

Para una empresa mediana colombiana en 2026, Supabase es una opción seria de data lake hasta 5 TB con queries moderadas: arquitectura Bronze/Silver/Gold limpia, 150 a 300 USD al mes para 1 TB, Postgres puro sin lock-in, escalado horizontal hasta el punto donde BigQuery o Snowflake ganan. En una distribuidora cliente nuestra normalizamos 3.6 millones de filas legacy de SQL Server 2019 con 197 tablas inconsistentes en 48 horas, todo en Supabase con verificación fila-a-fila. Cuando los datos se unifican, los problemas se anuncian solos.

¿Supabase sirve realmente para data lake?

Sí, Supabase sirve para data lake hasta volúmenes de 1 a 5 TB con queries moderadas. Supabase es Postgres puro (PostgreSQL 17 al momento) con extensiones (pg_vector, postgis, pg_graphql), storage S3-compatible con buckets públicos o privados, edge functions Deno, auth con RLS row-level security, y realtime via WAL.

Para una empresa mediana colombiana (50 a 300 empleados, 100 GB a 2 TB de datos operativos), Supabase es alternativa seria a AWS data lake o BigQuery. Pasado los 5 TB con queries pesadas analíticas, conviene migrar a un warehouse columnar como BigQuery, Snowflake o ClickHouse.

Arquitectura Bronze, Silver, Gold sobre Supabase

El patrón estándar Bronze/Silver/Gold se implementa con esquemas Postgres separados:

Esquema bronze: datos crudos como llegan. Tablas espejo de los sistemas fuente, sin modificación. Storage barato (puede ir a Supabase Storage como parquet si es muy grande). Útil para auditabilidad y reprocesamiento.

Esquema silver: datos normalizados, deduplicados, con tipos correctos y joins de referencia aplicados. Vistas o tablas según volumen. Es la capa que tu equipo de datos consulta directamente.

Esquema gold: tablas de decisión listas para BI y reportería ejecutiva. KPIs precalculados, vistas materializadas para sub-segundo, agregados por dimensión. Es lo que conecta tu dashboard.

El flujo es: ingesta → bronze → transformación dbt → silver → agregación → gold → BI. dbt orquesta las transformaciones con tests y lineage automático.

Comparativa 2026: Supabase vs AWS vs BigQuery para empresa mediana

Criterio	Supabase Pro	AWS (S3+Athena+Glue)	BigQuery
Costo entry mensual	25 USD	50 a 150 USD	0 + storage 20 USD/TB
Storage 1 TB	100 USD/mes	23 USD/mes	20 USD/mes (active)
Compute base	25 USD incluido	Pay-per-query	Pay-per-query
Implementación inicial	12,000 a 25,000 USD	18,000 a 40,000 USD	15,000 a 30,000 USD
Curva de equipo	Baja (Postgres puro)	Alta	Media
Lock-in	Bajo	Alto	Medio
Total mensual 1 TB	150 a 300 USD	400 a 1,000 USD	200 a 500 USD
Escalado más de 5 TB	Llega a límite	Excelente	Excelente

El caso real: migración 3.6 millones de filas en 48 horas

En una distribuidora cliente nuestra (control de plagas, 100 franquicias multi-país) implementamos data lake completo en Supabase con arquitectura Bronze/Silver/Gold:

Reto inicial: 13 millones de filas legacy en SQL Server 2019 con 197 tablas inconsistentes, 10 años de datos desorganizados.
Stack: Supabase Pro, Python 3.12, pymssql, PyArrow, parquet, dbt, BigQuery espejo.
Snapshot worker: chunking 8 paralelo, batch 50K, throttle 10 queries por segundo, bronze parquet 2.7 GB subido a Supabase Storage.
Verificación triple: source SQL Server = bronze parquet = silver views = gold materialized views.

Resultado:

3.6 millones de filas migradas a Supabase en 48 horas.
197 tablas snapshot legacy preservadas en bronze.
825 silver views, 75 gold materialized views.
73 gold tables finales normalizadas.
57 RLS policies y 17 roles RBAC.
1.17 TB en GCS como bronze parquet raw.
2,528 archivos en Storage bucket.

Inversión total del proyecto completo (no sólo data lake): 26,000 USD pago único en 12 semanas. La parte de data lake en sí cabe en el rango 12,000 a 18,000 USD si se cotiza por separado. Operación mensual: cerca de 150 USD en Supabase Pro más storage adicional.

Cómo arrancar data lake en Supabase paso a paso

Crear proyecto Supabase Pro: 25 USD al mes, región us-east-1 o sa-east-1 (Brasil) para latencia LATAM.
Definir esquemas: CREATE SCHEMA bronze; CREATE SCHEMA silver; CREATE SCHEMA gold;. Roles separados para cada esquema (RBAC).
Diseñar ingesta: snapshot workers Python para sistemas legacy (SQL Server, MySQL), webhooks o Airbyte/Fivetran para SaaS (HubSpot, Stripe), uploads manuales para Excel/CSV.
dbt para transformaciones: proyecto dbt con bronze como source, silver como staging, gold como marts. Tests de unicidad, no nulos, referencias.
Vistas materializadas en gold: para KPIs ejecutivos con refresh programado (cada 5 min, cada hora, diario).
Conectar BI: Metabase, Power BI o dashboard a medida sobre gold. RLS si necesitás multi-tenant por usuario.
Monitoreo: Supabase logs, métricas de query performance, alertas en degradación.

¿Cuándo dejar Supabase y migrar a BigQuery o Snowflake?

Llegás al límite de Supabase como data lake cuando:

Pasás los 5 TB con queries analíticas pesadas (JOINs sobre 100M filas).
Tu BI tarda más de 5 segundos en queries con cache caliente.
Necesitás columnar storage o particionamiento específico.
Tu equipo de datos quiere features de warehouse moderno (time travel, zero-copy clones).

Para una empresa mediana colombiana típica, ese punto no llega antes de 3 años de crecimiento serio. Hasta entonces, Supabase entrega.

Próximos pasos

Si tenés data en 5 sistemas o más sin unificar, arrancá con un workshop de 1 día sobre la arquitectura Bronze/Silver/Gold y diseñá el blueprint. Si ya tenés data lake pero rendimiento o costo te preocupa, podemos hacer auditoría. Si querés data lake como parte de transformación operativa completa, agendá una llamada de 30 minutos sobre tu operación.

MAGIA Core si querés data lake unificado más sistema a medida en 12 semanas, código a tu nombre.
MAGIA Forge si tu operación requiere multi-tenant con IA y guardrails sobre data lake.

Sin retainers, sin licencias atadas, código a tu nombre.