La respuesta corta para una pyme mexicana en 2026: un data lake serio cuesta entre 12,000 y 40,000 USD de implementación inicial, más 25 a 800 USD al mes de operación según volumen y proveedor. AWS es la opción más cara y compleja; Supabase nativo es la más simple y económica para pyme con 100 GB a 1 TB; BigQuery está en medio. En una distribuidora cliente nuestra normalizamos 3.6 millones de filas legacy en 48 horas usando Supabase con arquitectura Bronze/Silver/Gold, 73 gold tables, 1.17 TB en GCS bronze parquet. Inversión total del proyecto completo 26,000 USD.
¿Cuánto cuesta un data lake en AWS realmente?
Un data lake en AWS para una pyme mexicana con 100 GB a 1 TB de datos y queries moderadas cuesta:
- S3 storage: 0.023 USD por GB al mes (Standard). Para 500 GB son 11.50 USD al mes.
- S3 requests: 0.0004 USD por 1,000 PUTs, 0.00004 USD por 1,000 GETs. Variable según uso.
- Athena queries: 5 USD por TB escaneado. Si tu BI hace 100 queries diarias de 1 GB cada una, son 15 USD al mes.
- Glue ETL jobs: 0.44 USD por DPU-hour. Un job diario de 1 hora 2 DPU son 26 USD al mes.
- Glue Data Catalog: 1 USD por 100,000 objetos almacenados al mes. Mínimo 1 USD.
- Lambda functions para orquestación: 5 a 30 USD al mes según volumen.
- CloudWatch logs: 10 a 50 USD al mes.
- Data transfer out: 0.09 USD por GB si sacas datos fuera de AWS.
Total operación AWS para pyme con 500 GB a 1 TB: 200 a 800 USD al mes. Si haces queries pesadas con Athena en grandes datasets, fácilmente sube a 1,000 a 2,000 USD al mes.
Comparativa 2026: AWS vs Supabase vs BigQuery para pyme
| Componente | AWS (S3+Athena+Glue) | Supabase Pro | BigQuery |
|---|---|---|---|
| Storage 1 TB | 23 USD/mes | 100 USD/mes | 20 USD/mes (active) |
| Compute base | Pay-per-query | 25 USD/mes incluido | Pay-per-query |
| Implementación inicial | 18,000 a 40,000 USD | 12,000 a 25,000 USD | 15,000 a 30,000 USD |
| Complejidad operativa | Alta | Baja | Media |
| Servicios ML/AI | Excelente (SageMaker) | Limitado | Excelente (Vertex AI) |
| Curva de equipo | Alta | Baja | Media |
| Lock-in | Alto | Bajo (Postgres puro) | Medio |
| Total mensual pyme 1 TB | 400 a 1,000 USD | 150 a 300 USD | 200 a 500 USD |
¿Cuándo vale la pena AWS para data lake pyme?
AWS gana cuando: ya estás en AWS por otras razones (tu app corre en EKS, tu base operacional es RDS, tienes Lambdas), cuando manejas más de 10 TB con queries pesadas Athena o Spark vía EMR, o cuando vas a usar servicios específicos como SageMaker para ML.
Para una pyme mexicana arrancando data lake sin AWS previo, AWS es overkill: requiere equipo con experiencia AWS, costos predictibles complicados, y la curva de aprendizaje es alta.
¿Cuándo Supabase nativo gana?
Supabase nativo gana para pyme mexicana con 100 GB a 1 TB porque: es Postgres puro (tu equipo ya sabe SQL), el precio entry de Supabase Pro es 25 USD al mes, el storage adicional escala lineal sin sorpresas, no hay lock-in (puedes exportar a Postgres self-hosted en horas), y la arquitectura Bronze/Silver/Gold se implementa con esquemas separados y dbt o vistas materializadas.
En una distribuidora cliente nuestra (industria de control de plagas, sede Ciudad de Guatemala) implementamos data lake con Supabase nativo:
- 3.6 millones de filas migradas a Supabase en 48 horas.
- 197 tablas snapshot legacy de SQL Server 2019.
- 825 silver views, 75 gold materialized views.
- 73 gold tables finales normalizadas.
- 57 RLS policies y 17 roles RBAC.
- 1.17 TB en GCS como bronze parquet raw.
- Verificación fila-a-fila: source = bronze = silver = gold.
Inversión total del proyecto completo (no sólo data lake): 26,000 USD pago único en 12 semanas. La parte de data lake en sí cabe en el rango 12,000 a 18,000 USD si se cotiza por separado. Operación mensual: cerca de 100 USD en Supabase Pro más storage adicional.
¿Qué es Bronze, Silver, Gold y por qué importa el costo?
Bronze: datos crudos como llegan de los sistemas fuente (ERP, CRM, hojas de cálculo, PDFs, APIs). No se modifica, se preserva tal cual para auditabilidad. Storage barato (parquet en S3 o Supabase Storage).
Silver: datos normalizados y limpios. Se aplican validaciones, deduplicación, tipos correctos, joins de referencia. Es la capa que tu equipo de datos consulta.
Gold: tablas de decisión listas para BI y reportes ejecutivos. KPIs precalculados, vistas materializadas, agregados por dimensión. Es lo que conecta tu dashboard.
El patrón Bronze/Silver/Gold importa porque te permite reprocesar (si descubres bug en Silver, regeneras desde Bronze sin perder originales), auditar (cada Gold se traza a Silver y a Bronze) y escalar (cada capa optimiza para su caso de uso). Cuando los datos se unifican, los problemas se anuncian solos.
¿Cuándo conviene MAGIA Core completo?
MAGIA Core incluye data lake unificado Bronze/Silver/Gold como parte de la fase Mapeo + Arquitectura. Costo total 15,000 USD pago único más infraestructura cloud pass-through 200 a 400 USD al mes. Es 12 semanas con data lake unificado, blueprint ejecutivo, sistema a medida construido módulo por módulo, despliegue paralelo, capacitación y autonomía total. Código a tu nombre.
Comparado con AWS data lake suelto (40,000 USD implementación más 600 USD al mes operación), MAGIA Core sale más barato a 18 meses y entrega data lake más sistema completo, no sólo plumbing.
Próximos pasos
Si ya estás en AWS pesado, cotiza AWS data lake con un partner serio y pide breakdown mensual realista. Si arrancas data lake desde cero, Supabase nativo con dbt te sale más simple y económico. Si necesitas data lake como parte de transformación operativa completa, agenda una llamada de 30 minutos sobre tu operación.
- MAGIA Core si quieres data lake unificado más sistema a medida en 12 semanas, código a tu nombre.
- MAGIA Forge si tu operación requiere arquitectura multi-tenant con IA y guardrails sobre data lake.
Sin retainers, sin licencias atadas, código a tu nombre.