¿La IA realmente es tonta o solo está mal aplicada?

Las dos cosas. Los modelos siguen alucinando datos cuantitativos sin guardrails. Pero el 80 por ciento de los fracasos vienen de aplicarla a procesos donde no aporta y dejarla decidir sin validación en código.

¿En qué procesos NO conviene usar IA generativa hoy?

Cálculo financiero exacto, asignación de inventario con stock real, decisiones legales con consecuencias regulatorias y reembolsos arriba de un umbral. Para esos casos usamos lógica determinística con la IA solo generando narrativa sobre datos verificados.

¿Qué son los guardrails de los que tanto hablan?

KPIs calculados en TypeScript, no en respuestas del modelo. Narrativa generada sobre datos verificados. En el caso TN GlobalLink, 28 KPIs viven en código JavaScript y la IA solo redacta el párrafo explicativo.

¿Vale la pena esperar a que mejore antes de implementar?

No. La IA actual ya entrega 10 a 20 veces el ROI en procesos correctos (atención WhatsApp, OCR de PDFs, redacción de propuestas). Esperar otros 18 meses cuesta más que implementar con los límites actuales reconocidos.

Por suerte la IA sigue siendo medio tonta

La IA falla más de lo que admite. Guía operativa para decidir qué procesos automatizar con IA, dónde poner guardrails y qué dejar en manos humanas.

La IA en 2026 sigue siendo mediocre en aritmética exacta, decisiones con consecuencias regulatorias y razonamiento de largo plazo. Esa torpeza es buena noticia: te obliga a poner guardrails, a separar lo determinístico de lo generativo y a no confundir un wrapper de ChatGPT con un sistema. Esta guía decide por ti qué automatizar, qué frenar y dónde poner código en lugar de prompts.

¿Por qué celebrar que la IA siga siendo medio tonta?

Porque obliga a la disciplina que los grandes proyectos de software siempre exigieron: arquitectura antes que magia. Cuando un modelo no puede calcular bien un cierre contable, te ahorra contratar a alguien que te venda IA como bala de plata.

Esta torpeza también funciona como filtro de proveedores. La boutique que promete reemplazar humanos en cierres financieros en seis meses está vendiendo humo. La boutique que propone separar lo determinístico de lo generativo desde el primer sprint está vendiendo arquitectura. La diferencia se nota en el contrato y en la documentación que te entregan.

El modelo mental que más rinde para PyMEs LATAM evaluando IA es separar tres tipos de problema. Lo que tiene salida cuantitativa exacta (revenue, stock, deuda) se resuelve con código y se explica con IA. Lo que es conversacional con datos del catálogo se delega a IA con guardrails. Lo que requiere juicio costoso se rutea a humano siempre. Tres tipos, tres tratamientos, cero confusión.

Los tres errores que vemos en cada empresa

Pegar ChatGPT a WhatsApp y llamarle bot. Pedirle al modelo que calcule precios o stock. Cero trazabilidad: si el cliente reclama un precio, no hay log de la conversación con el dato fuente. Cualquiera de los tres mata el proyecto en seis meses.

En la práctica, esto se traduce a una regla simple. Cualquier número que aparezca en un dashboard ejecutivo se calcula en código y se prueba con tests automatizados. Cualquier párrafo que explica ese número puede generarse con IA siempre que los datos de entrada estén verificados. Cuando los datos se unifican, los problemas se anuncian solos y la narrativa se vuelve diagnóstico, no decoración.

Una pregunta que separa proveedor serio de vendedor de humo: pídele que muestre cómo el modelo se equivoca y cómo el sistema lo detecta. Si la respuesta describe casos reales con guardrails específicos, conversación seria. Si la respuesta es vaga sobre fine-tuning futuro, conversación cerrada. Los proveedores adultos no esconden los límites del modelo, los gestionan.

Lo que sí automatizamos con guardrails

Atención conversacional con voz de marca (24/7), ruteo a humano cuando detecta frustración o monto alto, OCR de PDFs con validación cruzada, redacción de propuestas a partir de datos en CRM, calificación de leads por intención. En todos los casos: dato calculado en código, narrativa generada por IA.

Otra señal de implementación adulta: versionado de prompts en git. Cuando un comportamiento del bot cambia, hay un commit que lo explica. Sin versionado, el sistema empieza a comportarse distinto y nadie sabe por qué. Esto es básico y casi nadie lo respeta en producción.

Para empresas que aún consideran si entrar a IA, la pregunta operativa es simple. ¿Qué dolería más, no tener IA en cinco años o implementarla mal en seis meses? La respuesta casi siempre es la primera. Pero implementarla mal es más costoso a corto plazo. Por eso la disciplina de arquitectura, guardrails y audit trail importa más que la tecnología subyacente.

El caso real: 28 KPIs en código, IA solo redactando

Para una distribuidora con 100 franquicias, montamos reportería con 28 KPIs hardcoded en JavaScript. La IA escribe el párrafo de cada sección, pero nunca toca el número. La franquicia ve el KPI exacto y la explicación generada. Cero hallucinations en métricas. Auditable. Defendible.

Si tu empresa todavía mete IA encima de hojas de cálculo desconectadas, el problema no es la IA. Es la base. La buena noticia es que la base se construye en 12 semanas con disciplina. La mala noticia es que sin esa base, la IA amplifica el caos en lugar de resolverlo.

Una práctica que distingue empresas LATAM serias es revisión trimestral de cada IA productiva. Auditar audit trail, revisar prompts versionados, validar que los guardrails sigan activos, evaluar nuevos modelos disponibles. Esa cadencia trimestral evita que el sistema se degrade y permite tomar ventaja de mejoras del ecosistema sin disruption.

Cómo decidir qué automatizar: la tabla de 4 preguntas

Si el proceso tiene salida cuantitativa exacta, usa código y narrativa IA. Si es conversacional con datos del catálogo, usa IA con guardrails. Si tiene impacto legal o financiero arriba de un umbral, escala a humano siempre. Si es repetitivo y no requiere juicio, automatízalo entero.

Cualquier evaluación seria de proveedor de IA debe pedir tres cosas. Ejemplo de KPI calculado en código que muestre la lógica completa. Ejemplo de prompt versionado en repo público o privado. Audit trail de una decisión del modelo de la semana pasada. Sin las tres, conversación cerrada.

El criterio para escalar IA en la empresa es lineal. Primer caso: uno solo, bien resuelto, bien medido. Segundo caso: otro proceso adyacente, con aprendizajes del primero. Tercer caso: empieza a aparecer el patrón. A los seis meses, la empresa tiene capacidad genuina, no dependencia de proveedor. Saltar pasos rompe la curva de aprendizaje.

Próximos pasos

Si tu empresa está atrapada entre cinco SaaS desconectados y planeas meter IA encima de ese caos, primero unifica los datos. Lo que antes tomaba 30 ingenieros y 18 meses lo entregamos en 12 semanas con MAGIA Core. Llamada de 30 minutos, sin pitch deck, conversación real sobre tu operación.

Una pregunta concreta para evaluar el grado de madurez de un proveedor: pídele un ejemplo de cómo separa lo que calcula código de lo que redacta IA. Si la respuesta es vaga, conversación cerrada. Si la respuesta describe arquitectura específica con audit trail visible, conversación abierta. La distinción es operativa, no académica.