Unidad 6•12 min

Agentes: IA que piensa, planifica y actúa

Entiende los patrones arquitectónicos que convierten un modelo reactivo en un agente autónomo capaz de resolver problemas complejos

Hasta ahora hemos tratado a los modelos de IA como oráculos: les preguntas algo, responden y termina la interacción. Pero la frontera más activa de la IA aplicada está en sistemas que no solo responden preguntas, sino que toman decisiones, invocan herramientas y ejecutan acciones en secuencia para resolver un objetivo complejo. Eso son los agentes, y comprender su arquitectura te permite ver posibilidades que antes parecían ciencia ficción.

Chain-of-Thought: la técnica que hace que el modelo muestre su trabajo antes de responder

Cuando un humano resuelve un problema difícil, razona en voz alta antes de concluir. Los modelos de lenguaje hacen lo opuesto por defecto: saltan directamente a la conclusión, acumulando errores de razonamiento en el proceso. Chain-of-Thought obliga al modelo a externalizar sus pasos intermedios antes de emitir una respuesta final. Es como pedirle que 'muestre la operación' en vez de solo el resultado.

Chain-of-Thought (CoT) es la técnica de forzar al modelo a generar pasos de razonamiento intermedio antes de su respuesta final. Esto reduce las tasas de alucinación en tareas de inferencia deductiva en márgenes del 40 al 60%. Los sistemas avanzados como Claude usan un bloque interno <thinking> donde el agente descompone el problema, critica sus suposiciones y verifica su lógica antes de emitir cualquier respuesta visible.

ReAct: el bucle de razonamiento y acción que define a los agentes modernos

ReAct (Reasoning + Acting) es el patrón donde un agente alterna entre pensar y actuar en un bucle iterativo. El modelo razona sobre lo que necesita, decide invocar una herramienta (buscar en la web, ejecutar código, consultar una API), espera el resultado de esa herramienta y vuelve a razonar con la nueva información. Este ciclo continúa hasta que el agente tiene suficiente información para construir una respuesta final. La diferencia con un modelo estático es radical: el agente puede resolver problemas que requieren información que no tenía al inicio.

Los cuatro patrones de orquestación agéntica y cuándo usar cada uno:

Chain-of-Thought: razonamiento intermedio explícito. Ideal para matemáticas, lógica deductiva y análisis profundo. Bajo costo, sin herramientas externas.
ReAct (bucle infinito): alterna razonamiento con invocación de herramientas. Ideal para investigaciones exploratorias y flujos donde cada paso depende del anterior.
Plan-and-Execute: el agente planifica todas las sub-tareas primero, luego las ejecuta en paralelo. Ideal para investigaciones multidimensionales donde las tareas son independientes.
ReWOO (Reasoning Without Observation): planificación determinista sin bucles de retroalimentación. Ideal para entornos sensibles a latencia y costo donde la predictibilidad es crítica.

Caso de Ejemplo

"En 2024, un equipo de inteligencia de mercado en una empresa de consumo masivo en Buenos Aires implementó un agente Plan-and-Execute para análisis competitivo. En vez de hacer 15 búsquedas secuenciales (donde cada una esperaba el resultado de la anterior), el agente planificaba todas las consultas al inicio y las ejecutaba en paralelo con hilos asíncronos. El tiempo de análisis completo bajó de 18 minutos con ReAct a 4 minutos con Plan-and-Execute, sin perder profundidad en los resultados."

Consejo FLOW: Al diseñar un agente, elige el patrón más simple que resuelva tu caso. ReAct es poderoso pero costoso en tokens y tiempo cuando las tareas son independientes. Si puedes separar las sub-tareas de antemano, Plan-and-Execute te da el mismo resultado a menor costo.

Resumen de la unidad

Chain-of-Thought reduce las alucinaciones en 40-60% al forzar al modelo a externalizar pasos de razonamiento intermedios antes de su respuesta final.
ReAct convierte un modelo estático en un agente que alterna razonamiento con invocación de herramientas en un bucle hasta construir la respuesta final.
Plan-and-Execute divide el problema primero y ejecuta sub-tareas en paralelo, reduciendo latencia en investigaciones multidimensionales.
ReWOO elimina los bucles de retroalimentación para máxima eficiencia en entornos donde la predictibilidad y el costo son críticos.

Actividad de reflexión

Piensa en un proceso de tu trabajo que hoy haces manualmente en varios pasos (investigación, análisis, generación de contenido, etc.). Describe cómo funcionaría como agente: qué patrón usarías (CoT, ReAct, Plan-and-Execute, ReWOO), qué herramientas necesitaría invocar y cuál sería el objetivo final. Detalla al menos 4 pasos del agente.