Temperatura y parámetros: la perilla que nadie te explicó
Entiende cómo la temperatura y el Top-P controlan la creatividad y la precisión del modelo, y cuándo usar cada configuración
La mayoría de las personas usa los modelos de IA con la configuración por defecto para todo: para redactar un poema creativo, para extraer datos de una factura y para generar código de producción. Eso es como cocinar a la misma temperatura un soufflé y un asado. Esta unidad te explica cómo ajustar los parámetros que controlan el comportamiento del modelo según lo que realmente necesitas.
¿Qué pasa dentro del modelo cuando genera texto? La respuesta cambia todo
Cuando un modelo genera texto, en realidad está evaluando en cada paso una distribución de probabilidad sobre todos los tokens posibles y eligiendo cuál sigue. La temperatura es el ajuste que aplana o aguza esa distribución. Una temperatura baja concentra la probabilidad en las opciones más predecibles, como una cámara con profundidad de campo reducida que solo enfoca lo más probable. Una temperatura alta distribuye la probabilidad más uniformemente, habilitando opciones sorprendentes o creativas que normalmente serían ignoradas.
Temperatura cercana a 0: el modelo elige casi siempre el token más probable. Ideal para extracción de datos, clasificación, código determinista y preguntas con una sola respuesta correcta. Temperatura alta (0.7–1.0): el modelo introduce variedad estadística. Ideal para generación creativa, brainstorming, redacción de contenido con voz propia. Top-P es un parámetro complementario que limita el modelo a elegir solo entre los tokens cuya probabilidad acumulada supera el umbral P, sin importar la temperatura.
Temperatura vs Top-P: no son lo mismo aunque parezca que hacen lo mismo
La temperatura escala toda la distribución de probabilidad. Top-P trunca la distribución a los tokens más probables hasta sumar el porcentaje P. En la práctica, los expertos recomiendan ajustar uno a la vez, no ambos simultáneamente, porque interactúan de formas difíciles de predecir. Para tareas de producción, lo más común es fijar Top-P en 0.9 o 1.0 y variar solo la temperatura.
Configuraciones de temperatura según tipo de tarea:
- Temperatura 0.0 – 0.2: extracción de datos estructurados, clasificación, código determinista, preguntas de hecho.
- Temperatura 0.3 – 0.5: resúmenes, traducciones, respuestas técnicas que admiten cierta variación de redacción.
- Temperatura 0.6 – 0.8: redacción de contenido, correos, textos de marketing, respuestas conversacionales.
- Temperatura 0.9 – 1.0+: brainstorming, poesía, generación de ideas creativas, experimentos de estilo.
Caso de Ejemplo
"En 2023, un equipo de desarrollo de una fintech en Bogotá detectó que su agente de atención al cliente generaba respuestas inconsistentes para la misma pregunta: a veces citaba bien la política de devoluciones, a veces la parafraseaba incorrectamente. El diagnóstico: temperatura en 0.7 para un caso de uso que requería consistencia factual total. Al bajarla a 0.1, la varianza en las respuestas cayó a cero y el CSAT del canal de chat subió 18 puntos en el siguiente mes."
Consejo FLOW: Si usas una API directa, siempre define explícitamente la temperatura en tu llamada. No dependas del valor por defecto, que varía entre plataformas y versiones del modelo. Un parámetro explícito es un prompt más predecible.
Resumen de la unidad
- La temperatura controla cuánta variedad estadística introduce el modelo en cada token generado: baja para precisión, alta para creatividad.
- Top-P es un parámetro complementario que trunca la distribución a los tokens más probables; se recomienda ajustar solo uno a la vez.
- Usar temperatura alta en tareas que requieren consistencia factual genera respuestas variables e incorrectas, sin importar cuán bien redactado esté el prompt.
- La temperatura no es un detalle técnico: es parte del diseño de la instrucción y debe elegirse según la naturaleza de la tarea.
Actividad de reflexión
Identifica al menos tres tareas distintas que haces regularmente con IA en tu trabajo. Para cada una, indica qué temperatura usarías y por qué. Especifica el tipo de tarea y el rango de temperatura recomendado.
