Glosario

Definiciones de los conceptos utilizados en la transformación con IA.

Madurez en IA

AI-Assisted – La IA es una herramienta personal; nada estructural cambia si desaparece. Ver el marco de referencia.

AI-Integrated – La IA está integrada en los flujos de trabajo; los roles pasan de hacer a dirigir. Ver el marco de referencia.

IA-nativa – El diseño del trabajo asume la IA como recurso de primer nivel; los roles se definen por el juicio, no por la ejecución. Ver el marco de referencia.

AI-Supportive – El liderazgo apoya la IA personalmente sin impulsar la adopción organizacional. Ver el marco de referencia.

AI-Operational – El liderazgo establece expectativas basadas en el rol y financia la automatización antes de contratar. Ver el marco de referencia.

AI-Strategic – El liderazgo rediseña la organización en torno a la IA y hace de la alfabetización en IA una condición de liderazgo. Ver el marco de referencia.

No expuesto (Tier 0) – La IA no forma parte del trabajo. Sin experimentación, sin conocimiento de las capacidades. Ver el marco de referencia.

IA-curioso (Tier 0.5) – Ha probado la IA pero no ha cambiado cómo se hace el trabajo. La brecha hasta el Tier 1 no es conocimiento sino el hábito de recurrir a la IA cuando comienza el trabajo. Ver el marco de referencia.

IA-consciente (Tier 1) – El individuo usa la IA como herramienta personal sin cambiar los flujos de trabajo. Ver el marco de referencia.

IA-constructor (Tier 1.5) – Diseñando y probando activamente flujos de trabajo con IA. Construyendo prompts, iterando, experimentando. La fase de construcción entre el uso ad hoc y los flujos de trabajo establecidos. Aquí es donde la mayoría de las personas se estancan. Ver el marco de referencia.

IA-aumentado (Tier 2) – El individuo integra la IA en flujos de trabajo recurrentes de manera sistemática. Ver el marco de referencia.

IA-avanzado (Tier 2.5) – Construyendo sistemas donde la IA maneja la mayor parte de la ejecución. Múltiples procesos rediseñados. El título del rol no ha cambiado pero el trabajo interior sí. Ver el marco de referencia.

IA-nativo (Tier 3) – El rol rediseñado en torno al juicio y la dirección. La persona prevé hacia dónde se moverá el límite humano-agente y asigna su atención donde crea más valor. Ver el marco de referencia.

Ingeniería con IA

Producción autónoma (Peldaño 5)

Modelo de ingeniería donde la especificación entra y el software sale sin intervención humana sobre el código. El humano define la arquitectura, las restricciones y los escenarios; la IA produce, prueba e itera el código. También conocida como fábrica oscura. Ver el Laboratorio de IA.

Codificación asistida (Peldaño 0)

Modo de desarrollo donde el humano codifica y la IA sugiere completaciones. El nivel más bajo de asistencia de IA en la ingeniería de software.

Desarrollo no interactivo

Modo de trabajo donde las especificaciones y los escenarios impulsan a agentes autónomos. El humano no codifica ni conversa con el agente durante la ejecución. Ver el Laboratorio de IA.

Escenarios

Recorridos de usuario de extremo a extremo que describen el comportamiento esperado desde la perspectiva del usuario. Favorecidos sobre las pruebas unitarias porque son más difíciles de eludir por los agentes. Ver el Laboratorio de IA.

Métrica de satisfacción

Enfoque de evaluación que mide la fracción de trayectorias a través de todos los escenarios que satisfacen al usuario, en lugar de un resultado binario verde/rojo. Ver el Laboratorio de IA.

Ingenuidad deliberada

La postura de eliminar las convenciones de desarrollo tradicionales y preguntar sistemáticamente: "¿Por qué estoy haciendo esto? El modelo debería hacerlo." Ver el Laboratorio de IA.

Greenfield

Un proyecto que comienza desde cero, sin código existente. El terreno más natural para el desarrollo no interactivo. Ver el Laboratorio de IA.

Brownfield

Un proyecto con código y hábitos existentes, en transición al modelo de producción autónoma. Más difícil que el greenfield, pero más impactante. Ver el Laboratorio de IA.

Híbrido

Un estado de código en el que un nuevo servicio listo para el Nivel 5 coexiste con sistemas de la organización que son brownfield. El nuevo servicio se evalúa como greenfield; cada límite de integración heredada se trata por separado. Ver Estrategia brownfield.

Madurez del código

Cuadrícula de madurez del código (Codebase Readiness Grid)

El diagnóstico de nueve dimensiones que puntúa un repositorio del 1 al 5 por dimensión. La puntuación más baja es el techo del nivel de madurez en el que puede operar de manera fiable. Disponible como habilidad de código abierto para Claude Code. Ver Madurez del código.

Niveles de madurez del código (Opaco → Gobernado por escenarios)

Los cinco niveles que describen lo que soporta un repositorio: Nivel 0 Opaco, Nivel 1 Instrumentado, Nivel 2 Validado, Nivel 3 Legible, Nivel 4 Especificado, Nivel 5 Gobernado por escenarios. Cada nivel se define por el mecanismo de retroalimentación que agrega. Ver Madurez del código.

Andamiaje (harness)

La infraestructura que rodea a un agente de codificación con IA que restringe y valida su resultado. Dos partes: guías (feedforward: tipos, convenciones, documentación, arquitectura) y sensores (feedback: pruebas, IC, observabilidad). Enmarcado por Fowler como "Agent = Model + Harness". En códigos brownfield, construir el andamiaje es el punto de apalancamiento, no elegir un mejor modelo. Ver Madurez del código.

Affordances ambientales

Propiedades estructurales de un código que lo hacen legible para un agente de IA sin instrucción explícita: tipado fuerte, límites de módulo claros, nomenclatura consistente, frameworks establecidos, límites de dependencia explícitos. Su ausencia obliga a los agentes a inventar estructura o inyectar inconsistencia. Ver Madurez del código.

Topología de los bucles de retroalimentación

La estructura de los mecanismos de retroalimentación en un código: qué tan rápido devuelven señal las pruebas, cuán completa es la observabilidad, cuán claro es el contrato de comportamiento. El nivel de madurez de un código es una función directa de esta topología. Ver Madurez del código.

Actualidad de dependencias y tiempo de ejecución

Dimensión 9 de la Cuadrícula de madurez: si el tiempo de ejecución está soportado y los frameworks están dentro de 1-2 versiones principales de la actual. Los agentes están entrenados con idiomas y versiones actuales; un código que usa patrones 2-3 años atrás recibe código que contradice sus propias convenciones. Ver Madurez del código.

Dimensiones bloqueantes

Las tres dimensiones de la Cuadrícula (D1 cobertura de pruebas, D2 estrictez de tipos, D5 transparencia de la API) cuyas puntuaciones bajas comprometen fundamentalmente el trabajo del agente. No pueden compensarse con puntuaciones altas en otras áreas. Ver Madurez del código: cómo funciona la puntuación.

Dimensiones restrictivas

Las seis dimensiones de la Cuadrícula (D3, D4, D6, D7, D8, D9) cuyas puntuaciones bajas degradan la calidad pero no impiden que los agentes produzcan valor. Más revisión humana, más fricción, pero sin bloqueo fundamental. Ver Madurez del código.

Camino al Nivel 5

La recomendación de remediación priorizada que produce la Cuadrícula de madurez del código: qué dimensiones elevar primero, en qué orden, para llegar al Nivel 5 de la manera más eficiente. Ver Madurez del código.

Estrategia brownfield

Los cuatro modos brownfield

Los cuatro caminos al Nivel 5 para códigos existentes: Remediar en el sitio (el Nivel 5 ocurre en este código), Strangler-fig (el Nivel 5 ocurre gradualmente mientras las partes antiguas se retiran), Reconstrucción completa (el Nivel 5 ocurre en una nueva versión), Aislar y evitar (el Nivel 5 ocurre en nuevos códigos junto al heredado congelado). Ver Estrategia brownfield.

Aislar y evitar

Modo 4 de la estrategia brownfield: congelar el sistema heredado, mantenerlo con manos humanas y construir nuevo valor como nuevas aplicaciones listas para el Nivel 5 junto a él. Compra tiempo; no resuelve el problema. Ver Estrategia brownfield.

Research-Review-Rebuild

La metodología brownfield de Fowler y EPAM: Fase 1 Investigación (la IA analiza el código existente y reconstruye la intención), Fase 2 Revisión (los expertos de dominio validan el mapa de intención), Fase 3 Reconstrucción (la IA genera código de reemplazo con intención validada). El orden es importante; omitir las primeras fases produce resultados incorrectos más rápido. Ver Estrategia brownfield.

Spec-from-code

La inversión brownfield del desarrollo spec-first: el código ya existe y la especificación debe extraerse de ingeniería inversa antes de que el trabajo spec-first pueda reanudarse. Primer paso: extraer la especificación implícita; segundo: escribir escenarios de extremo a extremo; tercero: verificar que pasen con el código existente. Ver Estrategia brownfield y Estándares de ejecución.

Migración Strangler-fig

Modo 2 de la estrategia brownfield: construir nueva funcionalidad lista para el Nivel 5 junto al sistema antiguo, enrutar el tráfico a través de una fachada y eliminar partes del sistema antiguo a medida que las nuevas demuestran su valor. Requiere costuras limpias para la extracción. Ver Estrategia brownfield.

Technical Debt Quadrant

Marco de Fowler que clasifica la deuda técnica en cuatro tipos: prudente-deliberada, prudente-inadvertida, imprudente-deliberada, imprudente-inadvertida. La deuda imprudente-inadvertida es el candidato más fuerte a la reconstrucción completa; refleja ignorancia que el conocimiento posterior no puede deshacer en el mismo lugar. Ver Estrategia brownfield.

Identificación de costuras

El trabajo de encontrar los puntos en un código heredado donde las responsabilidades pueden extraerse sin acoplarse a otros módulos. Las costuras limpias son el prerequisito para el Strangler-fig; sin ellas, el intento se convierte en una reconstrucción completa con pasos adicionales. Ver Estrategia brownfield.

Técnicas de Black Box to Blueprint

Las cinco técnicas de Fowler para la ingeniería inversa de la intención cuando el equipo original se ha ido y la documentación es incorrecta: reconstrucción de la capa de UI, captura de cambios en datos, inferencia de lógica de servidor, arqueología binaria, enriquecimiento multi-pasada progresivo. Ver Estrategia brownfield.

Habilidades con IA

Alfabetización en IA – Uso estructurado de herramientas de IA y capacidad de distinguir el uso ad hoc de la integración en flujos de trabajo. Ver la guía para empleados.

Diseño de prompts – Instrucciones claras, formato especificado, ejemplos, ambigüedad resuelta. Ver los estándares de ejecución.

Ingeniería de contexto – Archivo de contexto estructurado cargado antes de las tareas de IA. Ver los estándares de ejecución.

Ingeniería de intención – Jerarquía de objetivos definida, reglas de compensación y condiciones de escalación. Ver los estándares de ejecución.

Ingeniería de especificaciones – Cada tarea no trivial tiene una especificación escrita completa construida a partir de cinco primitivas. Ver los estándares de ejecución y la Guía de especificación para ejemplos prácticos.

Especificación – Un documento que define un problema con suficiente precisión para que un agente lo resuelva de manera autónoma. Ver los estándares de ejecución y la Guía de especificación.

Declaraciones de problema autocontenidas – Problema enunciado con suficiente contexto para ser resoluble sin información adicional. Ver los estándares de ejecución.

Criterios de aceptación – Cómo se ve el resultado terminado, verificable por un observador independiente. Ver los estándares de ejecución.

Arquitectura de restricciones – Cuatro categorías por tarea: Debe, No debe, Prefiere, Escalar. Ver los estándares de ejecución.

Descomposición – Tareas divididas en componentes independientemente ejecutables, verificables e integrables. Ver los estándares de ejecución.

Diseño de evaluación – Casos de prueba con resultados conocidos como buenos para validar y detectar regresiones. Ver los estándares de ejecución.

Diseño de costuras

La práctica de estructurar el trabajo de modo que las transiciones entre las fases humanas y las del agente sean limpias, verificables y recuperables. Una buena costura define el artefacto de traspaso, permite verificar el resultado del agente en el punto de transición y posibilita la intervención sin empezar de nuevo. Las costuras se desplazan a medida que evolucionan las capacidades. Ver la guía para empleados.

Economía de la transformación

Migración de valor

La tecnología reasigna el valor hacia la capa más escasa. En la transformación con IA, el valor abandona la ejecución (commodity) y se concentra en el juicio, el encuadre y la propiedad del riesgo (premium). Ver la visión.

Las 5 funciones humanas

Dirección, Juicio, Criterio, Relación, Responsabilidad. Las funciones que permanecen irremplazables en una organización IA-nativa. Ver la visión.

Evolución de roles

Convergencia – Múltiples roles se fusionan porque la IA elimina la sobrecarga de coordinación que justificaba separarlos. El rol convergido retiene la superficie de juicio combinada. Ver Evolución de Roles.

Especialización – Un rol se estrecha a su núcleo humano irreducible a medida que la IA absorbe la capa rutinaria. El rol se vuelve más preciso, no más pequeño. Ver Evolución de Roles.

Elevación – Los humanos pasan de producir artefactos a especificarlos y evaluarlos. Corresponde a la Regla de Traducción Universal. Ver Evolución de Roles.

Absorción – Las responsabilidades de un rol son absorbidas por roles adyacentes o sistemas. Las responsabilidades se redistribuyen; el rol se contrae o desaparece. Ver Evolución de Roles.

Emergencia – Surgen roles estructuralmente nuevos a partir de la estructura organizacional IA-nativa. Nombrados por su responsabilidad, no por la tecnología. Ver Evolución de Roles.

Matriz de Decisión de Roles – Una herramienta estructurada que mapea condiciones observables al patrón de evolución más probable y la acción recomendada. Ver Evolución de Roles.

Adopción y transición

Curva J de adopción

La caída de productividad predecible durante la adopción de IA. La productividad cae antes de subir. Las organizaciones que salen son las que rediseñan sus flujos de trabajo en torno a las capacidades de la IA. Ver la guía para gestores.

Brief de transición

Un documento estructurado entregado por un empleado que describe su rol actual, visión IA-nativa, brecha, sistemas a construir, métricas y plan 30/60/90. Ver la guía para empleados.

Clínicas de IA

Sesiones regulares (semanales o quincenales) donde el equipo comparte descubrimientos, bloqueadores y flujos de trabajo. Formato corto (30 min). El objetivo es el aprendizaje entre pares. Ver la guía para gestores.

Muro de los seis meses

Patrón de fallo donde los proyectos impulsados por IA sin fuerte participación humana (especificaciones, escenarios, arquitectura) acumulan deuda estructural que explota después de aproximadamente seis meses. Los escenarios son la defensa principal. Ver el Laboratorio de IA.

Decaimiento de calibración

Las habilidades de IA caducan a medida que evolucionan las capacidades. Una persona que calibró su sentido del límite humano-agente hace seis meses ahora está confiando demasiado o infrautilizando los modelos actuales. El antídoto es la densidad de retroalimentación: ciclos frecuentes de delegar-evaluar-ajustar con modelos actuales, no formación puntual. Ver la guía para gestores.

Coste cognitivo

Curva en J cognitiva

El contraparte en energía mental de la curva J de productividad. La carga cognitiva aumenta bruscamente durante la transición Tier 1→2 (aprender a especificar, evaluar resultados poco fiables, mantener la carga de trabajo habitual) y disminuye una vez que los flujos de trabajo se estabilizan en el Tier 2. El agotamiento se concentra en la transición, no en el estado final. Ver Coste cognitivo.

Sobrecarga cognitiva (brain fry)

Fatiga mental provocada por la supervisión de IA que supera la capacidad cognitiva. Síntomas: niebla mental, decisiones más lentas, aumento de tasas de error. El estudio de BCG/UC Riverside encontró que las ganancias de productividad se revierten a partir de tres herramientas de IA simultáneas. Ver Coste cognitivo.

Fatiga decisional

Agotamiento por el volumen de microdecisiones que introduce la IA. Cada resultado de IA es una decisión (suficientemente bueno, editar, regenerar, confiar, verificar) y el volumen degrada la calidad de las decisiones que realmente importan. Ver Coste cognitivo.

Fatiga de vigilancia

Agotamiento por la monitorización sostenida de sistemas de IA que generalmente son correctos. Estructuralmente similar a la complacencia ante la automatización en aviación: la atención se dispersa porque el sistema funciona bien la mayor parte del tiempo, y los errores parecen plausibles. Ver Coste cognitivo.

Intensificación del trabajo

El patrón por el cual la IA amplía el alcance en lugar de reducirlo. Tres mecanismos: expansión de tareas (las personas asumen trabajo que antes no habrían intentado), difuminación de límites (las herramientas de IA se perciben como informales, el trabajo se extiende) y mayor multitarea (la IA genera en paralelo mientras los humanos supervisan). Ver Coste cognitivo.

Inflación de la carga de trabajo

La tentación organizacional de aumentar las cuotas de producción de forma proporcional a la velocidad habilitada por la IA. La capacidad de producción escala con la IA; la capacidad de juicio no. Duplicar las cuotas de producción porque los borradores salen más rápido es cómo las personas más comprometidas se agotan. Ver Coste cognitivo.

Ansiedad por la IA

Estrés anticipatorio impulsado por la incertidumbre sobre la seguridad laboral, la relevancia de las habilidades y la trayectoria profesional. Distinta del "brain fry": afecta a las personas que temen la IA, incluidas las que aún no han empezado a usarla. Ver Coste cognitivo.

Disrupción de identidad

Pérdida de identidad profesional cuando la IA realiza habilidades que definían la autoimagen. Incluso cuando los roles mejoran objetivamente, los trabajadores reportan sentimientos de obsolescencia, pérdida de propósito y reducción de la autoestima. Ver Coste cognitivo.

Indefensión aprendida

El patrón de retirada cuando los sistemas de IA toman decisiones que los trabajadores no entienden, no controlan o no pueden revertir. Las personas dejan de pensar críticamente sobre el resultado de la IA y ceden incluso cuando no están de acuerdo. El patrón más peligroso para la transformación porque parece conformidad. Ver Coste cognitivo.

Fatiga de transformación

Agotamiento acumulado por el cambio constante (nuevas herramientas, nuevos flujos de trabajo, nuevas expectativas) encima de la carga de trabajo habitual. No es específica de la IA pero se ve agravada por ella. Una respuesta racional a la demanda cognitiva sostenida sin suficiente recuperación. Ver Coste cognitivo.

Realidad operacional en T3 / R5

Unidad operacional de cinco etapas

La unidad operacional recurrente en el Tier 3 / Peldaño 5: Contexto → Clarificación → Ejecución → Validación → Recuperación. Los humanos se concentran en los límites (delantero: especificación y clarificación; trasero: validación y recuperación); el agente corre por dentro. La misma forma se aplica en los dominios de tareas discretas, independientemente del sustrato. Ver Laboratorio de IA § Las cinco etapas.

Trabajo en los dos límites

El patrón estructural del trabajo Tier 3 / Peldaño 5: la atención humana se concentra en el límite delantero (preparación del contexto + clarificación) y en el límite trasero (validación + recuperación). Dentro del bucle, el agente corre sin supervisión. El cambio es de la revisión línea por línea a la dirección y juicio por bucle.

Patrón de tarea discreta

La categoría de trabajo donde la IA opera como la capa de ejecución: una unidad clara (historia, ticket, transacción, consulta, cláusula contractual), resultados verificables, riesgo graduable. Encajan ingeniería, atención al cliente, operaciones financieras, revisión legal e investigación del conocimiento. Los patrones v3 del marco se aplican en toda esta categoría. El trabajo continuo / creativo / interpersonal (ventas, marketing creativo, diseño, RRHH) requiere un marco diferente: aplazado a una futura vía v4+ de aumentación.

Diálogo de clarificación

Una etapa operacional discreta en el Tier 3 / Peldaño 5 donde el agente revisa la spec, expone sus supuestos y hace preguntas calibradas antes de ejecutar. /speckit.clarify de spec-kit y el modo plan de Anthropic + la herramienta AskUserQuestion llevan el patrón a producción. Regla de coste: el coste de clarificación está limitado a minutos; el coste de corrección escala con la profundidad de ejecución. Ver Guía de especificación § Diálogo de clarificación.

Diseño de procesos para IA

La disciplina de diseñar flujos de trabajo restringidos y por fases dentro de los cuales la IA opera de manera consistente, distinta de la ingeniería de prompts y de la escritura de specs en sí. Capa 5 de los Estándares de Ejecución con IA. Distingue el trabajo Tier 3 / Peldaño 5 del trabajo Tier 2 / Peldaño 4. Ver Estándares de Ejecución con IA § Capa 5.

Topologías de proceso (las seis)

El vocabulario de Anthropic para cómo se estructura la pipeline que ejecuta una spec: encadenamiento de prompts (pasos secuenciales de un solo prompt con validación intermedia), enrutamiento (clasificar y despachar a prompts especializados), paralelización (ejecutar subtareas independientes concurrentemente), orquestador-trabajadores (un agente líder descompone y despacha trabajadores), evaluador-optimizador (generador emparejado con un evaluador separado), y agentes autónomos (exploración abierta con uso de herramientas y bucles de retroalimentación). Regla de decisión: empezar con un solo prompt; añadir complejidad solo cuando el valor por tarea justifique el sobrecoste de tokens.

Validación graduada por riesgo

Puertas de validación graduadas por riesgo

El principio de que la validación en el Peldaño 5 no es monolítica: diferentes clases de acción obtienen diferentes puertas según su radio de impacto, reversibilidad y consecuencia. Tres posturas operacionales (HITL / HOTL / HOOTL) describen el gradiente. Un equipo maduro del Peldaño 5 opera las tres concurrentemente, eligiendo la puerta por clase de acción. Ver Laboratorio de IA § Puertas de validación graduadas por riesgo.

HITL — Human-in-the-Loop

Una postura de validación donde se requiere la aprobación humana antes de que se ejecute una acción de IA. Predeterminado para acciones irreversibles de alto impacto: transacciones financieras, despliegues a producción, comunicaciones orientadas al cliente, cualquier cosa que cree una obligación legal o financiera. Limitado en rendimiento por la capacidad de revisión humana. Ver Laboratorio de IA § Puertas de validación graduadas por riesgo.

HOTL — Human-on-the-Loop

Una postura de validación donde la IA actúa de manera autónoma pero el humano monitorea con autoridad de intervención (kill switch, rollback, override). Predeterminado para trabajo reversible en producción con fuerte cobertura de evaluación. Operacionalmente frágil cuando se trata como monitoreo pasivo: la fatiga de vigilancia convierte un HOTL nominal en teatro de cumplimiento. Ver Laboratorio de IA § Puertas de validación graduadas por riesgo.

HOOTL — Human-out-of-the-Loop

Una postura de validación donde la IA actúa dentro de límites predefinidos sin involucramiento humano en tiempo real. Reservado para trabajo aislado y reversible con pruebas sólidas y un agente revisor en cada artefacto. Las fusiones de código a un repositorio bien probado con un agente revisor típicamente se ejecutan en HOOTL. Ver Laboratorio de IA § Puertas de validación graduadas por riesgo.

Dominio operacional de diseño (ODD)

Las condiciones bajo las cuales un agente de IA está diseñado para funcionar. Tomado de SAE J3016 (conducción) como el análogo más limpio. Fuera del ODD, el agente no hace afirmaciones; la puerta cae al humano. Definir el ODD es parte del diseño de procesos: qué herramientas tiene el agente, a qué datos puede acceder, qué acciones puede tomar. Ver Laboratorio de IA § Puertas de validación graduadas por riesgo.

Agente revisor

El patrón de emparejar un agente generador con un agente evaluador separado (contexto diferente, a veces un modelo diferente) que revisa el resultado antes de la fusión o el commit. Ahora es el predeterminado de producción para la revisión de código (CodeRabbit, Graphite Diamond, Greptile, GitHub Copilot review) y está siendo adoptado en atención al cliente, procesamiento de documentos y otros dominios de tareas discretas. Reemplaza la revisión humana síncrona a escala porque la matemática de coste por unidad fusionada funciona de una manera que la revisión humana a escala no. Ver Ingeniería para la fiabilidad § Agente revisor.

Responsable de permisos

Un rol organizacional con nombre en sistemas de IA de grado de producción. Responsable de lo que cada agente puede y no puede hacer, y del nivel de la puerta de validación (HITL / HOTL / HOOTL) por clase de acción. Se vuelve crítico tan pronto como los agentes tocan sistemas de producción con efectos secundarios irreversibles. Ver Estándares de Ejecución con IA § Roles organizacionales.

Modos de fallo y recuperación

Protocolo de estado bloqueado

El procedimiento del Peldaño 5 / Tier 3 para manejar un entregable donde el agente ha alcanzado un límite estructural. Detecta el estado bloqueado (límite de iteraciones alcanzado, mismo patrón de fallo recurriendo, o problema subjetivo planteado por un usuario); deja de iterar; convoca una sesión de recalibración; re-especifica o re-contextualiza; reinicia el bucle desde Contexto, no desde Ejecución. La regla del Laboratorio es explícita: no retomes el trabajo manualmente. Ver Laboratorio de IA § Protocolo de estado bloqueado.

Cuello de botella de IA

El modo de fallo en Tier 2.5+ donde un entregable pierde su fecha límite porque el agente ha alcanzado un límite estructural (dirección equivocada, spec ambigua, caso extremo subjetivo que no puede resolver solo), no porque la capacidad humana sea escasa. Cemri et al. (Why Do Multi-Agent LLM Systems Fail?, 2025) encontraron que el 41,8% de los fallos multiagente encajan en este patrón. La respuesta del liderazgo es tiempo de recalibración, no redistribución de trabajo ni añadir personal. Ver Liderar la transformación § Cuello de botella de IA.

Sicofancia

Los LLM defendiendo de manera fiable posiciones erróneas con confianza. Medido en Sharma et al. (2023), Wen et al. (2024) y el trabajo de OpenAI sobre alucinaciones (2025). La literatura está genuinamente en desacuerdo sobre si es una corrección de entrenamiento tratable o un artefacto estructural del RLHF; la postura del marco es tratar la sicofancia como una preocupación estructural a efectos de ingeniería, independientemente de la trayectoria del entrenamiento. Construye salvaguardas de proceso (señal externa, agente revisor, recuperación de verdad fundamental, pruebas ejecutables) en cada bucle. Ver Ingeniería para la fiabilidad § Sicofancia.

Caso extremo subjetivo

Un fallo aflorado por un usuario, no por las pruebas o el monitoreo: la IA hizo algo cualitativamente mal (tono, intención, voz de marca, alineación con el cliente) pero la salida técnica pasó todas las verificaciones. El modo de fallo dominante en alta madurez. La recuperación es conversación, no parcheo: habla con el usuario, entiende qué estaba tratando de lograr, actualiza la spec o el contexto. Ver Ingeniería para la fiabilidad § Casos extremos subjetivos.

Recalibración vs depuración

Dos respuestas operacionalmente distintas cuando la IA está equivocada. La recalibración reconstruye la comprensión del agente mediante contexto fresco, una spec re-articulada o una lluvia de ideas multi-perspectiva. La depuración corrige el artefacto que produjo el agente. La literatura sobre la autocorrección intrínseca es unánime en que un modelo que se ha comprometido con una dirección equivocada no se dará cuenta de manera fiable por sí solo: lo que significa que la mayoría de los fallos no triviales en T3 / R5 son problemas de recalibración disfrazados de problemas de depuración. Ver Ingeniería para la fiabilidad § Recalibración vs depuración.

Economía de la IA en madurez

Coste por unidad de salida

La métrica de medición del Level 3 que reemplaza "tiempo ahorrado por la IA": coste por PR fusionado, coste por ticket resuelto, coste por transacción procesada, coste por cliente atendido. La unidad varía por dominio; el principio es consistente: el gasto total en IA sin un denominador es insignificante en madurez. Ver Caso de Negocio § Economía de la IA en madurez.

Margen bruto de IA

La ratio de valor producido a gasto en inferencia a nivel de equipo o negocio. Los negocios de IA en la capa de aplicación operan con un margen bruto del 40-55% frente al 70-90% del SaaS tradicional: una brecha estructural porque la inferencia es un coste variable que escala con el uso. Si la brecha se cierra con el tiempo es debatible; el suelo es real y los negocios IA-nativa deben planificar en torno a él. Ver Caso de Negocio § Economía de la IA en madurez.

Economía de tokens

La disciplina de medir la IA como infraestructura de producción: coste por tarea, coste por unidad fusionada, rendimiento del agente por dólar, margen bruto de IA. Reemplaza el "tiempo ahorrado" como la métrica vinculante en el Level 3. Los costes por token están cayendo entre 10 y 40 veces por año, pero los costes por tarea a menudo suben porque los modelos de razonamiento, los bucles de agente y los contextos más largos consumen entre 10 y 100 veces los tokens de las completaciones de un solo paso (paradoja de Jevons aplicada a la inferencia). Ver Caso de Negocio § Economía de la IA en madurez y Laboratorio de IA § Economía de tokens.

← Volver al inicio · El marco de referencia · Estándares de ejecución con IA