Marco de Revisión de Literatura

Paper en preparación · Versión de trabajo v1.5 · Junio 2026

Deuda cognitiva en educación técnica: un protocolo de intervención con chatbot socrático para el rediseño del aprendizaje universitario en contexto de IA generativa.

1. Propósito de esta revisión

Esta revisión no es exhaustiva: es estratégica. Su objetivo no es cubrir la literatura sobre educación e IA, sino construir el argumento de por qué el piloto es necesario, qué lo diferencia de lo que ya existe y qué vacío específico llena.

La revisión se organiza en cuatro capas: la tradición pedagógica sobre la que se construye el piloto, el problema que esa tradición no puede resolver en el contexto actual, el estado de la cuestión sobre IA en educación, y el gap específico que el piloto aborda.

Argumento central de posicionamiento: El piloto no es un experimento sobre IA en el aula. Es un experimento sobre cómo rediseñar la experiencia de aprendizaje para que la presencia de la IA no destruya la validez del proceso educativo. Esa distinción es la contribución original.

2. La tradición pedagógica que sostiene el diseño

2.1 Aprendizaje activo y flipped classroom

La evidencia sobre aprendizaje activo es robusta y consistente. Freeman et al. (2014), en un metaanálisis de 225 estudios en STEM, demostraron que los estudiantes en clases activas obtienen mejores resultados y tienen tasas de reprobación significativamente menores. Prince (2004) sistematizó los mecanismos: el compromiso activo del estudiante — no la tecnología ni el formato — es la variable crítica.

El flipped classroom (Bergmann & Sams, 2012) llevó ese principio a su consecuencia lógica: si el valor del tiempo presencial no está en transmitir información sino en aplicarla, el contenido puede ir fuera del aula. Bishop & Verleger (2013) confirmaron los beneficios, pero también identificaron su condición crítica: el modelo funciona cuando el proceso cognitivo previo realmente ocurrió.

La fractura con la IA generativa: El flipped classroom fue diseñado en un mundo donde la única forma de prepararse para la clase era estudiar. Hoy, la IA puede generar el resumen del video, el esquema del tema y las respuestas anticipadas a las preguntas del docente en menos de un minuto. El modelo asume que el proceso previo fue del estudiante. Con IA disponible, esa suposición ya no es verificable.

2.2 Método socrático y cuestionamiento sistemático

La eficacia del cuestionamiento socrático en educación está documentada desde Collins (1988), que describió la tutoría socrática como la forma más efectiva de activar metacognición y revelar las inconsistencias en el razonamiento del estudiante. Paul & Elder (2006) formalizaron el método para el desarrollo del pensamiento crítico en educación superior.

La pregunta que la literatura no respondía hasta ahora era si un chatbot podía cumplir esa función a escala, sin perder la función de presión cognitiva. Los estudios más recientes (Kasneci et al., 2023; Mollick & Mollick, 2023) sugieren que sí, con condiciones: el chatbot socrático debe estar configurado para preguntar, no para responder, y el estudiante debe tener pensamiento previo sobre el que el chatbot pueda operar.

Esa segunda condición — pensamiento previo como prerequisito del contraste socrático — es la regla institucional del piloto: la IA nunca llega antes que el pensamiento propio.

2.3 Evaluación formativa y trayectoria de razonamiento

Black & Wiliam (1998) demostraron en una revisión de más de 250 estudios que la evaluación formativa es la intervención pedagógica con mayor impacto en el aprendizaje, con tamaños de efecto de 0.4 a 0.7 desviaciones estándar. El mecanismo central es el feedback sobre el proceso de razonamiento, no sobre el resultado final.

Hattie & Timperley (2007) refinaron ese hallazgo: el feedback más efectivo opera sobre la tarea y el proceso, no sobre la persona ni sobre el resultado.

El piloto implementa este principio de forma estructural: la evidencia que se recolecta no es la respuesta final, sino la trayectoria de construcción de esa respuesta. La rúbrica de cuatro dimensiones (complejidad causal, especificidad técnica, consciencia epistémica, decisión bajo incertidumbre) es un instrumento de evaluación formativa del proceso, aplicado longitudinalmente.

2.4 Transferencia del aprendizaje

Bransford, Brown & Cocking (2000) establecieron que el aprendizaje significativo se demuestra por transferencia: la capacidad de aplicar lo aprendido en situaciones nuevas. Sin transferencia, el aprendizaje puede ser reconocimiento superficial o memorización contextual.

Perkins & Salomon (1992) distinguieron transferencia cercana (situaciones similares) y lejana (dominios diferentes). En el piloto, la Clase 5 mide transferencia cercana: mismo dominio hidráulico, diferente sistema industrial.

La ausencia de andamiaje en la Clase 5 es metodológicamente deliberada: Roschelle (1995) demostró que la transferencia genuina solo es detectable cuando el aprendiz enfrenta el nuevo caso sin los scaffolds que usó durante el aprendizaje.

3. El estado de la cuestión: IA en educación

3.1 Usos institucionales de IA — Chile y América Latina

El debate público sobre IA en educación en Chile en 2025-2026 se desarrolla principalmente en dos frentes: la regulación del uso de IA por parte de los estudiantes (prohibiciones, detectores, políticas de integridad académica) y el uso de IA como herramienta de apoyo institucional.

Olguín Olate (2026) propone la IA como aliada para prevenir y acompañar en contextos de conflicto escolar. Iberti (2026) publica una caracterización del aula invertida en el contexto de la expansión de la educación online en Chile, sin abordar la verificación del razonamiento en un entorno con IA disponible.

Ninguno de estos textos formula la pregunta que el piloto responde: ¿cómo rediseñar la experiencia de aprendizaje para que la presencia de la IA no destruya la validez del proceso educativo?

3.2 Lineamientos institucionales internacionales frente a IA generativa y evaluación

Moorhouse, Yeo & Wan (2023) revisaron las orientaciones institucionales de universidades de alto ranking frente al uso de herramientas de inteligencia artificial generativa en evaluación. Su estudio muestra que la irrupción de estos sistemas no puede abordarse únicamente desde la lógica del plagio, la detección automática o la prohibición, sino que exige una reconsideración profunda del diseño evaluativo.

Este hallazgo es relevante para el Protocolo IA-Socrático porque confirma el problema de fondo que motiva esta investigación: en contextos mediados por IA, el entregable final pierde fuerza como única evidencia de competencia. Por ello, la evaluación debe desplazarse hacia la trazabilidad del razonamiento, la justificación de decisiones, la detección de errores, la reflexión metacognitiva y la transferencia.

Alcance de la evidencia: Moorhouse, Yeo & Wan (2023) no validan empíricamente el Protocolo IA-Socrático. Documentan una presión institucional internacional hacia el rediseño evaluativo; el protocolo propone una respuesta metodológica concreta mediante rastros iniciales, diálogo socrático, análisis de decisiones, detección de errores y tareas de transferencia.

3.3 Chatbots socráticos — evidencia emergente

Kasneci et al. (2023) identificaron el uso de LLMs como tutores socráticos como una de las aplicaciones con mayor potencial. Mollick & Mollick (2023) operacionalizaron esa propuesta con experimentos universitarios, mostrando que los estudiantes que interactuaron con chatbots socráticos producían respuestas más elaboradas y con mayor evidencia de razonamiento. La condición crítica: el estudiante debía formular una posición propia antes de la interacción.

Ese resultado empírico es el fundamento experimental de la regla del piloto. La diferencia es que el piloto agrega dos elementos: el rastro visible como captura del pensamiento previo y la transferencia final como verificación de que el aprendizaje fue real.

3.4 Deuda cognitiva — el concepto que el debate no ha formalizado

La idea de que la externalización cognitiva a herramientas puede debilitar la construcción de estructuras cognitivas duraderas tiene raíces en Sweller (1988) y la teoría de la carga cognitiva. Kirsh & Maglio (1994) distinguieron entre acciones epistémicas y acciones pragmáticas. La IA generativa colapsa esa distinción: permite pasar directamente a las acciones pragmáticas (producir el output) sin las acciones epistémicas (construir la comprensión).

El término "deuda cognitiva" aplicado a IA generativa en educación universitaria es de uso emergente (Kaput, 2024; Denny et al., 2024). El piloto aporta no solo un argumento conceptual sino evidencia empírica de cómo detectarla operacionalmente: la brecha entre lo que el estudiante produce y lo que puede defender.

Definición operacional de deuda cognitiva: Condición en que un estudiante produce un output correcto sin haber construido el proceso cognitivo que normalmente lo genera. La IA generativa la hace posible a escala y con apariencia de competencia. Una universidad que evalúa solo productos finales no la detecta hasta que el egresado enfrenta una situación real que no puede resolver.

3.5 Percepción docente internacional — el riesgo que ven pero no saben gestionar

Ed3 (2026), en su estudio The Emerging Role of Teachers in the Age of AI, encuestó a 1.147 educadores K–12 en Estados Unidos sobre cómo la IA está cambiando su rol. Los resultados revelan una tensión central: la IA actualmente es aditiva, no transformativa — se integra en tareas preparatorias y analíticas, pero las responsabilidades relacionales y cognitivamente intensivas permanecen humanas.

Los docentes encuestados identifican como núcleo irreemplazable de su rol al "Cognitive Coach": quien guía a los estudiantes en el cuestionamiento de información, la evaluación de ideas y la formación de juicios independientes. Esa función es exactamente lo que el chatbot socrático del piloto activa y lo que el rastro inicial protege.

El dato más significativo para el piloto: el escenario "Students will learn fundamentals and core subjects mostly through adaptive digital tools" tiene una probabilidad percibida neta (net likelihood) de 42%, pero una deseabilidad neta (net desirability) de –19%, con el 50% de concentración en respuestas indeseables. Es el único escenario ampliamente esperado pero evaluado negativamente por los propios docentes.

La brecha que el reporte reconoce: El estudio no distingue entre el uso de IA en la preparación para la instrucción versus el uso de IA durante la instrucción. Tampoco pregunta qué le ocurre al razonamiento del estudiante cuando la IA está disponible — toda la encuesta opera desde la perspectiva del docente como sujeto afectado. El piloto llena exactamente esa brecha con datos desde la perspectiva del proceso cognitivo del estudiante.

3.6 Evidencia neuro-cognitiva de la descarga cognitiva y el uso socrático

Un estudio de investigadores del MIT Media Lab, Wellesley College y MassArt (2025) titulado Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task aporta la evidencia neurológica exacta para el problema que este piloto aborda. Mediante electroencefalografía (EEG), midieron la actividad cerebral en tres condiciones: escribiendo sin ayuda, usando un buscador tradicional, y usando un LLM.

El hallazgo principal fue la demostración empírica de la descarga cognitiva (cognitive offloading). El grupo que usó el LLM de forma genérica mostró la menor conectividad neuronal, una reducción severa en el compromiso semántico y una desactivación de las ondas cerebrales asociadas a la creatividad (ondas gamma). Además, reportaron menor retención y sentido de autoría sobre sus textos.

Hallazgo complementario: el grupo Brain-to-LLM. Un subgrupo de participantes (~10%) utilizó el LLM no como generador de respuestas, sino como interlocutor para evaluar posiciones previamente formuladas — es decir, produjeron esfuerzo cognitivo propio antes de recurrir a la herramienta. Este grupo mostró mayor conectividad neuronal que el grupo sin tecnología (MIT Media Lab et al., 2025, arXiv:2506.08872). El resultado es consistente con la secuencia del piloto (rastro inicial → chatbot crítico) y aporta plausibilidad neural a la hipótesis de que el orden importa: pensar primero, contrastar después.

4. Mapa de la literatura — aporte y limitación de cada corriente

Corriente	Aporte al piloto	Limitación que el piloto supera
Flipped classroom (Bergmann & Sams, 2012; Bishop & Verleger, 2013)	Libera tiempo presencial para aplicación activa. Redefine al docente como mediador.	Asume que el proceso cognitivo ocurrió fuera del aula. Con IA disponible, esa suposición colapsa.
Aprendizaje activo (Freeman et al., 2014; Prince, 2004)	Evidencia robusta de que implicar activamente al estudiante mejora resultados.	No diferencia entre activación cognitiva genuina y activación aparente mediada por IA.
Método socrático (Paul & Elder, 2006; Collins, 1988)	El cuestionamiento sistemático activa metacognición.	En su forma original es costoso y no escala. Los chatbots socráticos ofrecen escala sin perder la presión cognitiva.
Evaluación formativa (Black & Wiliam, 1998; Hattie & Timperley, 2007)	Evaluar el proceso produce mayor impacto que evaluar el producto.	No tiene mecanismo para separar el razonamiento del estudiante del de la IA. El rastro visible pre-chatbot es la respuesta.
IA en educación (UNESCO, 2023; Holmes et al., 2022)	La IA puede personalizar trayectorias y generar retroalimentación.	Se centra en IA como asistente del sistema, no en cómo rediseñar para que la IA no destruya la evidencia de razonamiento.
Lineamientos institucionales sobre IA generativa y evaluación (Moorhouse, Yeo & Wan, 2023)	Universidades de alto ranking han debido generar orientaciones sobre integridad académica, comunicación con estudiantes y rediseño de tareas evaluativas.	Documenta la necesidad institucional de rediseño evaluativo, pero no ofrece un instrumento para capturar trayectoria de razonamiento, detección de errores o transferencia. El piloto propone esa operacionalización.
Transferencia (Bransford et al., 2000; Perkins & Salomon, 1992)	El aprendizaje profundo se demuestra cuando el estudiante aplica lo aprendido sin andamiaje.	Raramente medida en entornos universitarios. El piloto la incorpora como sesión diseñada (Clase 5) con criterios de nivel.
Deuda cognitiva (Sweller, 1988; Kirsh & Maglio, 1994; Kaput, 2024)	La externalización cognitiva debilita la construcción de estructuras duraderas.	El concepto vinculado a IA generativa es emergente. El piloto aporta evidencia empírica.
Percepción docente sobre IA (Ed3, 2026)	Los docentes perciben el riesgo de delegar instrucción a la IA (42% esperado, –19% deseable). Identifican al "Cognitive Coach" como rol irreemplazable.	Mapea qué hacen y perciben los docentes, pero no pregunta qué le ocurre a la cognición del estudiante. El piloto responde esa pregunta con evidencia empírica.
Evidencia neuro-cognitiva y descarga cognitiva (MIT Media Lab, 2025; Palacio, 2026)	Demuestra neurológicamente la "descarga cognitiva" (Deuda Cognitiva) y prueba que usar IA de forma adversarial (como sparring) eleva la actividad cerebral.	El estudio observa el efecto retrospectivamente. Nuestro piloto diseña proactivamente la intervención que fuerza el uso de la IA como sparring socrático (D2 y D4).

5. El gap analítico que el piloto llena

Lo que la literatura ya sabe	Lo que aún no responde	Lo que el piloto aporta
El aula invertida mejora el aprendizaje activo frente a la clase magistral.	¿Cómo se verifica que el proceso previo fue del estudiante y no delegado a la IA?	El rastro inicial pre-chatbot, capturado dentro del aula con el docente presente.
El feedback sobre el proceso tiene mayor impacto que el feedback sobre el resultado.	¿Qué instrumentos capturan el proceso de forma distinguible del output de la IA?	La cadena de evidencias (rastro → contraste socrático → revisión → decisión → transferencia).
Los chatbots pueden actuar como tutores socráticos.	¿Qué ocurre cuando el chatbot se combina con rastro inicial y transferencia posterior?	La hipótesis pedagógica: el chatbot fortalece el razonamiento si viene después del pensamiento propio.
La transferencia es la medida más robusta del aprendizaje profundo.	¿A qué nivel de transferencia llegan estudiantes de ingeniería después de cinco sesiones?	Las cuatro dimensiones de la rúbrica (D1-D4: complejidad causal, especificidad técnica, consciencia epistémica, decisión bajo incertidumbre) aplicadas en transferencia cercana (Clase 5, chatbot NEUTRO), más Δ_inter como indicador de retención.
La IA genera dependencia cognitiva cuando reemplaza procesos.	¿Cómo se detecta y mide la deuda cognitiva en el contexto universitario concreto?	Los tres patrones de respuesta adversarial de Clase 4 como instrumento de detección.
Los docentes perciben el riesgo de la IA sobre la instrucción (Ed3, 2026: 42% esperado, –19% deseable).	¿Existe una metodología operacional para gestionar ese riesgo en el aula?	El protocolo socrático: no prohibir la IA, sino rediseñar la secuencia para que no pueda llegar primero que el pensamiento propio.

6. Posicionamiento del paper en la literatura

El paper se posiciona en la intersección de tres campos:

Diseño instruccional para entornos con IA disponible

La literatura sobre flipped classroom y aprendizaje activo asume que el docente puede verificar el proceso previo. El paper aporta un diseño instruccional que no hace esa suposición: captura el proceso dentro del aula, antes de la intervención tecnológica.

Chatbots socráticos en educación técnica de ingeniería

La evidencia existente proviene principalmente de contextos de humanidades y ciencias sociales (Mollick & Mollick, 2023). El paper contribuye con evidencia en razonamiento técnico en ingeniería, un dominio donde la distinción síntoma/causa y la decisión bajo incertidumbre tienen consecuencias prácticas específicas.

Medición de deuda cognitiva como evidencia investigativa

El paper propone y valida empíricamente un instrumento de detección de deuda cognitiva: la rúbrica de cuatro dimensiones aplicada longitudinalmente, con Δ_inter como indicador de transferencia cercana entre C1 y C5. Esa operacionalización, no un criterio paralelo de transferencia, es la contribución metodológica original al campo.

Título alternativo para posicionamiento fuerte:
Más allá del flipped classroom: rastro visible, chatbot socrático y transferencia como respuesta a la deuda cognitiva inducida por IA en educación superior de ingeniería

7. Referencias clave para el paper

Fundamento del diseño instruccional

Bergmann, J. & Sams, A. (2012). Flip your classroom: Reach every student in every class every day. ISTE.
Bishop, J. L. & Verleger, M. A. (2013). The flipped classroom: A survey of the research. ASEE Annual Conference Proceedings.
Freeman, S. et al. (2014). Active learning increases student performance in science, engineering, and mathematics. PNAS, 111(23), 8410–8415.
Prince, M. (2004). Does active learning work? A review of the research. Journal of Engineering Education, 93(3), 223–231.

Evaluación formativa y trayectoria de razonamiento

Black, P. & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education, 5(1), 7–74.
Hattie, J. & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
Bransford, J. D., Brown, A. L. & Cocking, R. R. (2000). How people learn: Brain, mind, experience, and school. National Academy Press.
Perkins, D. N. & Salomon, G. (1992). Transfer of learning. International Encyclopedia of Education (2nd ed.).

Método socrático y chatbots en educación

Collins, A. (1988). Cognitive apprenticeship and instructional technology. Educational Psychology, 68.
Paul, R. & Elder, L. (2006). The art of Socratic questioning. Foundation for Critical Thinking.
Kasneci, E. et al. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences, 103.
Mollick, E. R. & Mollick, L. (2023). Assigning AI: Seven approaches for students, with prompts. SSRN Working Paper.

Deuda cognitiva, carga cognitiva y evidencia neurobiológica

Sweller, J. (1988). Cognitive load during problem solving: Effects on learning. Cognitive Science, 12(2), 257–285.
Kirsh, D. & Maglio, P. (1994). On distinguishing epistemic from pragmatic action. Cognitive Science, 18(4), 513–549.
Denny, P. et al. (2024). Generative AI for education: Navigating opportunities and risks. ACM SIGCSE.
MIT Media Lab, Wellesley College & MassArt. (2025). Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task.
Palacio, R. (2026). Tu cerebro en ChatGPT (la IA y los nuevos desafíos para el Pensamiento Crítico) [Conferencia]. Fundación Santa Fe / Universidad de los Andes, Colombia.

Contexto internacional y percepción docente

Ed3 (2026, marzo). The Emerging Role of Teachers in the Age of AI: Insights from educators on what is changing, what remains human, and what comes next. Research Brief #2, Portrait of a Teacher in the Age of AI. ed3global.org. [Encuesta a 1.147 educadores K–12, EE.UU., otoño 2025].
Moorhouse, B. L., Yeo, M. A. & Wan, Y. (2023). Generative AI tools and assessment: Guidelines of the world's top-ranking universities. Computers and Education Open, 5, 100151. https://doi.org/10.1016/j.caeo.2023.100151
UNESCO (2023). Guidance for generative AI in education and research. UNESCO Publishing.
UNESCO (2025). Observatorio de Inteligencia Artificial en Educación para América Latina y el Caribe. Inauguración en Santiago.

Contexto chileno y latinoamericano

Olguín Olate, J. (2026, 26 de abril). Violencia escolar: La Inteligencia Artificial como herramienta de apoyo. El Desconcierto.
Iberti, C. (2026, 8 de mayo). ¿Qué es el aula invertida? La Tercera.