Hojas de reunión — Nicole Abricot Marchant
noindex, nofollow: no aparece en buscadores. Solo el IP la revisa antes de la reunión. Si la compartes con la persona objetivo (Nicole Abricot), hazlo mediante enlace directo, no mediante difusión pública.
instrumentos/doc_pro_Hojas_Reunion_Nicole_v1.0.md (fuente normativa). Esta página es derivada — el .md manda.
↓ Descargar PDF (3 páginas, LaTeX académico)
Hoja 1 — El problema: deuda cognitiva inducida por IA
La pregunta que mueve el proyecto
Si la IA generativa puede producir respuestas correctas sin razonamiento visible, ¿qué pasa con la evaluación que solo mira el producto final?
Por qué falla la evaluación actual
La evaluación universitaria estándar mide producto: examen, informe, control. La suposición implícita es que existe una relación razonablemente estable entre proceso cognitivo y producto entregado. Esa suposición era defendible cuando producir el producto requería tiempo, errores intermedios y articulación visible del razonamiento.
Qué cambia con IA generativa (2022–2026)
La suposición se rompe. Un estudiante puede obtener un producto final correcto sin ejercitar el proceso que lo haría defendible en contextos profesionales nuevos. El producto dejó de ser evidencia suficiente de razonamiento. Esto es lo que llamo deuda cognitiva inducida por IA: la diferencia entre el producto que la IA puede producir y el razonamiento que el estudiante efectivamente ejerció.
Qué intenta recuperar el diseño
El proyecto no busca prohibir la IA. Busca rediseñar la evaluación para capturar proceso, trayectoria, criterio y transferencia — dimensiones del razonamiento que el producto final no exhibe. El centro del proyecto no es el chatbot. Es la validez de la evidencia de aprendizaje en una época donde la IA puede producir respuestas sin razonamiento visible.
Hipótesis de trabajo
Una intervención pedagógica estructurada en cinco sesiones, basada en rastro inicial sin IA, mediación socrática controlada, evaluación crítica de errores deliberados y transferencia autónoma a un caso nuevo, produce señales observables de razonamiento técnico (medidas con una rúbrica 4D×4N con criterios lingüísticos) que la evaluación tradicional de producto final no captura.
Lo que el proyecto NO afirma
- No afirma que la IA sea mala.
- No afirma que el piloto haya producido resultados (está diseñado, no ejecutado).
- No afirma que el diseño generalice a toda educación superior.
- No afirma que el chatbot sea la herramienta — es instrumental.
- No afirma que la rúbrica esté validada empíricamente. Tiene operacionalización lingüística fundamentada; necesita evidencia.
Una frase para abrir la conversación
"La respuesta correcta ya no basta como evidencia de aprendizaje. Si dos estudiantes pueden entregar el mismo texto — uno razonó y otro delegó — la evaluación que mira solo el texto no distingue."
Hoja 2 — El protocolo: cinco sesiones, cuatro momentos, dos transferencias
Arquitectura general
| C1 | C2 | C3 | C4 | C5 | |
|---|---|---|---|---|---|
| Función | Línea base | Diagnóstico con hipótesis competidoras | Datos SCADA ambiguos | Automatización bajo presión | Transferencia |
| Caso | Piscina — filtro | Piscina — cloro | Piscina — SCADA | Piscina — autonomía 38h | Torre de enfriamiento (caso nuevo) |
| Modo chatbot | PLAN (socrático) | PLAN + BUILD | PLAN + BUILD | PLAN + BUILD | NEUTRO (sin andamiaje) |
| Foco | ¿Identifica síntomas o mecanismos? | ¿Discrimina hipótesis competidoras? | ¿Distingue correlación de causalidad? | ¿Integra restricciones múltiples? | ¿Reproduce la estructura sin guía? |
| Momento clave | M1 → M4 intra | M1 → M4 intra | M1 → M4 intra | M1 → M4 intra | Comparación C1↔C5 |
| Tiempo total | 80 min | 80 min | 80 min | 80 min | 80 min |
Los cuatro momentos (M1–M4)
| Momento | Qué es | Cuándo | Instrumento de codificación |
|---|---|---|---|
| M1 | Rastro inicial sin IA. El estudiante escribe a mano, sube foto. | Antes del chatbot | AI Vision → JSON. Texto plano a PostgreSQL. |
| M2 | Interacción con chatbot PLAN (socrático, no genera). | Durante la clase | Log de chat a PostgreSQL. |
| M3 | Interacción con chatbot BUILD (genera con errores deliberados, los defiende). | Durante la clase | Log de chat a PostgreSQL. |
| M4 | Decisión final del estudiante, con riesgo explícito. | Cierre de la clase | Texto del estudiante, foto o chat. |
Nota C5: M2 y M3 existen pero con chatbot NEUTRO — no socrático. La conversación es un insumo, no un andamiaje.
Las dos transferencias
| Tipo | Definición | Cómo se mide |
|---|---|---|
| Transferencia longitudinal (Δ_inter) | Capacidad de reproducir la estructura del género entre clases consecutivas, con todo el andamiaje. | M1_(N) − M1_(N−1) por dimensión. Si es 0 en dos sesiones consecutivas, alerta de estancamiento (Glosario v1.8). |
| Transferencia cercana (C1↔C5) | Capacidad de aplicar la estructura a un dominio nuevo (piscina → torre) sin andamiaje. | Comparación C5 vs C1 con chatbot NEUTRO. Si reproduce la estructura, internalizó. Si no, dependía del andamiaje. |
Referencia teórica de "transferencia cercana": Perkins & Salomon (1992); Bransford et al. (2000). El aprendizaje profundo se demuestra cuando el estudiante aplica lo aprendido a situaciones nuevas sin andamiaje.
Las tres métricas
| Métrica | Fórmula | Lectura |
|---|---|---|
| Δ_intra | M4 − M1 (por dimensión, dentro de una clase) | Ganancia atribuible al chatbot en la sesión. |
| Δ_inter | M1_N − M1_(N−1) (entre clases consecutivas) | Trayectoria longitudinal. Sin chatbot. |
| Transferencia cercana | Comparación C5 vs C1 (mismo género, dominio distinto) | Internalización. Variable de respuesta principal. |
Lo que el alumno NO sabe (DD_28)
- No sabe que el chatbot tiene modos PLAN, BUILD, NEUTRO.
- No sabe que el modo BUILD le entrega errores deliberados.
- No sabe que el modo NEUTRO mide transferencia.
Si lo supiera, dejaría de razonar y empezaría a evaluar al chatbot. El debriefing con consentimiento viene después del piloto, no durante.
La arquitectura técnica (sin entrar en vendor)
| Capa | Implementación | Lo que se controla |
|---|---|---|
| Frontend estudiante | Interfaz web (chat + subida de foto) | Captura M1, M2, M3, M4 |
| Frontend profesor | 7 controles (selector de clase, dashboard en vivo, chat bajo demanda, pausa, BUILD, cierre, fin de sesión) | Modo de operación |
| Backend | Orquestador de IA con dos agentes diferenciados (profesor, alumno) | Modes, prompts, persistencia |
| LLM | Intercambiable | System prompt controla modos, no el modelo |
Premisa P1: una sola IA. El chatbot es del proyecto. No es GPT, no es Gemini, no es Claude externo. El system prompt controla modos. El LLM es intercambiable; el diseño no.
Hoja 3 — La rúbrica: cuatro dimensiones, criterios lingüísticos, ejemplo Juan
Las cuatro dimensiones
| Dim. | Nombre | Pregunta central | Metafunción SFL |
|---|---|---|---|
| D1 | Complejidad causal | ¿El estudiante identifica síntomas o mecanismos? | Ideacional |
| D2 | Especificidad técnica | ¿Usa variables medibles o generalidades? | Ideacional |
| D3 | Consciencia epistémica | ¿Sabe qué sabe, qué no sabe, qué evidencia necesita? | Interpersonal |
| D4 | Decisión bajo incertidumbre | ¿Toma una decisión defendible con riesgo explícito? | Interpersonal |
La rejilla 4D × 4N (versión comprimida)
| N1 — Descriptivo | N2 — Simple | N3 — Múltiple | N4 — Contingente | |
|---|---|---|---|---|
| D1 Causal | Procesos relacionales, sin nexos | ≥1 nexo causal simple | ≥2 nexos + ≥1 nominalización | ≥2 tipos lógico-semánticos (causal + elaboración/extensión) |
| D2 Específico | Participantes sin modificación numérica | ≥1 variable con valor, sin unidades | ≥1 valor con unidad técnica | ≥2 variables con unidades + umbrales |
| D3 Epistémico | 0 modales, 0 evidenciales, 0 condicionales | ≥1 modal epistémico sin fuente | ≥1 evidencial + ≥1 declaración de vacío | ≥1 condicional epistémico + evaluación de límites del propio análisis |
| D4 Decisión | 0 verbos de decisión 1ª persona | ≥1 verbo decisión 1ª persona, sin condicional | Verbo decisión + ≥1 condicional con consecuencia | Verbo decisión + condicional + criterio de escalamiento + referencia a autoridad |
Operacionalización completa: Rúbrica Longitudinal v1.4, §2 y Anexo A. Criterios de codificación fundamentados en Halliday & Matthiessen (2014) y Rose & Martin (2012).
Ejemplo: Juan, M1 C1 (línea base)
Texto del estudiante (literal):
"El agua se ve turbia y el olor es raro. El operador dice que es el filtro. Hay que cambiarlo y listo."
| D | Nivel | Justificación (criterio lingüístico) |
|---|---|---|
| D1 | N1 | 0 nexos causales explícitos. "Se ve" y "es" son procesos relacionales, no lógico-semánticos. No hay "porque", "lo que causa", "debido a". |
| D2 | N1 | "Turbia" y "raro" son adjetivos evaluativos, sin variable técnica, sin unidad, sin umbral. No menciona caudal, NTU, pH. |
| D3 | N1 | 0 modales epistémicos, 0 marcadores evidenciales, 0 cláusulas condicionales. Atribución total al operador ("el operador dice") sin evaluación propia. |
| D4 | N1 | 0 verbos de decisión en 1ª persona. "Hay que cambiarlo" es impersonal. El decisor es "uno", no "yo". Evasión deóntica. |
Ejemplo: Juan, M4 C4 (cierre con presión)
Texto del estudiante (literal):
"Yo recomendaría que el protocolo incluyera un chequeo cada 4 horas, no solo cuando la bomba falle. Si ORP no se normaliza en 2 horas, llamar a un técnico de turno. Si no, el riesgo es una sanción SEREMI. Y la responsabilidad sería del administrador si no documenta."
| D | Nivel | Justificación (criterio lingüístico) |
|---|---|---|
| D1 | N3 | 3 condicionales causales encadenados ("Si el guardia no entiende, la responsabilidad es…", "Si ORP no se normaliza en 2h, llamar…", "Si no, el riesgo es una sanción…"). ≥2 nexos. |
| D2 | N3 | Variables con valores: "cada 4 horas", "ORP", "2 horas". Unidades temporales explícitas. Sin embargo, faltan umbrales numéricos de ORP (lo baja a N3, no a N4). |
| D3 | N3 | "Recomendaría" (modal epistémico + decisión) + condicional de consecuencia ("Si no, sanción"). Hay consciencia del riesgo, sin evidencial explícito. |
| D4 | N4 | "Recomendaría" (verbo decisión 1ª persona) + condicional con consecuencia negativa + criterio de escalamiento ("técnico de turno", "SEREMI") + referencia a autoridad externa ("administrador"). |
Por qué los criterios son lingüísticos, no intuitivos
La rejilla no pregunta "¿el razonamiento es bueno?". Pregunta: ¿cuántos nexos causales explícitos encadenó el estudiante? ¿Cuántas nominalizaciones usó como participantes de procesos? ¿Cuántos marcadores evidenciales? ¿Cuántos verbos de decisión en primera persona con condicional?
Dos codificadores que cuentan nexos causales llegan al mismo número con más frecuencia que dos codificadores que interpretan "calidad del razonamiento" por intuición. La codificación es replicable, no subjetiva. La validez de contenido viene de SFL (Halliday, Rose & Martin); la confiabilidad inter-codificador se mide con κ ponderado ≥ 0.80 (Landis & Koch 1977; Cohen 1960).
Cinco huecos que ella puede ayudar a llenar
- Validez de contenido por panel de expertos disciplinares sin que impongan intuición sobre la rejilla lingüística.
- Validez de estructura interna con n ≈ 20 — qué diseño es honesto sin sobredimensionar.
- DD_38 — AI Vision como insumo de M1, no como variable de medición. Cómo evitar que la personalización rompa la estandarización.
- κ ponderado cuadrático vs. lineal — el costo de tratar N1↔N4 igual que N2↔N3.
- Construct map integrado vs. dimensiones separables — ¿BAS-style o rejilla independiente?