# Glosario Conceptual — Protocolo IA-Socrático USACH

**Versión:** 1.10
**Fecha:** Junio 2026
**Propósito:** Definir con precisión los términos técnicos del protocolo para asegurar consistencia entre documentos, codificadores e interlocutores.

> **Cambios v1.9 → v1.10** (refactor de notación — IP, 2026-06-16):
> - Agregada §"Convención de notación": `DD_N` = decisión de diseño (Premisas), `D1`–`D4` = dimensión de análisis (Rúbrica), `P1`–`P9` = premisa, `M1`–`M4` = momento, `C1`–`C5` = clase. Las decisiones de diseño pasan de `D1`–`D39` a `DD_N` en todo el corpus para eliminar la colisión con las dimensiones.

> **Cambios v1.8 → v1.9** (dictamen IP — 2026-06-12):
> - Agregada entrada "Homogeneidad de cohorte (H_cohorte)" en Términos metodológicos: métrica exploratoria de similitud semántica media entre rastros M1 de estudiantes distintos, por clase, con trayectoria C1→C5. Motivada por Liu et al. (2024, arXiv:2401.06816, preprint): la homogeneización inducida por IA persiste al retirar la herramienta. Doble función: réplica conceptual en dominio ingenieril y autocontrol del andamiaje socrático. No participa de Δ_intra ni Δ_inter; no genera feedback.
> - `AGENT_TRAYECTORIA`: agregado el cálculo de H_cohorte como salida exploratoria.
>
> **Cambios v1.7 → v1.8** (IP — 2026-06-05):
> - Desplazamiento cognitivo: agregada "Nota epistemológica" que fundamenta el uso de los prefijos latinos *intra-* e *inter-* como convención de investigación educativa (Campbell & Stanley, 1963; Shadish, Cook & Campbell, 2002). La nota explicita que la distinción no es terminológica sino metodológica: confundir ambos niveles de análisis invalida las inferencias causales del diseño cuasi-experimental.

> **Cambios v1.6 → v1.7** (decisión IP — 2026-06-02):
> - Δ_inter: agregado sinónimo "transferencia longitudinal" para distinguir de la "transferencia cercana" medida en C5. La transferencia longitudinal rastrea M1 entre clases dentro del mismo caso temático (C1→C2→C3→C4); la transferencia cercana evalúa reproducción del método en caso estructuralmente análogo pero distinto sin andamiaje activo (C5). Δ_intra se mantiene sin cambios.

> **Cambios v1.5 → v1.6** (decisión IP — 2026-06-02):
> - Convención `AGENT_` para agentes automatizados. Renombrado: Analista SFL → `AGENT_ANALISTA_SFL`.
> - `AGENT_ANALISTA_SFL` redefinido como motor SFL compartido (recibe texto → devuelve D1-D4 con justificación).
> - Agregados `AGENT_SESION` (intra-sesión, feedback DD_16, Δ_intra) y `AGENT_TRAYECTORIA` (inter-sesión, Δ_inter, heatmap).
> - Tabla SÍ/NO de feedback movida a `AGENT_SESION`.
>
> **Cambios v1.4 → v1.5** (decisión IP — 2026-06-02):
> - AGENT_ANALISTA_SFL: especificado que el feedback al alumno es SFL de proceso (no dimensional). Se describen hábitos cognitivos sin revelar niveles D1-D4 ni las dimensiones medidas. Esto protege la validez interna: el alumno recibe orientación formativa sin saber qué se está midiendo.
> - Agregada entrada "Momentos de medición (M1-M4)" con tabla de distribución por clase: C1 (3 momentos, sin BUILD), C2-C4 (4 momentos), C5 (3 momentos, chatbot NEUTRO sin BUILD).
>
> **Cambios v1.3 → v1.4** (revisión SFL — Ingrid Westhoff Podestá, 2026-05-31):
> - D1-D4: agregada "Operacionalización SFL" con traducción de cada dimensión a recursos lingüísticos observables y referencia a Rúbrica v1.6 §2 y Anexo A.
> - Cambio superficial: agregada "Traducción SFL" — variación léxica sin cambio en recursos lógico-semánticos.
> - Cambio estructural: agregada "Traducción SFL" — incorporación de nuevos recursos de las metafunciones ideacional o interpersonal.
> - Desplazamiento cognitivo: agregada "Nota SFL" — el desplazamiento se manifiesta como incorporación de recursos lingüísticos observables.
> - Contraste cognitivo: agregada "Nota SFL" — el contraste se manifiesta cuando el estudiante produce recursos lingüísticos ausentes en su rastro inicial.
> - Transferencia: agregada "Nota SFL" — la transferencia se manifiesta como reproducción autónoma de la estructura del género y sus recursos lingüísticos.
>
> **Cambios v1.2 → v1.3** (inspección IP 2026-05-30):
> - "Prueba definitiva" reemplazado por "evidencia de transferencia cercana" en entradas deuda cognitiva de salida y transferencia (alineación con Revisión de Literatura §2.4).
> - Umbral de Cohen's κ unificado: κ ≥ 0.80 para reporte publicable (ponderado). κ ≥ 0.70 solo exploratorio. Alineado con MarcoMetodológico v1.5.
> - Δ_intra: fórmula ambigua ("Nivel_final_sesión") reemplazada por definición explícita M4 − M1 (DD_30 vs rastro papel). M3 declarado como indicador independiente, no componente de Δ_intra. Alineado con Rúbrica v1.4.
>
> **Cambios v1.1 → v1.2** (auditoría contra Premisas de Diseño v1.0, 2026-05-19):
> - Agregados: decisión defendible, deuda cognitiva de salida (DD_6), intervención completa (DD_12).
> - Δ_intra y Δ_inter como entradas formales con fórmula.
> - Andamiaje: progresión corregida (C2-C4 tiene MÁS mecanismos que C1).
> - Transferencia: aclarado que C5 SÍ tiene rastro en papel.
>
> **Cambios v1.0 → v1.1** (alineación con Premisas de Diseño v1.0, 2026-05-16):
> - Agregados términos v2.0: Modelo A/B, modo PLAN, modo BUILD, chatbot neutro, AGENT_ANALISTA_SFL, push DD_29, debriefing.
> - Corregidos: transferencia (con chatbot neutro, no sin IA), andamiaje (presión ausente, herramienta presente).

---

## Convención de notación (2026-06-16)

Para eliminar la colisión histórica entre dos sistemas que usaban `D` + número, el corpus distingue desde 2026-06-16:

| Notación | Significado | Fuente normativa | Ejemplo |
|----------|-------------|------------------|---------|
| `DD_N` (`DD_1`–`DD_39`) | **Decisión de Diseño** — decisiones de arquitectura del protocolo (qué se diseña y por qué) | `doc_inv_Premisas_Diseno` | `DD_14` = 7 controles del profesor; `DD_28` = ocultar nombres de modo al alumno |
| `D1`–`D4` | **Dimensión de análisis** — qué se mide en el razonamiento del estudiante | `doc_pro_Rubrica_Longitudinal` | `D1` = complejidad causal; `D4` = decisión bajo incertidumbre |
| `P1`–`P9` | **Premisa** — supuestos confirmados del diseño | `doc_inv_Premisas_Diseno` | `P5` = primero cerebro, después herramienta |
| `M1`–`M4` | **Momento de medición** — segmento metodológico de la clase | `doc_pro_Rubrica_Longitudinal` | `M1` = rastro en papel; `M4` = cierre |
| `C1`–`C5` | **Clase** del piloto | — | `C5` = transferencia (torre de enfriamiento) |

> **Regla:** la notación `D` sola (sin sufijo) queda reservada exclusivamente a las **dimensiones** `D1`–`D4`. Cualquier decisión de diseño se escribe siempre con el prefijo `DD_`. No existe `D5`–`D39`; esas decisiones son `DD_5`–`DD_39`.

---

## Términos del protocolo

### Deuda cognitiva
Condición en la que un estudiante produce un output correcto sin haber construido el proceso cognitivo que normalmente lo genera. No es un problema de honestidad académica; es un problema de diseño instruccional. La IA generativa la hace posible a escala.

### Rastro inicial
Producción escrita del estudiante (esquema, hipótesis, variables, decisión) generada ANTES de cualquier interacción con IA. Constituye la línea base del piloto. Su función es evidenciar el estado del razonamiento técnico sin mediación tecnológica.

### Contraste cognitivo
Proceso mental que ocurre cuando el estudiante compara su pensamiento propio con una interpelación externa (chatbot socrático, datos nuevos, pares). Solo es posible si hay algo previo que contrastar. Sin rastro inicial, no hay contraste: hay delegación.

**Nota SFL:** El contraste cognitivo se manifiesta lingüísticamente cuando el estudiante, tras la interpelación del chatbot, produce recursos lingüísticos que no estaban en su rastro inicial: añade un nexo causal donde antes solo había descripción, incorpora un marcador evidencial donde antes había certeza sin fuente, o introduce una cláusula condicional donde antes había decisión sin riesgo.

### Desplazamiento cognitivo
Cambio medible en el nivel de razonamiento de un estudiante entre dos momentos (intra-sesión o inter-sesión). Se mide en las 4 dimensiones del protocolo (D1–D4). Puede ser positivo (progresión), nulo (estancamiento) o negativo (regresión). Se expresa mediante dos métricas formales: Δ_intra y Δ_inter (ver entradas propias).

**Nota SFL:** El desplazamiento se manifiesta como incorporación de nuevos recursos lingüísticos observables (nexos causales, nominalizaciones, operadores modales, marcadores evidenciales, cláusulas condicionales) que no estaban presentes en el texto anterior. Un desplazamiento positivo es un cambio estructural; un desplazamiento nulo con cambio de palabras es un cambio superficial.

**Nota epistemológica:** Los prefijos *intra-* (lat. 'dentro de') e *inter-* (lat. 'entre') son convención establecida en investigación educativa y ciencias del comportamiento para distinguir mediciones dentro de una unidad experimental de mediciones entre unidades (Campbell & Stanley, 1963; Shadish, Cook & Campbell, 2002). La distinción no es terminológica ni estilística: responde a la necesidad metodológica de separar el efecto de una intervención (Δ_intra: ¿cambió el alumno durante la sesión?) de la retención entre intervenciones (Δ_inter: ¿el alumno llegó a la siguiente sesión con un nivel diferente al anterior?). Confundir ambos niveles de análisis —atribuir a la retención inter-sesiones lo que es ganancia intra-sesión, o viceversa— invalida las inferencias causales del diseño cuasi-experimental.

### Δ_intra (desplazamiento intra-sesión)
Diferencia entre el nivel alcanzado en la reflexión de cierre (M4, DD_30) y el nivel del rastro inicial (M1, papel) dentro de la misma sesión. Fórmula: `Δ_intra = Nivel_M4_cierre − Nivel_M1_rastro_papel`. Mide el efecto inmediato de la intervención (PLAN + BUILD en C2-C4; solo PLAN en C1; solo NEUTRO en C5) dentro de una clase. Se calcula por dimensión (D1-D4). M3 (evaluación BUILD) es un indicador independiente de evaluación crítica y NO se usa para calcular Δ_intra.

### Δ_inter (desplazamiento inter-sesión / transferencia longitudinal)
Diferencia entre el nivel del rastro inicial de una clase y el de la clase anterior. Fórmula: `Δ_inter = Nivel_rastro_clase_N − Nivel_rastro_clase_(N-1)`. Mide el aprendizaje retenido entre sesiones. Un Δ_inter = 0 durante dos sesiones consecutivas indica posible techo cognitivo.

**Sinónimo:** Δ_inter también se denomina **transferencia longitudinal**, porque conceptualmente mide cuánto se ha transferido (o persistido) el nivel de razonamiento de una clase a la siguiente. Se usa este sinónimo para distinguirlo de la **transferencia cercana** medida en C5 (caso nuevo, chatbot neutro): la transferencia longitudinal rastrea M1 entre clases dentro del mismo caso temático; la transferencia cercana, en cambio, evalúa si el alumno reproduce el método en un caso estructuralmente análogo pero distinto sin andamiaje activo. Ver entrada «Transferencia cercana».

### Modelo A (primera mitad de clase)
Estructura donde el alumno produce y la IA pregunta. El alumno escribe en papel, sube foto, y el chatbot en modo PLAN presiona su razonamiento con preguntas socráticas personalizadas (basadas en lo que escribió). Aplica en C1-C4.

### Modelo B (segunda mitad de clase)
Estructura donde la IA produce y el alumno evalúa. El chatbot en modo BUILD genera un documento técnico basado en el trabajo del alumno, con errores deliberados. El alumno evalúa libremente en el chat. Aplica en C2-C4.

### Modo PLAN (chatbot socrático)
Modo del chatbot que hace preguntas sin generar contenido. Hace visible lo que el estudiante omite, obliga a justificar supuestos y exige evidencia. Variantes por clase: socrático básico (C1), socrático de diagnóstico (C2), socrático de monitoreo (C3), adversarial (C4).

### Modo BUILD (chatbot generador)
Modo del chatbot que genera un entregable técnico basado en lo que el alumno produjo en Modelo A. Contiene errores deliberados de complejidad creciente (C2: obvios, C3: sutiles, C4: profesionales). Cuando el alumno señala un error, el chatbot DEFIENDE su posición técnicamente. El alumno debe sostener su argumento.

### Chatbot neutro
Modo del chatbot en Clase 5. Responde preguntas técnicas directamente sin presionar, cuestionar ni sugerir estructura. Mide si el alumno reproduce autónomamente la metodología aprendida (pensar primero, preguntar con estructura, evaluar críticamente).

### Modo adversarial
Variante del modo PLAN (Clase 4) que cuestiona la decisión del estudiante desde múltiples ángulos: falla de sensor, falla de actuador, fallas simultáneas, costo y seguridad. No valida ni corrige; presiona con escalación.

### AGENT_ANALISTA_SFL
Motor SFL compartido: recibe texto del estudiante y devuelve codificación D1-D4 con justificación basada en los 10 recursos lingüísticos del Anexo A de la Rúbrica (nexos causales, nominalizaciones, operadores modales, marcadores evidenciales, etc.). Es invocado por `AGENT_SESION` y `AGENT_TRAYECTORIA`; no opera autónomamente. Opera dentro de la plataforma (n8n + PostgreSQL).

### AGENT_SESION
Agente post-sesión (disparado al cierre de C1-C5): invoca a `AGENT_ANALISTA_SFL` sobre los momentos M1-M4 de UNA clase. Calcula Δ_intra = M4 − M1. Genera: (a) feedback SFL de proceso al alumno vía WhatsApp, (b) informe analítico al profesor con niveles D1-D4 por momento. Es el agente que ejecuta DD_16.

**Contenido del feedback al alumno (DD_16):**

| Lo que SÍ dice (SFL de proceso) | Lo que NO dice (dimensional, prohibido) |
|---|---|
| "Conectaste varias variables pero tus cadenas causales eran de un solo eslabón. La próxima vez intenta trazar el camino completo: ¿qué causó qué, y eso qué provocó después?" | "Estás en D1 nivel 2. Necesitas más nexos causales para llegar a nivel 3." |
| "Cuando el chatbot te mostró datos contradictorios, revisaste tu hipótesis. Ese hábito te va a servir en el caso de la torre de enfriamiento." | "Tu D3 mejoró de nivel 1 a nivel 2. Sigue así." |
| "Tus variables estaban bien identificadas pero sin valores. En ingeniería, un dato sin número es una opinión." | "D2 nivel 1: te faltan participantes con modificación numérica." |

El primer tipo enseña a razonar. El segundo enseña a pasar un test. Esta distinción protege la validez interna del estudio: el alumno recibe orientación formativa sin saber qué se está midiendo, evitando características de demanda que inflarían artificialmente Δ_inter. Ver Marco Metodológico v1.8 §5.1.

### AGENT_TRAYECTORIA
Agente longitudinal (disparado post-C2, C3, C4, C5, acumulativo): invoca a `AGENT_ANALISTA_SFL` sobre los rastros M1 de sesiones consecutivas. Calcula Δ_inter = M1_N − M1_(N-1) por dimensión. Detecta patrones: estancamientos (Δ_inter = 0 × 2 sesiones), regresiones (Δ_inter < 0), saltos (Δ_inter ≥ +2). Genera heatmap de trayectorias individuales. Compara transferencia M1_C1 → C5. Alerta al profesor sobre techos cognitivos. No genera feedback al alumno — solo al profesor. Adicionalmente calcula H_cohorte (homogeneidad de cohorte, ver entrada propia) como métrica exploratoria de diversidad entre estudiantes; esta salida se reserva para el análisis del estudio y no se reporta durante el piloto.

### Push DD_29
Mecanismo automático del chatbot BUILD: si el alumno acepta el documento sin cuestionar ningún error, el chatbot pregunta UNA vez "¿Lo firmarías con tu nombre profesional?" Sin revelar errores. Simula pregunta de supervisor real. La respuesta es dato binario de deuda cognitiva.

### Debriefing
Revelación post-piloto (después de Clase 5) donde se explica a los alumnos que los documentos BUILD contenían errores deliberados y su propósito investigativo. Práctica ética estándar en investigación con engaño leve.

### Decisión defendible
Producción final del alumno donde formula una decisión técnica con justificación, riesgo asumido, datos faltantes y criterio de escalamiento. No es una respuesta correcta/incorrecta: es la evidencia de que el alumno puede tomar una posición técnica y sostenerla con argumentos. Aplica en todas las clases.

### Deuda cognitiva de salida (DD_6)
Condición que se busca medir al final del piloto: ¿el alumno que completa las 5 sesiones aún muestra dependencia de la IA para razonar, o ha internalizado la metodología? La transferencia en C5 (caso nuevo, chatbot neutro) es la evidencia más directa de internalización. Si reproduce la secuencia (pensar primero → preguntar con estructura → evaluar críticamente) sin presión, la deuda se ha reducido.

### Intervención completa (DD_12)
Una intervención completa comprende las 5 sesiones del piloto (C1-C5) como unidad indivisible. No se puede evaluar el efecto del protocolo con una sola clase. El diseño requiere la trayectoria longitudinal para medir desplazamiento inter-sesión.

### Transferencia
Capacidad del estudiante de aplicar el método de razonamiento aprendido a un caso técnico nuevo sin presión socrática. El alumno SÍ produce rastro en papel (igual que en C1-C4), pero el chatbot está en modo NEUTRO (disponible, no guía). Es la evidencia de transferencia cercana: aprendizaje real vs. dependencia del andamiaje. Se evalúa en Clase 5.

**Nota SFL:** La transferencia se manifiesta cuando el estudiante reproduce autónomamente la estructura del género "diagnóstico técnico argumentado" (situación → causa → evidencia → decisión → riesgo) y los recursos lingüísticos asociados (nexos causales, participantes con valores, marcadores evidenciales, cláusulas condicionales) sin que el chatbot los exija. Si el estudiante produce estos recursos con un chatbot neutro, internalizó el género. Si no los produce, el género solo funcionó con andamiaje. Ver `doc_inv_SFL_Analisis_v1.1.md` §8.2.

### Andamiaje
Cualquier soporte externo que facilita el razonamiento del estudiante: instrucciones paso a paso, chatbot socrático, estructura de actividades. La progresión NO es lineal de más a menos: C1 tiene solo PLAN socrático básico; C2-C4 tienen MÁS mecanismos (PLAN + BUILD + push DD_29 + defensa DD_27), es decir, la presión cognitiva AUMENTA mientras el soporte explícito se mantiene; C5 retira todo andamiaje activo (chatbot neutro, sin presión ni estructura) para medir transferencia.

### Línea base
Estado del razonamiento del estudiante antes de la intervención pedagógica. En el piloto opera a dos niveles:
- **Intra-sesión:** el rastro inicial vs. la producción post-chatbot (dentro de una misma clase)
- **Inter-sesión:** el nivel de Clase 1 vs. clases posteriores

### Momentos de medición (M1-M4)
El protocolo captura hasta cuatro momentos de evidencia por clase. La distribución NO es uniforme:

| Clase | M1 (Papel) | M2 (Chat PLAN) | M3 (Chat BUILD) | M4 (Cierre DD_30) | Total |
|-------|:---:|:---:|:---:|:---:|:---:|
| C1 | ✓ | ✓ (PLAN básico) | — | ✓ | 3 momentos |
| C2 | ✓ | ✓ (PLAN) | ✓ (BUILD) | ✓ | 4 momentos |
| C3 | ✓ | ✓ (PLAN) | ✓ (BUILD) | ✓ | 4 momentos |
| C4 | ✓ | ✓ (PLAN adversarial) | ✓ (BUILD) | ✓ | 4 momentos |
| C5 | ✓ | ✓ (NEUTRO) | — | ✓ | 3 momentos |

- **C1 no tiene BUILD:** es línea base; solo Modelo A (papel + socrático básico) según DD_21.
- **C2-C4 tienen los 4 momentos:** PLAN socrático + BUILD con errores deliberados escalados (obvios → sutiles → profesionales).
- **C5 no tiene BUILD ni PLAN:** chatbot NEUTRO para medir transferencia sin andamiaje.
- **M3 (BUILD) no se usa para Δ_intra:** se analiza como indicador independiente de capacidad evaluativa (D3, DD_27).
- **Δ_intra = M4 − M1** (cierre DD_30 vs. rastro papel). **Δ_inter = M1_clase_N − M1_clase_(N-1)** (rastros papel de sesiones consecutivas).

---

## Dimensiones de análisis

### D1 — Complejidad causal
¿El estudiante identifica solo síntomas o construye cadenas de mecanismos? ¿Menciona causas de causas? ¿Conecta subsistemas?

**Operacionalización SFL:** Se mide por la presencia y calidad de nexos causales explícitos entre cláusulas y de nominalizaciones técnicas como participantes de procesos causales. Ver Rúbrica Longitudinal v1.6, §2 (criterio de codificación lingüística) y Anexo A.

### D2 — Especificidad técnica
¿Las variables mencionadas son medibles? ¿Usa valores con unidades? ¿Aplica umbrales técnicos? ¿El lenguaje es operacional o vago?

**Operacionalización SFL:** Se mide por la presencia de participantes técnicos con modificación numérica y unidades, y por el uso de umbrales de clasificación. Ver Rúbrica Longitudinal v1.6, §2 y Anexo A.

### D3 — Consciencia epistémica
¿Distingue lo que sabe de lo que supone? ¿Reconoce vacíos en su información? ¿Puede evaluar la calidad de su propia evidencia?

**Operacionalización SFL:** Se mide por la presencia de operadores modales epistémicos ("probablemente", "podría"), marcadores evidenciales ("según los datos", "asumo que") y cláusulas condicionales epistémicas ("si tuviera X dato, podría confirmar Y"). Ver Rúbrica Longitudinal v1.6, §2 y Anexo A.

### D4 — Decisión bajo incertidumbre
¿Toma una posición explícita o evade? ¿Nombra el riesgo que asume? ¿Define criterio de escalamiento? ¿Tiene plan B?

**Operacionalización SFL:** Se mide por la presencia de verbos de decisión en primera persona ("recomiendo", "decido"), cláusulas condicionales de consecuencia ("si no resuelve en 2h, el riesgo es…") y actos de habla de comunicación a autoridad ("le informo al supervisor que…"). Ver Rúbrica Longitudinal v1.6, §2 y Anexo A.

---

## Términos técnicos del caso

### ORP (Potencial de Óxido-Reducción)
Medida de la capacidad oxidante del agua en mV. Indica eficacia de la desinfección. Umbral crítico: < 650 mV.

### pH
Medida de acidez/alcalinidad. En agua de piscina, valores > 7.8 reducen la eficiencia del cloro libre hasta 80%.

### ΔP (Presión diferencial)
Diferencia de presión entre entrada y salida de un componente (filtro, intercambiador). Indica grado de obstrucción. Se mide en kPa.

### Retrolavado
Inversión del flujo a través del filtro para desprender material retenido y restaurar capacidad de filtración.

### Ciclos de concentración
En torres de enfriamiento: razón entre la concentración de sales en el agua recirculada y la del agua de reposición. Aumenta cuando la purga es insuficiente.

### Biofilm
Película de microorganismos adherida a superficies. En sistemas hidráulicos industriales, protege a los microorganismos del biocida y reduce eficiencia de transferencia de calor.

---

## Términos metodológicos

### Cambio superficial
El estudiante modifica su respuesta (palabras, componente mencionado) pero la estructura lógica del argumento no cambia. Ejemplo: cambiar "es el pH" por "es el ORP" sin agregar mecanismo.

**Traducción SFL:** Variación léxica sin cambio en los recursos lógico-semánticos. El estudiante sustituye participantes o procesos pero no incorpora nuevos nexos causales, nominalizaciones, marcadores evidenciales ni cláusulas condicionales. Ver `doc_inv_SFL_Analisis_v1.1.md` §2.

### Cambio estructural
El estudiante modifica la lógica de su razonamiento: agrega eslabones causales, introduce criterios de descarte, distingue niveles de evidencia. Ejemplo: pasar de "el agua está turbia" a "la temperatura acelera consumo de cloro, lo que baja ORP y permite proliferación".

**Traducción SFL:** Incorporación de nuevos recursos de las metafunciones ideacional (nexos causales, nominalizaciones técnicas, participantes con modificación numérica) o interpersonal (operadores modales epistémicos, marcadores evidenciales, cláusulas condicionales). El cambio estructural es observable en el texto: el estudiante produce recursos lingüísticos que no estaban presentes en su rastro inicial. Ver `doc_inv_SFL_Analisis_v1.1.md` §2.

### Techo cognitivo
Punto en la trayectoria longitudinal donde el desplazamiento se detiene (Δ_inter = 0 durante dos sesiones consecutivas). Puede indicar que el andamiaje es insuficiente, que el estudiante alcanzó su máximo con la información disponible, o que hay factores externos.

### Homogeneidad de cohorte (H_cohorte)
Métrica exploratoria de similitud entre estudiantes. Se define como la similitud semántica media entre todos los pares de rastros iniciales (M1) de estudiantes distintos dentro de una misma clase, calculada sobre los textos digitalizados mediante embeddings (similitud coseno). Fórmula: `H_cohorte(clase) = media(sim(M1_i, M1_j))` para todo par de estudiantes i ≠ j. Su trayectoria C1 → C5 indica si la diversidad de razonamiento de la cohorte se preserva, se comprime (homogeneización) o se expande.

**Qué mide y qué no:** no mide nivel de razonamiento (eso lo miden D1-D4); mide diversidad entre estudiantes. Un aumento sostenido de H_cohorte indica que las producciones de la cohorte convergen hacia estructuras similares — fenómeno documentado experimentalmente como efecto del uso directo de IA generativa (Liu et al., 2024, arXiv:2401.06816, preprint: la homogeneización persiste incluso al retirar la herramienta). En el protocolo cumple doble función: (a) réplica conceptual de ese hallazgo en dominio ingenieril; (b) autocontrol del diseño — detectar si el propio andamiaje socrático PLAN comprime la diversidad de razonamiento de la cohorte.

**Cautela interpretativa:** la ficha M1 es un género cerrado de 9 secciones obligatorias que impone una similitud estructural de base entre estudiantes. Por eso H_cohorte se interpreta por su trayectoria relativa C1 → C5, nunca por su valor absoluto en una clase aislada.

**Estatus metodológico:** variable exploratoria secundaria. La calcula `AGENT_TRAYECTORIA` sobre los rastros M1 ya digitalizados; no requiere instrumentos nuevos ni carga adicional al estudiante. No participa del cálculo de Δ_intra ni Δ_inter, y no genera feedback al alumno ni al profesor durante el piloto: se reporta solo en el análisis del estudio. Ver Marco Metodológico v1.9 §5.3.

### Señal vs. ruido (en el contexto del caso)
- **Señal:** variable que aporta información diagnóstica directa (ORP, ΔP, caudal)
- **Ruido:** variable que correlaciona temporalmente pero no tiene relación causal directa con el problema (hora del día como variable independiente)

### Cohen's Kappa (κ)
Estadístico de acuerdo inter-codificador que corrige por azar. Valores: < 0.40 pobre, 0.41–0.60 moderado, 0.61–0.80 sustancial, > 0.80 casi perfecto. Umbral mínimo del protocolo para reporte publicable: κ ≥ 0.80 (ponderado, lineal o cuadrático). κ ≥ 0.70 acepta solo análisis exploratorio.