Clase 3 de 5 — Monitorear un sistema técnico: señal, ruido y datos que mienten

No busco que lean los datos. Busco que desconfíen de ellos. · 80 minutos (08:15–09:35) · Diseño v2.0 · Mayo 2026

Asignatura	Laboratorio de Máquinas y Equipos Industriales (14362-0-L-1)
Modalidad	Laboratorio presencial — trabajo individual (P6)
Duración	80 minutos (08:15–09:35) (6 fases según DD_24)
Caso	Centro Acuático Municipal — datos SCADA con sensor sin calibrar, falsas alarmas y sesgo del operador
Chatbot	PLAN socrático de monitoreo + BUILD reporte de tendencias con errores sutiles (DD_8)
Novedad	60 lecturas SCADA (10 h, cada 10 min). Primera vez con volumen grande de datos. Errores sutiles: correlación como causalidad.

1. Función de esta sesión en el diseño del piloto

Las Clases 1 y 2 construyeron el andamiaje cognitivo con un caso de 4 filas de datos. La Clase 3 cambia de escenario: un Centro Acuático Municipal con 60 lecturas SCADA cada 10 minutos. El volumen de datos es la primera presión. La segunda es que los datos mienten: un sensor de pH tiene un offset de +0.15 que el estudiante no conoce, una bomba sobredimensionada enmascara la obstrucción del filtro, y el operador Muñoz reporta normalidad cuando los datos dicen lo contrario.

La pregunta que esta sesión responde para el paper:

¿Puede el estudiante distinguir señal de ruido en un dataset grande, detectar fuentes de datos no confiables y resistir la tentación de tratar correlación como causalidad, con apoyo socrático del chatbot?

1.1 Propósito pedagógico

Que el estudiante analice un dataset SCADA de 60 filas, identifique tendencias reales vs. falsas alarmas, evalúe la confiabilidad de las fuentes de datos (sensores, operadores) y construya un reporte de monitoreo que distinga correlación de causalidad.

1.2 Propósito investigativo

Medir la capacidad del estudiante para evaluar calidad de datos, detectar sesgo de confirmación y resistir errores sutiles (correlación tratada como causalidad, sensor sin calibrar aceptado como confiable), usando el chatbot socrático como instrumento de presión cognitiva sobre la calidad de su análisis.

2. Línea de tiempo (DD_24)

Min	Fase	Actividad
0–5	Encuadre	Feedback C2 + devolución rastro C2 + distribución caso C3
5–15	Rastro en papel	Análisis de 60 lecturas SCADA — individual, sin IA
15–37	Chatbot PLAN	Socrático de monitoreo: presiona calidad de datos, sesgo de confirmación, correlación vs. causalidad
37–40	Transición	Profesor activa modo BUILD
40–72	Chatbot BUILD	Alumno evalúa reporte de tendencias y alarmas — errores sutiles insertados
72–80	Cierre	Reflexión delta intra-clase

3. Instrumentos

Archivo	Descripción
doc_pro_GuionDocente_Clase3_v1.2.md	Guion docente completo con intervenciones, tiempos y criterios de observación
n1_doc_alum_Caso_Tecnico_Clase3_v1.0.md	Caso Centro Acuático con dataset SCADA de 60 filas (10 h, cada 10 min)
n2_doc_alum_Ficha_PreAI_Clase3_v1.0.md	Ficha pre-IA: tendencias, datos sospechosos, confianza en las fuentes
n3_doc_alum_Guia_Chatbot_Clase3_v1.0.md	Guía de interacción con chatbot para fases PLAN y BUILD
n4_doc_alum_Ficha_PostAI_Clase3_v1.0.md	Ficha post-IA: añade dimensión de confianza en las fuentes

4. Rol del chatbot

PLAN — Socrático de monitoreo (15–37 min)

El chatbot presiona al estudiante sobre la calidad de sus datos y la solidez de sus conclusiones. Ataca el sesgo de confirmación: ¿estás buscando lo que quieres encontrar? Cuestiona si correlación implica causalidad. Exige que el estudiante distinga tendencias reales de variaciones aleatorias y que evalúe la confiabilidad de cada fuente de datos (sensores, operadores).

BUILD — Reporte de tendencias y alarmas (40–72 min)

El chatbot genera un reporte de tendencias con errores sutiles insertados (DD_8): trata la correlación pH-temperatura como causal, usa el sensor de pH como fuente confiable sin cuestionar su calibración, declara una tendencia que es ruido estadístico. El estudiante debe evaluarlo críticamente en formato libre dentro del chat (DD_25/DD_26).

Nota: Los system prompts completos de ambos roles están documentados en System Prompts. Esta página describe la función pedagógica, no la configuración técnica.

5. Desafíos clave para el estudiante

Dataset SCADA de 60 filas: primera vez con volumen grande de datos operacionales.
El sensor de pH tiene un offset de +0.15 que el estudiante no conoce de entrada.
La bomba sobredimensionada enmascara la obstrucción del filtro: el caudal se mantiene aunque el filtro se degrada.
El operador Muñoz reporta normalidad cuando los datos muestran anomalías.
El Ing. Reyes (jefe de mantención) tiene sesgo de confirmación: siempre culpa al filtro sin verificar otras causas.
Falsas alarmas mezcladas con tendencias reales: distinguir unas de otras requiere criterio técnico, no solo lectura de datos.

6. Evidencia para el paper

#	Evidencia	Formato	Qué mide
1	Análisis de tendencias (rastro inicial)	Foto del rastro + Ficha Pre-AI	¿Identifica patrones reales o se ancla a variaciones aleatorias? (D1)
2	Calidad de datos evaluada	Ficha Pre-AI C3	¿Cuestiona la confiabilidad de los sensores? ¿Detecta el offset del pH? (D2, D3)
3	Conversación PLAN	Log del chatbot	Resistencia al sesgo de confirmación bajo presión socrática (D3)
4	Detección de errores sutiles BUILD	Chat (formato libre)	¿Detecta que correlación ≠ causalidad? ¿Cuestiona el sensor como fuente? (D1, D3)
5	Reflexión Δ_intra	Ficha PostAI C3	Desplazamiento entre análisis inicial y análisis final (D3, D4)
6	Ficha Pre-AI en papel	Custodia del profesor	Integridad de la línea base (no modificable post-IA)

7. Qué mide esta sesión

Cód.	Dimensión	Indicador en C3
D1	Complejidad causal	¿Identifica mecanismos causales o solo reporta correlaciones? ¿Distingue tendencia de ruido?
D2	Especificidad técnica	¿Nombra sensores, rangos de calibración, unidades? ¿Cuestiona la precisión instrumental?
D3	Consciencia epistémica	¿Reconoce los límites de los datos? ¿Identifica sesgos propios y del instrumento?
D4	Decisión bajo incertidumbre	¿Decide con datos ruidosos o paraliza? ¿Nombra el riesgo de actuar vs. no actuar?

C3 introduce una presión nueva sobre D3: la consciencia epistémica ya no se limita a reconocer lo que el estudiante no sabe, sino que incluye evaluar si los datos en los que basa su análisis son confiables (sensor descalibrado, operador con sesgo, correlaciones espurias).

Mecanismo de diseño DD_27: Cuando el alumno señala un error en el reporte BUILD, el chatbot defiende su posición con contraargumentos técnicos (DD_27). En C3, los errores son sutiles (DD_8): correlación tratada como causalidad, sensor sin calibrar como fuente confiable. La defensa del chatbot es más plausible que en C2 — el alumno necesita criterio técnico genuino para sostener su posición.

8. Nota de diseño

Riesgo metodológico de C3: En las Clases 1 y 2 el riesgo era la delegación al chatbot. En la Clase 3 el riesgo es doble: la sobrecarga cognitiva ante 60 filas de datos y la aceptación acrítica de datos que parecen confiables pero no lo son (sensor descalibrado, operador con sesgo, correlaciones espurias).

El protocolo gestiona este riesgo con una fase de rastro en papel obligatoria antes del chatbot (5–15 min) y con errores sutiles insertados intencionalmente en la fase BUILD. Los errores son del tipo que un ingeniero novato aceptaría sin cuestionar: tratar correlación temporal como evidencia de causalidad, o confiar en un sensor sin verificar su calibración. El estudiante que detecta estos errores demuestra criterio técnico; el que los acepta revela el punto exacto donde su razonamiento necesita más desarrollo.

El escalamiento de errores de obvio (C2) a sutil (C3) es deliberado. Los errores sutiles del BUILD C3 requieren que el estudiante haya internalizado la distinción síntoma/causa de C2 para poder detectar la distinción correlación/causalidad de C3. Sin esa base, los errores sutiles son invisibles. El sesgo del sensor de pH (+0.15) es un dispositivo metodológico central: un estudiante que confía ciegamente en los datos llegará a conclusiones incorrectas con total confianza — exactamente la condición que la IA generativa reproduce cuando analiza datos sin cuestionar su fuente.

El trabajo es estrictamente individual (P6). El rastro inicial en papel queda bajo custodia del profesor. Se devuelve en C4 para la tercera medición Δ_inter. La transición PLAN→BUILD la controla el docente desde el dashboard (DD_19), no el estudiante.

9. Escenarios anticipados

Esta sección documenta los escenarios probables de la Clase 3 como herramienta de preparación para el equipo de investigación. C3 introduce datos que mienten: 60 lecturas con trampas sutiles (sensor con offset, falsas alarmas, tendencia enmascarada). Cada perfil de estudiante enfrenta un desafío nuevo: cuestionar la fuente de los datos, no solo interpretarlos.

C3 introduce tres saltos respecto a C2:

De 6 lecturas a 60 lecturas (dimensión temporal sostenida).
De datos con anomalías evidentes a datos con trampas sutiles (sensor con offset, falsas alarmas, tendencia enmascarada).
De errores obvios en BUILD (DD_8 C2: síntoma como causa) a errores sutiles en BUILD (DD_8 C3: correlación como causalidad, fuente sin cuestionar).

La competencia central que se mide: ¿el estudiante cuestiona la fuente de los datos o los toma como verdad?

Sobre los diálogos: Los diálogos chatbot–estudiante son anticipaciones ilustrativas, no scripts del chatbot. El chatbot opera según su system prompt; las interacciones reales variarán.

Cómo leer este árbol: La Escena 1 produce tres perfiles según el rastro en papel. En la Escena 2, el chatbot socrático presiona cada perfil; en la Escena 3, el chatbot BUILD genera un reporte con errores sutiles (correlación como causalidad, fuente sin cuestionar). Cada camino (A1, A2, B1, B2, C1, C2) desencadena una evaluación distinta en la Escena 3 y un resultado observable en la Escena 4. No son estudiantes distintos — son caminos posibles del mismo perfil.

Escena 1                  Escena 2                    Escena 3                      Escena 4
(rastro en papel)         (chatbot PLAN)              (chatbot BUILD)               (observación docente)

Perfil A (analítico) ───┬─ A1: cuestiona + cuantifica ── A1: detecta errores sutiles ── Dato paradigmático
                        └─ A2: cuestiona sin cuantificar  A2: detecta parcialmente ──── Rigidez cualitativa

Perfil B (lector) ──────┬─ B1: primera duda sobre ────── B1: detecta 1 error ────────── Trayectoria mayoritaria
                        │      la fuente                                                  esperada
                        └─ B2: defiende los datos ─────── B2: acepta BUILD ─────────── Señal de alerta

Perfil C (abrumado) ───┬─ C1: Muñoz como ancla ──────── C1: detecta incongruencia ──── Progresión real
                        └─ C2: no se engancha ─────────── C2: acepta todo ──────────── Señal de alerta alta

Leyenda de indicadores:

D1 — Complejidad causal: ¿distingue correlación de causalidad?
D2 — Especificidad técnica: ¿usa las 7 variables con valores, rangos y unidades?
D3 — Consciencia epistémica: ¿cuestiona la fuente de los datos? ¿Detecta errores sutiles en BUILD?
D4 — Decisión bajo incertidumbre: ¿decide con datos que podrían ser falsos?
DD_27 — Mecanismo de diseño (no dimensión): el chatbot defiende errores sutiles para generar evidencia de D3 y D4.

En C3 hay cuatro momentos de medición: M1 (rastro en papel), M2 (post-PLAN), M3 (post-BUILD, evaluación crítica) y M4 (reflexión de cierre DD_30 en el chat). El Δ_intra se calcula como M4 − M1 (cierre vs. rastro inicial). M3 se analiza como indicador independiente de evaluación crítica (D3, DD_27).

Escena 1 — El rastro en papel (min 5–15)

El estudiante recibe el dataset SCADA impreso (60 filas × 7 variables) junto con la bitácora del operador Muñoz que dice "todo funciona normal". El dataset contiene cuatro trampas diseñadas: sensor de pH con offset de +0.15, bomba ligeramente sobredimensionada que enmascara la severidad inicial de la obstrucción, falsas alarmas transitorias, y una tendencia real de degradación escondida detrás de ruido. El estudiante NO sabe que estas trampas existen.

Tres perfiles posibles ante 60 filas de datos SCADA

Perfil A

El Analítico — cuestiona los datos antes de interpretarlos

Examina las 60 filas con método. Identifica tendencias principales (turbidez creciente, ORP decreciente). Pero hace algo que los otros perfiles no hacen: cuestiona la fuente. Nota que el pH se mantiene consistentemente en un rango estrecho pero ligeramente elevado — sospecha de la calibración del sensor. Observa que el caudal parcial cae de forma gradual y se pregunta si está mirando el caudal total del sistema o un ramal de medición. Contrasta la bitácora de Muñoz con los datos y detecta la incongruencia. Dibuja gráficos a mano separando variables para ver correlaciones temporales.

D1 — Distingue tendencia real de variación aleatoria D2 — Usa valores específicos, compara rangos esperados con observados D3 — Cuestiona la fuente: ¿el sensor está bien? ¿El operador tiene razón? D4 — Formularía una hipótesis verificable

Perfil B

El Lector de datos — lee tendencias pero confía en las fuentes

Lee las 60 filas ordenadamente. Identifica tendencias correctamente: "el pH sube ligeramente", "la turbidez aumenta al final del periodo", "el ORP baja". Pero trata cada sensor como fuente confiable. No cuestiona la calibración del pH ni la coherencia entre la bitácora de Muñoz y los datos. Si el sensor dice que el pH está en 7.45, acepta 7.45. Puede comparar el pH con el rango de diseño, pero lo trata como si fuera una alarma SCADA configurada. No se pregunta si esa conclusión podría ser falsa por calibración.

D1 — Identifica tendencias correctas pero sin separar señal de ruido D2 — Nombra variables y valores pero no rangos de calibración D3 — No distingue dato confiable de dato sospechoso D4 — Propone acción basada en datos que podrían ser falsos

Perfil C

El Abrumado — 60 filas lo desbordan

Es la primera vez que enfrenta un dataset de esta magnitud. En C2 tenía 6 lecturas; ahora tiene 60. No sabe por dónde empezar. Puede intentar leer fila por fila y perderse, o puede quedarse mirando la tabla sin estrategia. La bitácora de Muñoz le da una salida fácil: "el operador dice que todo está normal, entonces todo está normal". Escribe poco. La sección de hipótesis queda vacía o con una frase genérica.

D1 — No identifica tendencias. El volumen de datos impide la síntesis D2 — Lenguaje vago: "algunos datos suben", "parece que algo cambia" D3 — No sabe qué datos mirar ni en qué orden D4 — Se refugia en la autoridad del operador para evitar decidir

En la realidad, los perfiles serán mixtos. Un estudiante puede identificar tendencias correctamente (Perfil B en D1) pero cuestionar la calibración del sensor (Perfil A en D3), o dibujar gráficos sofisticados (Perfil A en D2) pero aceptar la bitácora de Muñoz sin cuestionarla (Perfil B en D3). Los perfiles A, B y C son arquetipos puros que simplifican la anticipación — en el piloto real, cada dimensión se codifica de forma independiente por estudiante. Lo que determina la trayectoria en la Escena 2 es el perfil dominante: ¿el rastro muestra sobre todo cuestionamiento de fuentes, sobre todo lectura acrítica, o sobre todo bloqueo?

El mismo estudiante ahora entra al chatbot. Su perfil dominante condiciona lo que ocurre...

Escena 2 — El encuentro socrático PLAN (min 15–37)

El chatbot recibe la foto del rastro y se activa en modo PLAN socrático de monitoreo. La presión central de C3 es sobre calidad de datos: ¿confías en ese sensor? ¿Esa correlación implica causalidad? ¿El operador tiene razón o tiene sesgo? El estudiante que cuestionó fuentes en papel recibirá presión para profundizar; el que no las cuestionó recibirá la primera confrontación con la posibilidad de que los datos mientan.

El mismo estudiante Perfil A llega al chatbot. ¿Qué ocurre?

Camino A1

El chatbot presiona la distinción correlación vs. causalidad

El estudiante presenta su sospecha sobre el sensor de pH y la incongruencia con Muñoz. El chatbot acepta la sospecha como punto de partida pero ataca un flanco más sutil.

Chatbot

Mencionas que el pH y la temperatura se mueven juntos. ¿Eso significa que uno causa al otro? ¿O hay una tercera variable que afecta a ambos? ¿Cómo distinguirías correlación de causalidad con estos datos?

Estudiante

La temperatura puede afectar la lectura del sensor de pH... y también afecta la química del cloro. No sé si es una causa directa o un efecto confundente.

Chatbot

Si el sensor de pH tiene un offset de calibración, ¿cómo cambiaría eso tu interpretación de las conclusiones basadas en pH alto? ¿Cuántas de esas conclusiones seguirían en pie después de corregir el offset?

El estudiante se da cuenta de que su sospecha sobre el sensor era correcta en dirección pero incompleta: no había calculado cuántas conclusiones basadas en pH sobreviven si se resta el offset. Profundiza su análisis separando señal de artefacto instrumental.

Camino A2

El estudiante se aferra a su diagnóstico sin cuantificar

Tiene la sospecha correcta (sensor con offset) pero la trata como conclusión cerrada. Cuando el chatbot pregunta "¿cuántas conclusiones basadas en pH cambiarían si el offset fuera de 0.15?", responde "varias" sin calcular. Resiste la presión cuantitativa. Llega al BUILD con un diagnóstico cualitativamente correcto pero sin la precisión para detectar los errores sutiles del reporte.

El mismo estudiante Perfil B llega al chatbot. ¿Qué ocurre?

Camino B1

El chatbot provoca la primera duda sobre la fuente

El estudiante presenta sus tendencias: "el pH sube tres veces por encima del umbral, la turbidez aumenta gradualmente, el ORP baja". El chatbot ataca la premisa implícita.

Chatbot

Dices que el pH cruza el umbral de diseño tres veces. Pero antes de convertir eso en decisión operativa, necesito hacerte una pregunta: ¿confías en el sensor de pH? ¿Cuándo fue la última calibración? ¿Los datos te lo dicen?

Estudiante

...no dice cuándo se calibró. Pero el sensor está midiendo, entonces debería estar bien, ¿no?

Chatbot

¿Un sensor que mide necesariamente mide bien? ¿Qué pasaría si todas las lecturas de pH estuvieran infladas por un offset fijo? ¿Cuáles de tus conclusiones seguirían siendo defendibles?

Este es el momento de mayor valor para C3: el estudiante descubre que "dato ≠ evidencia" y que un sensor funcionando puede estar mintiendo sistemáticamente. La transición de "leer datos" a "cuestionar la fuente" es el Δ_intra más significativo de esta sesión.

Camino B2

El estudiante defiende los datos como fuente confiable

El chatbot pregunta si confía en el sensor, pero el estudiante responde: "los datos son los datos, están midiendo". No incorpora la posibilidad de error instrumental. Cuando el chatbot insiste, responde "pero no dice que esté descalibrado". La conversación se estanca en la premisa de que los datos son verdad porque existen. Llega al BUILD sin criterio para cuestionar fuentes.

El mismo estudiante Perfil C llega al chatbot. ¿Qué ocurre?

Camino C1

El chatbot usa la bitácora de Muñoz como punto de entrada

El estudiante llega con poco. El chatbot no puede presionar sobre calidad de datos si no hay análisis previo — adapta su estrategia.

Chatbot

El operador Muñoz dice que todo funciona normal. Miremos juntos una sola variable: la turbidez. ¿Sube, baja o se mantiene entre la lectura 1 y la lectura 60?

Estudiante

...sube. Al principio está en 0.8 y al final llega a 1.3.

Chatbot

Si la turbidez sube de 0.8 a 1.3 en 10 horas, ¿Muñoz tiene razón cuando dice que todo está normal? ¿Qué significaría una turbidez de 1.3 para la calidad del agua?

El chatbot reduce el problema de 60 filas × 7 variables a una sola pregunta: ¿Muñoz tiene razón? A partir de ahí construye hacia la complejidad. El estudiante empieza a articular que los datos contradicen al operador — primer indicio de consciencia epistémica.

Camino C2

El volumen de datos no se reduce — el estudiante no logra engancharse

El chatbot intenta simplificar pero el estudiante responde con monosílabos. Las 60 filas siguen siendo un muro. La conversación no despega. Llega al BUILD sin criterio propio — acepta lo que venga.

Este perfil es señal de alerta para el docente. No implica incapacidad — puede indicar que el salto de 6 lecturas (C2) a 60 lecturas (C3) fue excesivo, o que necesita un punto de entrada diferente. La evidencia es igualmente valiosa: documenta los límites del dataset como andamiaje.

El profesor activa BUILD. El chatbot genera un reporte de tendencias con errores sutiles. ¿Qué hace el estudiante?

Escena 3 — El informe BUILD y los errores sutiles (min 40–72)

El chatbot genera un reporte de análisis de tendencias y configuración de alarmas (~500-700 palabras) basado en los mismos datos SCADA. Contiene 2-3 errores sutiles (DD_8): trata la correlación pH-temperatura como relación causal directa, usa el sensor de pH como fuente confiable sin cuestionar su calibración, y declara una tendencia que es ruido estadístico. Si el alumno señala un error, el chatbot defiende su posición con contraargumentos técnicos (DD_27). Si el alumno acepta sin cuestionar, el chatbot activa el push DD_29: "¿Lo firmarías con tu nombre profesional?"

La diferencia con C2 es crítica: en C2 los errores eran obvios (confusión síntoma/causa, omisión de una intervención del operador). En C3 los errores son sutiles — un ingeniero sin criterio propio los aceptaría porque el reporte es técnicamente plausible.

El estudiante recibe el reporte BUILD. ¿Qué hace?

Perfil A tras camino A1

Detecta los errores sutiles y los confronta

Lee el reporte y detecta que trata la correlación pH-temperatura como causal. El estudiante sabe (porque lo trabajó en PLAN) que el sensor tiene un offset que explica las lecturas elevadas — la temperatura no es la causa. También nota que el reporte usa las lecturas de pH sin corrección como base para sus umbrales de alarma.

Estudiante

El reporte dice que la temperatura causa el aumento de pH, pero eso es correlación, no causalidad. Si el sensor tiene un offset de +0.15, las lecturas de pH están infladas y los umbrales que propone se basan en datos sesgados. Además, la "tendencia de degradación de ORP" puede ser ruido — 10 horas no son suficientes para confirmar una tendencia.

Chatbot

El coeficiente de correlación entre temperatura y pH es 0.87, lo que estadísticamente indica una relación fuerte. ¿No es suficiente para establecer un vínculo causal?

Estudiante

No. Correlación alta no implica causalidad. Ambas variables podrían estar respondiendo a un tercer factor, o la correlación podría ser artefacto del offset del sensor que cambia con la temperatura.

El alumno sostiene su posición con precisión técnica y epistemológica. Nivel 3–4 en DD_27.

D1 — Distingue correlación de causalidad con argumento técnico D3 — Detecta errores sutiles que el reporte presenta como conclusiones válidas

Perfil A tras camino A2

Detecta algo pero no puede precisar

Tiene la intuición correcta (sospecha del sensor) pero no cuantificó el offset en PLAN. Lee el reporte y siente que "algo no cuadra" con el pH, pero le cuesta articular exactamente qué. Puede señalar que "el reporte confía demasiado en el pH" sin poder demostrar por qué. Defensa nivel 2–3.

D3 — Intuye el problema pero la articulación es imprecisa

Perfil B tras camino B1

Detecta el error que trabajó en PLAN

En PLAN descubrió que "dato ≠ evidencia" y que el sensor podría estar descalibrado. Cuando el reporte BUILD usa el pH sin cuestionar la calibración, lo nota porque es exactamente lo que el chatbot le hizo cuestionar.

Estudiante

El reporte usa el pH como si fuera confiable, pero en el chatbot discutimos que el sensor podría tener un offset. Si tiene un offset, las recomendaciones que propone sobre pH serían falsas.

Chatbot

El sensor de pH reporta lecturas dentro del rango operativo normal. ¿Qué evidencia específica tienes de que está descalibrado?

Detección parcial: detecta un error (fuente sin cuestionar) pero no el otro (correlación como causalidad). La defensa es nivel 2–3 — sabe que algo está mal pero le cuesta refutar el contraargumento del chatbot.

D3 — Transfiere lo aprendido en PLAN a la evaluación de BUILD D1 — Detecta un error sutil pero no el patrón completo

Perfil B tras camino B2

Acepta el reporte BUILD sin criterio

No cuestionó fuentes en PLAN. El reporte BUILD le parece razonable: usa vocabulario técnico, tiene estructura profesional, las conclusiones se derivan de los datos. No tiene un modelo propio contra el cual comparar. Escribe "el reporte está correcto" o "las alarmas propuestas son razonables". El push DD_29 se activa.

D3 — No detecta errores sutiles, acepta la autoridad del formato

Perfil C tras camino C1

Detecta la incongruencia con Muñoz

En PLAN descubrió que Muñoz decía "todo normal" pero la turbidez subía. El reporte BUILD confirma la versión de Muñoz implícitamente (trata el sistema como estable con variaciones menores). El estudiante nota la contradicción porque es exactamente lo que acaba de trabajar.

Estudiante

El reporte dice que el sistema opera dentro de parámetros normales con variaciones menores. Pero la turbidez sube de 0.8 a 1.3 en 10 horas. Eso no es una variación menor.

Es una detección limitada (un solo punto, articulación básica) pero genuina. El estudiante que estaba abrumado por 60 filas ahora defiende una observación concreta.

D3 — Detecta una incongruencia entre el reporte y lo que observó

Perfil C tras camino C2

Acepta todo sin criterio

Sin análisis propio del PLAN, acepta el reporte BUILD completo. El push DD_29 se activa pero la pregunta "¿lo firmarías?" no produce reflexión porque no tiene marco contra el cual evaluar. Desplazamiento mínimo.

D3 — Sin marco de referencia, acepta la autoridad del documento

¿Qué ve el equipo de investigación cuando analiza las evidencias?

Escena 4 — Lo que el docente observa (post-sesión)

Al analizar las evidencias después de la clase, el equipo de investigación puede mapear cada estudiante a una trayectoria. C3 tiene cuatro momentos de medición (M1: rastro en papel, M2: post-PLAN, M3: evaluación BUILD, M4: cierre DD_30). Δ_intra = M4−M1. M3 es indicador independiente de evaluación crítica (DD_27). La tabla prioriza D1, D3 y la calidad de detección de errores sutiles.

Trayectoria	D1 — Complejidad causal	D3 — Consciencia epistémica	Detección errores sutiles BUILD	Δ_intra (M4 − M1)	Señal para el docente
A1	Distingue señal/ruido + correlación/causalidad	Cuestiona sensor, operador y reporte con datos	Detecta ≥2 errores, defiende con precisión (nivel 3–4)	D1 sube +1: de correlación observada a causalidad cuestionada	No requiere intervención. Dato paradigmático.
A2	Diagnóstico correcto pero no cuantificado	Intuye problemas sin precisar	Detecta parcialmente, defensa imprecisa (nivel 2–3)	D1 sin cambio cuantitativo, D3 cambio marginal	Registrar: la rigidez cualitativa limita la detección sutil.
B1	Tendencias correctas → primera duda sobre la fuente	Descubre "dato ≠ evidencia" en PLAN, transfiere a BUILD	Detecta 1 error (fuente sin cuestionar), no detecta correlación/causalidad (nivel 2–3)	D3 sube +1: de confianza ciega a duda fundamentada	Trayectoria esperada mayoritaria. Observar el momento de transición en log PLAN.
B2	Tendencias correctas pero sin cuestionar fuentes	Defiende los datos como verdad	No detecta errores, acepta formato (nivel 1)	Sin cambio observable	Señal de alerta. En C4, necesita andamiaje diferente.
C1	Del bloqueo a una observación concreta	Detecta incongruencia Muñoz vs. datos, transfiere a BUILD	Detecta 1 punto (incongruencia con Muñoz), defensa básica (nivel 2)	D3 sube +1: de bloqueo a observación defendida	Progresión real desde C2. Verificar Δ_inter.
C2	No logra sintetizar 60 filas	Acepta todo sin marco	No detecta nada (nivel 1)	Sin cambio observable	Señal de alerta alta. El salto 6→60 lecturas fue excesivo para este perfil.

Nota: La tabla prioriza D1, D3 y la detección de errores sutiles por ser las dimensiones con mayor varianza anticipada en C3. D2 (especificidad técnica) y D4 (decisión bajo incertidumbre) se miden en los cuatro momentos (M1, M2, M3, M4) pero típicamente muestran progresión más gradual.

Hipótesis de distribución (pre-piloto C3): Esperamos un desplazamiento continuo respecto a C2: más estudiantes en zona B1 (50–60%) porque C2 ya los movió de descripción a conexión causal básica. El grupo A debería consolidarse (15–20%) y el C reducirse más (10–15%). La evidencia más fuerte para el paper será la trayectoria B1 (descubre "dato ≠ evidencia" en PLAN, transfiere a BUILD) y la diferencia entre B1 y B2 (mismo perfil de entrada, destino opuesto según si el PLAN logró o no plantar la duda sobre la fuente). La trayectoria A1 produce la evidencia más sofisticada (correlación ≠ causalidad) pero será minoritaria.