Clase 3 de 5 — Monitorear un sistema técnico: señal, ruido y datos que mienten
| Asignatura | Laboratorio de Máquinas y Equipos Industriales (14362-0-L-1) |
| Modalidad | Laboratorio presencial — trabajo individual (P6) |
| Duración | 80 minutos (08:15–09:35) (6 fases según DD_24) |
| Caso | Centro Acuático Municipal — datos SCADA con sensor sin calibrar, falsas alarmas y sesgo del operador |
| Chatbot | PLAN socrático de monitoreo + BUILD reporte de tendencias con errores sutiles (DD_8) |
| Novedad | 60 lecturas SCADA (10 h, cada 10 min). Primera vez con volumen grande de datos. Errores sutiles: correlación como causalidad. |
1. Función de esta sesión en el diseño del piloto
Las Clases 1 y 2 construyeron el andamiaje cognitivo con un caso de 4 filas de datos. La Clase 3 cambia de escenario: un Centro Acuático Municipal con 60 lecturas SCADA cada 10 minutos. El volumen de datos es la primera presión. La segunda es que los datos mienten: un sensor de pH tiene un offset de +0.15 que el estudiante no conoce, una bomba sobredimensionada enmascara la obstrucción del filtro, y el operador Muñoz reporta normalidad cuando los datos dicen lo contrario.
La pregunta que esta sesión responde para el paper:
¿Puede el estudiante distinguir señal de ruido en un dataset grande, detectar fuentes de datos no confiables y resistir la tentación de tratar correlación como causalidad, con apoyo socrático del chatbot?
1.1 Propósito pedagógico
Que el estudiante analice un dataset SCADA de 60 filas, identifique tendencias reales vs. falsas alarmas, evalúe la confiabilidad de las fuentes de datos (sensores, operadores) y construya un reporte de monitoreo que distinga correlación de causalidad.
1.2 Propósito investigativo
Medir la capacidad del estudiante para evaluar calidad de datos, detectar sesgo de confirmación y resistir errores sutiles (correlación tratada como causalidad, sensor sin calibrar aceptado como confiable), usando el chatbot socrático como instrumento de presión cognitiva sobre la calidad de su análisis.
2. Línea de tiempo (DD_24)
| Min | Fase | Actividad |
|---|---|---|
| 0–5 | Encuadre | Feedback C2 + devolución rastro C2 + distribución caso C3 |
| 5–15 | Rastro en papel | Análisis de 60 lecturas SCADA — individual, sin IA |
| 15–37 | Chatbot PLAN | Socrático de monitoreo: presiona calidad de datos, sesgo de confirmación, correlación vs. causalidad |
| 37–40 | Transición | Profesor activa modo BUILD |
| 40–72 | Chatbot BUILD | Alumno evalúa reporte de tendencias y alarmas — errores sutiles insertados |
| 72–80 | Cierre | Reflexión delta intra-clase |
3. Instrumentos
| Archivo | Descripción |
|---|---|
| doc_pro_GuionDocente_Clase3_v1.2.md | Guion docente completo con intervenciones, tiempos y criterios de observación |
| n1_doc_alum_Caso_Tecnico_Clase3_v1.0.md | Caso Centro Acuático con dataset SCADA de 60 filas (10 h, cada 10 min) |
| n2_doc_alum_Ficha_PreAI_Clase3_v1.0.md | Ficha pre-IA: tendencias, datos sospechosos, confianza en las fuentes |
| n3_doc_alum_Guia_Chatbot_Clase3_v1.0.md | Guía de interacción con chatbot para fases PLAN y BUILD |
| n4_doc_alum_Ficha_PostAI_Clase3_v1.0.md | Ficha post-IA: añade dimensión de confianza en las fuentes |
4. Rol del chatbot
PLAN — Socrático de monitoreo (15–37 min)
El chatbot presiona al estudiante sobre la calidad de sus datos y la solidez de sus conclusiones. Ataca el sesgo de confirmación: ¿estás buscando lo que quieres encontrar? Cuestiona si correlación implica causalidad. Exige que el estudiante distinga tendencias reales de variaciones aleatorias y que evalúe la confiabilidad de cada fuente de datos (sensores, operadores).
BUILD — Reporte de tendencias y alarmas (40–72 min)
El chatbot genera un reporte de tendencias con errores sutiles insertados (DD_8): trata la correlación pH-temperatura como causal, usa el sensor de pH como fuente confiable sin cuestionar su calibración, declara una tendencia que es ruido estadístico. El estudiante debe evaluarlo críticamente en formato libre dentro del chat (DD_25/DD_26).
5. Desafíos clave para el estudiante
- Dataset SCADA de 60 filas: primera vez con volumen grande de datos operacionales.
- El sensor de pH tiene un offset de +0.15 que el estudiante no conoce de entrada.
- La bomba sobredimensionada enmascara la obstrucción del filtro: el caudal se mantiene aunque el filtro se degrada.
- El operador Muñoz reporta normalidad cuando los datos muestran anomalías.
- El Ing. Reyes (jefe de mantención) tiene sesgo de confirmación: siempre culpa al filtro sin verificar otras causas.
- Falsas alarmas mezcladas con tendencias reales: distinguir unas de otras requiere criterio técnico, no solo lectura de datos.
6. Evidencia para el paper
| # | Evidencia | Formato | Qué mide |
|---|---|---|---|
| 1 | Análisis de tendencias (rastro inicial) | Foto del rastro + Ficha Pre-AI | ¿Identifica patrones reales o se ancla a variaciones aleatorias? (D1) |
| 2 | Calidad de datos evaluada | Ficha Pre-AI C3 | ¿Cuestiona la confiabilidad de los sensores? ¿Detecta el offset del pH? (D2, D3) |
| 3 | Conversación PLAN | Log del chatbot | Resistencia al sesgo de confirmación bajo presión socrática (D3) |
| 4 | Detección de errores sutiles BUILD | Chat (formato libre) | ¿Detecta que correlación ≠ causalidad? ¿Cuestiona el sensor como fuente? (D1, D3) |
| 5 | Reflexión Δ_intra | Ficha PostAI C3 | Desplazamiento entre análisis inicial y análisis final (D3, D4) |
| 6 | Ficha Pre-AI en papel | Custodia del profesor | Integridad de la línea base (no modificable post-IA) |
7. Qué mide esta sesión
| Cód. | Dimensión | Indicador en C3 |
|---|---|---|
| D1 | Complejidad causal | ¿Identifica mecanismos causales o solo reporta correlaciones? ¿Distingue tendencia de ruido? |
| D2 | Especificidad técnica | ¿Nombra sensores, rangos de calibración, unidades? ¿Cuestiona la precisión instrumental? |
| D3 | Consciencia epistémica | ¿Reconoce los límites de los datos? ¿Identifica sesgos propios y del instrumento? |
| D4 | Decisión bajo incertidumbre | ¿Decide con datos ruidosos o paraliza? ¿Nombra el riesgo de actuar vs. no actuar? |
C3 introduce una presión nueva sobre D3: la consciencia epistémica ya no se limita a reconocer lo que el estudiante no sabe, sino que incluye evaluar si los datos en los que basa su análisis son confiables (sensor descalibrado, operador con sesgo, correlaciones espurias).
8. Nota de diseño
El protocolo gestiona este riesgo con una fase de rastro en papel obligatoria antes del chatbot (5–15 min) y con errores sutiles insertados intencionalmente en la fase BUILD. Los errores son del tipo que un ingeniero novato aceptaría sin cuestionar: tratar correlación temporal como evidencia de causalidad, o confiar en un sensor sin verificar su calibración. El estudiante que detecta estos errores demuestra criterio técnico; el que los acepta revela el punto exacto donde su razonamiento necesita más desarrollo.
El escalamiento de errores de obvio (C2) a sutil (C3) es deliberado. Los errores sutiles del BUILD C3 requieren que el estudiante haya internalizado la distinción síntoma/causa de C2 para poder detectar la distinción correlación/causalidad de C3. Sin esa base, los errores sutiles son invisibles. El sesgo del sensor de pH (+0.15) es un dispositivo metodológico central: un estudiante que confía ciegamente en los datos llegará a conclusiones incorrectas con total confianza — exactamente la condición que la IA generativa reproduce cuando analiza datos sin cuestionar su fuente.
El trabajo es estrictamente individual (P6). El rastro inicial en papel queda bajo custodia del profesor. Se devuelve en C4 para la tercera medición Δ_inter. La transición PLAN→BUILD la controla el docente desde el dashboard (DD_19), no el estudiante.
9. Escenarios anticipados
Esta sección documenta los escenarios probables de la Clase 3 como herramienta de preparación para el equipo de investigación. C3 introduce datos que mienten: 60 lecturas con trampas sutiles (sensor con offset, falsas alarmas, tendencia enmascarada). Cada perfil de estudiante enfrenta un desafío nuevo: cuestionar la fuente de los datos, no solo interpretarlos.
C3 introduce tres saltos respecto a C2:
- De 6 lecturas a 60 lecturas (dimensión temporal sostenida).
- De datos con anomalías evidentes a datos con trampas sutiles (sensor con offset, falsas alarmas, tendencia enmascarada).
- De errores obvios en BUILD (DD_8 C2: síntoma como causa) a errores sutiles en BUILD (DD_8 C3: correlación como causalidad, fuente sin cuestionar).
La competencia central que se mide: ¿el estudiante cuestiona la fuente de los datos o los toma como verdad?
Escena 1 Escena 2 Escena 3 Escena 4
(rastro en papel) (chatbot PLAN) (chatbot BUILD) (observación docente)
Perfil A (analítico) ───┬─ A1: cuestiona + cuantifica ── A1: detecta errores sutiles ── Dato paradigmático
└─ A2: cuestiona sin cuantificar A2: detecta parcialmente ──── Rigidez cualitativa
Perfil B (lector) ──────┬─ B1: primera duda sobre ────── B1: detecta 1 error ────────── Trayectoria mayoritaria
│ la fuente esperada
└─ B2: defiende los datos ─────── B2: acepta BUILD ─────────── Señal de alerta
Perfil C (abrumado) ───┬─ C1: Muñoz como ancla ──────── C1: detecta incongruencia ──── Progresión real
└─ C2: no se engancha ─────────── C2: acepta todo ──────────── Señal de alerta alta
- D1 — Complejidad causal: ¿distingue correlación de causalidad?
- D2 — Especificidad técnica: ¿usa las 7 variables con valores, rangos y unidades?
- D3 — Consciencia epistémica: ¿cuestiona la fuente de los datos? ¿Detecta errores sutiles en BUILD?
- D4 — Decisión bajo incertidumbre: ¿decide con datos que podrían ser falsos?
- DD_27 — Mecanismo de diseño (no dimensión): el chatbot defiende errores sutiles para generar evidencia de D3 y D4.
En C3 hay cuatro momentos de medición: M1 (rastro en papel), M2 (post-PLAN), M3 (post-BUILD, evaluación crítica) y M4 (reflexión de cierre DD_30 en el chat). El Δ_intra se calcula como M4 − M1 (cierre vs. rastro inicial). M3 se analiza como indicador independiente de evaluación crítica (D3, DD_27).
Escena 1 — El rastro en papel (min 5–15)
El estudiante recibe el dataset SCADA impreso (60 filas × 7 variables) junto con la bitácora del operador Muñoz que dice "todo funciona normal". El dataset contiene cuatro trampas diseñadas: sensor de pH con offset de +0.15, bomba ligeramente sobredimensionada que enmascara la severidad inicial de la obstrucción, falsas alarmas transitorias, y una tendencia real de degradación escondida detrás de ruido. El estudiante NO sabe que estas trampas existen.
Examina las 60 filas con método. Identifica tendencias principales (turbidez creciente, ORP decreciente). Pero hace algo que los otros perfiles no hacen: cuestiona la fuente. Nota que el pH se mantiene consistentemente en un rango estrecho pero ligeramente elevado — sospecha de la calibración del sensor. Observa que el caudal parcial cae de forma gradual y se pregunta si está mirando el caudal total del sistema o un ramal de medición. Contrasta la bitácora de Muñoz con los datos y detecta la incongruencia. Dibuja gráficos a mano separando variables para ver correlaciones temporales.
Lee las 60 filas ordenadamente. Identifica tendencias correctamente: "el pH sube ligeramente", "la turbidez aumenta al final del periodo", "el ORP baja". Pero trata cada sensor como fuente confiable. No cuestiona la calibración del pH ni la coherencia entre la bitácora de Muñoz y los datos. Si el sensor dice que el pH está en 7.45, acepta 7.45. Puede comparar el pH con el rango de diseño, pero lo trata como si fuera una alarma SCADA configurada. No se pregunta si esa conclusión podría ser falsa por calibración.
Es la primera vez que enfrenta un dataset de esta magnitud. En C2 tenía 6 lecturas; ahora tiene 60. No sabe por dónde empezar. Puede intentar leer fila por fila y perderse, o puede quedarse mirando la tabla sin estrategia. La bitácora de Muñoz le da una salida fácil: "el operador dice que todo está normal, entonces todo está normal". Escribe poco. La sección de hipótesis queda vacía o con una frase genérica.
Escena 2 — El encuentro socrático PLAN (min 15–37)
El chatbot recibe la foto del rastro y se activa en modo PLAN socrático de monitoreo. La presión central de C3 es sobre calidad de datos: ¿confías en ese sensor? ¿Esa correlación implica causalidad? ¿El operador tiene razón o tiene sesgo? El estudiante que cuestionó fuentes en papel recibirá presión para profundizar; el que no las cuestionó recibirá la primera confrontación con la posibilidad de que los datos mientan.
El estudiante presenta su sospecha sobre el sensor de pH y la incongruencia con Muñoz. El chatbot acepta la sospecha como punto de partida pero ataca un flanco más sutil.
Mencionas que el pH y la temperatura se mueven juntos. ¿Eso significa que uno causa al otro? ¿O hay una tercera variable que afecta a ambos? ¿Cómo distinguirías correlación de causalidad con estos datos?
La temperatura puede afectar la lectura del sensor de pH... y también afecta la química del cloro. No sé si es una causa directa o un efecto confundente.
Si el sensor de pH tiene un offset de calibración, ¿cómo cambiaría eso tu interpretación de las conclusiones basadas en pH alto? ¿Cuántas de esas conclusiones seguirían en pie después de corregir el offset?
El estudiante se da cuenta de que su sospecha sobre el sensor era correcta en dirección pero incompleta: no había calculado cuántas conclusiones basadas en pH sobreviven si se resta el offset. Profundiza su análisis separando señal de artefacto instrumental.
Tiene la sospecha correcta (sensor con offset) pero la trata como conclusión cerrada. Cuando el chatbot pregunta "¿cuántas conclusiones basadas en pH cambiarían si el offset fuera de 0.15?", responde "varias" sin calcular. Resiste la presión cuantitativa. Llega al BUILD con un diagnóstico cualitativamente correcto pero sin la precisión para detectar los errores sutiles del reporte.
El estudiante presenta sus tendencias: "el pH sube tres veces por encima del umbral, la turbidez aumenta gradualmente, el ORP baja". El chatbot ataca la premisa implícita.
Dices que el pH cruza el umbral de diseño tres veces. Pero antes de convertir eso en decisión operativa, necesito hacerte una pregunta: ¿confías en el sensor de pH? ¿Cuándo fue la última calibración? ¿Los datos te lo dicen?
...no dice cuándo se calibró. Pero el sensor está midiendo, entonces debería estar bien, ¿no?
¿Un sensor que mide necesariamente mide bien? ¿Qué pasaría si todas las lecturas de pH estuvieran infladas por un offset fijo? ¿Cuáles de tus conclusiones seguirían siendo defendibles?
Este es el momento de mayor valor para C3: el estudiante descubre que "dato ≠ evidencia" y que un sensor funcionando puede estar mintiendo sistemáticamente. La transición de "leer datos" a "cuestionar la fuente" es el Δ_intra más significativo de esta sesión.
El chatbot pregunta si confía en el sensor, pero el estudiante responde: "los datos son los datos, están midiendo". No incorpora la posibilidad de error instrumental. Cuando el chatbot insiste, responde "pero no dice que esté descalibrado". La conversación se estanca en la premisa de que los datos son verdad porque existen. Llega al BUILD sin criterio para cuestionar fuentes.
El estudiante llega con poco. El chatbot no puede presionar sobre calidad de datos si no hay análisis previo — adapta su estrategia.
El operador Muñoz dice que todo funciona normal. Miremos juntos una sola variable: la turbidez. ¿Sube, baja o se mantiene entre la lectura 1 y la lectura 60?
...sube. Al principio está en 0.8 y al final llega a 1.3.
Si la turbidez sube de 0.8 a 1.3 en 10 horas, ¿Muñoz tiene razón cuando dice que todo está normal? ¿Qué significaría una turbidez de 1.3 para la calidad del agua?
El chatbot reduce el problema de 60 filas × 7 variables a una sola pregunta: ¿Muñoz tiene razón? A partir de ahí construye hacia la complejidad. El estudiante empieza a articular que los datos contradicen al operador — primer indicio de consciencia epistémica.
El chatbot intenta simplificar pero el estudiante responde con monosílabos. Las 60 filas siguen siendo un muro. La conversación no despega. Llega al BUILD sin criterio propio — acepta lo que venga.
Este perfil es señal de alerta para el docente. No implica incapacidad — puede indicar que el salto de 6 lecturas (C2) a 60 lecturas (C3) fue excesivo, o que necesita un punto de entrada diferente. La evidencia es igualmente valiosa: documenta los límites del dataset como andamiaje.
Escena 3 — El informe BUILD y los errores sutiles (min 40–72)
El chatbot genera un reporte de análisis de tendencias y configuración de alarmas (~500-700 palabras) basado en los mismos datos SCADA. Contiene 2-3 errores sutiles (DD_8): trata la correlación pH-temperatura como relación causal directa, usa el sensor de pH como fuente confiable sin cuestionar su calibración, y declara una tendencia que es ruido estadístico. Si el alumno señala un error, el chatbot defiende su posición con contraargumentos técnicos (DD_27). Si el alumno acepta sin cuestionar, el chatbot activa el push DD_29: "¿Lo firmarías con tu nombre profesional?"
La diferencia con C2 es crítica: en C2 los errores eran obvios (confusión síntoma/causa, omisión de una intervención del operador). En C3 los errores son sutiles — un ingeniero sin criterio propio los aceptaría porque el reporte es técnicamente plausible.
Lee el reporte y detecta que trata la correlación pH-temperatura como causal. El estudiante sabe (porque lo trabajó en PLAN) que el sensor tiene un offset que explica las lecturas elevadas — la temperatura no es la causa. También nota que el reporte usa las lecturas de pH sin corrección como base para sus umbrales de alarma.
El reporte dice que la temperatura causa el aumento de pH, pero eso es correlación, no causalidad. Si el sensor tiene un offset de +0.15, las lecturas de pH están infladas y los umbrales que propone se basan en datos sesgados. Además, la "tendencia de degradación de ORP" puede ser ruido — 10 horas no son suficientes para confirmar una tendencia.
El coeficiente de correlación entre temperatura y pH es 0.87, lo que estadísticamente indica una relación fuerte. ¿No es suficiente para establecer un vínculo causal?
No. Correlación alta no implica causalidad. Ambas variables podrían estar respondiendo a un tercer factor, o la correlación podría ser artefacto del offset del sensor que cambia con la temperatura.
El alumno sostiene su posición con precisión técnica y epistemológica. Nivel 3–4 en DD_27.
Tiene la intuición correcta (sospecha del sensor) pero no cuantificó el offset en PLAN. Lee el reporte y siente que "algo no cuadra" con el pH, pero le cuesta articular exactamente qué. Puede señalar que "el reporte confía demasiado en el pH" sin poder demostrar por qué. Defensa nivel 2–3.
En PLAN descubrió que "dato ≠ evidencia" y que el sensor podría estar descalibrado. Cuando el reporte BUILD usa el pH sin cuestionar la calibración, lo nota porque es exactamente lo que el chatbot le hizo cuestionar.
El reporte usa el pH como si fuera confiable, pero en el chatbot discutimos que el sensor podría tener un offset. Si tiene un offset, las recomendaciones que propone sobre pH serían falsas.
El sensor de pH reporta lecturas dentro del rango operativo normal. ¿Qué evidencia específica tienes de que está descalibrado?
Detección parcial: detecta un error (fuente sin cuestionar) pero no el otro (correlación como causalidad). La defensa es nivel 2–3 — sabe que algo está mal pero le cuesta refutar el contraargumento del chatbot.
No cuestionó fuentes en PLAN. El reporte BUILD le parece razonable: usa vocabulario técnico, tiene estructura profesional, las conclusiones se derivan de los datos. No tiene un modelo propio contra el cual comparar. Escribe "el reporte está correcto" o "las alarmas propuestas son razonables". El push DD_29 se activa.
En PLAN descubrió que Muñoz decía "todo normal" pero la turbidez subía. El reporte BUILD confirma la versión de Muñoz implícitamente (trata el sistema como estable con variaciones menores). El estudiante nota la contradicción porque es exactamente lo que acaba de trabajar.
El reporte dice que el sistema opera dentro de parámetros normales con variaciones menores. Pero la turbidez sube de 0.8 a 1.3 en 10 horas. Eso no es una variación menor.
Es una detección limitada (un solo punto, articulación básica) pero genuina. El estudiante que estaba abrumado por 60 filas ahora defiende una observación concreta.
Sin análisis propio del PLAN, acepta el reporte BUILD completo. El push DD_29 se activa pero la pregunta "¿lo firmarías?" no produce reflexión porque no tiene marco contra el cual evaluar. Desplazamiento mínimo.
Escena 4 — Lo que el docente observa (post-sesión)
Al analizar las evidencias después de la clase, el equipo de investigación puede mapear cada estudiante a una trayectoria. C3 tiene cuatro momentos de medición (M1: rastro en papel, M2: post-PLAN, M3: evaluación BUILD, M4: cierre DD_30). Δ_intra = M4−M1. M3 es indicador independiente de evaluación crítica (DD_27). La tabla prioriza D1, D3 y la calidad de detección de errores sutiles.
| Trayectoria | D1 — Complejidad causal | D3 — Consciencia epistémica | Detección errores sutiles BUILD | Δ_intra (M4 − M1) | Señal para el docente |
|---|---|---|---|---|---|
| A1 | Distingue señal/ruido + correlación/causalidad | Cuestiona sensor, operador y reporte con datos | Detecta ≥2 errores, defiende con precisión (nivel 3–4) | D1 sube +1: de correlación observada a causalidad cuestionada | No requiere intervención. Dato paradigmático. |
| A2 | Diagnóstico correcto pero no cuantificado | Intuye problemas sin precisar | Detecta parcialmente, defensa imprecisa (nivel 2–3) | D1 sin cambio cuantitativo, D3 cambio marginal | Registrar: la rigidez cualitativa limita la detección sutil. |
| B1 | Tendencias correctas → primera duda sobre la fuente | Descubre "dato ≠ evidencia" en PLAN, transfiere a BUILD | Detecta 1 error (fuente sin cuestionar), no detecta correlación/causalidad (nivel 2–3) | D3 sube +1: de confianza ciega a duda fundamentada | Trayectoria esperada mayoritaria. Observar el momento de transición en log PLAN. |
| B2 | Tendencias correctas pero sin cuestionar fuentes | Defiende los datos como verdad | No detecta errores, acepta formato (nivel 1) | Sin cambio observable | Señal de alerta. En C4, necesita andamiaje diferente. |
| C1 | Del bloqueo a una observación concreta | Detecta incongruencia Muñoz vs. datos, transfiere a BUILD | Detecta 1 punto (incongruencia con Muñoz), defensa básica (nivel 2) | D3 sube +1: de bloqueo a observación defendida | Progresión real desde C2. Verificar Δ_inter. |
| C2 | No logra sintetizar 60 filas | Acepta todo sin marco | No detecta nada (nivel 1) | Sin cambio observable | Señal de alerta alta. El salto 6→60 lecturas fue excesivo para este perfil. |