Para qué sirve este tema
En el examen de PyE de la UPM no te piden calcular nada complicado a mano: el ordenador (Statgraphics) lo hace por ti. Tu trabajo es saber qué menú abrir, qué número de la salida leer, y cómo interpretarlo. Este tema es transversal: aparece mezclado con descriptiva, ajuste de distribuciones, comparación de muestras y regresión.
Cuándo aplicarlo (señales del enunciado)
- "Calcular percentil / media / cuartiles / box-plot" → Descripción de Datos → Resumen Estadístico / Gráfico de Caja y Bigotes.
- "Ajustar un modelo de probabilidad / contrastar bondad de ajuste" → Descripción → Ajuste de Distribuciones.
- "¿Es razonable suponer normalidad?" → mismo menú, leer el p-valor de Kolmogorov-Smirnov (o Shapiro-Wilk).
- "Comparar dos muestras independientes" (chicos vs chicas, tratamiento A vs B) → Comparación de Muestras → Dos Muestras → Muestras Independientes.
- "Antes/después, el mismo individuo medido dos veces" → Muestras Pareadas (ojo, no independientes).
- "Relación entre dos variables continuas / predecir Y a partir de X" → Relacionar → Regresión Simple.
- "¿Tienen la misma varianza?" → contraste dentro de la comparación de dos muestras.
- "Al tanto" → siempre comparas p-valor con : si rechazas .
Conceptos clave
Ajuste de distribución (Bondad de ajuste / K-S)
- Idea: decides qué distribución teórica (, , , exponencial...) describe los datos.
- Salida clave: en Ajuste de Distribuciones miras el p-valor de la prueba (o K-S si es continua). Decisión: si ⇒ no se rechaza, el modelo es válido.
- Estimación de parámetros: Statgraphics te da . A mano usa método de momentos: .
- Pista rápida discreta: si → Poisson; si → Binomial; si → Binomial Negativa.
- Cuándo se usa: cuando la variable es claramente discreta con fijo de ensayos, o cuando dudas entre dos modelos.
Comparación de dos muestras independientes
- Idea: ver si dos poblaciones tienen la misma media o varianza.
- Procedimiento Statgraphics: Comparación → Dos Muestras → Independientes.
- Pasos obligatorios:
1. Normalidad de cada muestra (K-S, ).
2. Contraste de varianzas: . Si ⇒ varianzas distintas.
3. Contraste de medias (con o sin igualdad de varianzas según el paso 2).
- Fórmula del estadístico (varianzas iguales): .
- Cuándo se usa: dos grupos distintos, sin emparejamiento individuo-a-individuo.
Comparación de muestras pareadas
- Idea: el mismo sujeto medido dos veces (antes/después, con/sin bañador). Trabajas con la diferencia .
- Fórmula clave: .
- Normalidad: hay que verificarla sobre , no sobre las muestras originales.
- Cuándo se usa: enunciado dice "los mismos", "cada nadador", "antes y después".
Regresión lineal simple
- Idea: modelar .
- Salida clave: coeficientes (), p-valor de cada uno, y p-valor del modelo (ANOVA).
- Validez: del modelo y alto. Revisar gráfico de residuos (aleatoriedad).
- Cuándo se usa: "predecir", "relacionar", "recta de ajuste".
Descriptiva y atípicos
- Idea: percentiles, media, mediana, IQR, detección de outliers.
- Regla de atípicos: fuera de .
- Salida: Resumen Estadístico + Gráfico de Caja y Bigotes (los puntos fuera del bigote son atípicos).
Plantilla de resolución
- Lee el enunciado y detecta el tipo de problema (descriptiva / ajuste / comparación / regresión).
- Identifica las hipótesis previas que hay que verificar (normalidad, igualdad de varianzas, independencia).
- Abre el menú correcto en Statgraphics y selecciona la variable.
- Apunta los números relevantes de la salida: medias, varianzas, estadísticos, p-valores, IC.
- Plantea y con notación matemática limpia.
- Compara p-valor con : ⇒ rechazo .
- Concluye en lenguaje del problema (no "rechazo " seco, sino "el tiempo medio masculino es menor").
Mini-ejemplo paso a paso
Enunciado: tenemos los tiempos de reacción (ms) de 20 hombres y 20 mujeres. ¿Hay diferencia de medias? .
Paso 1: dos muestras independientes (hombres vs mujeres distintos).
Paso 2: normalidad. Statgraphics → Ajuste de Distribuciones en cada grupo. Obtengo y . Ambos ⇒ acepto normalidad.
Paso 3: igualdad de varianzas. Comparación → Dos Muestras Indep. → Comparación de desviaciones. Statgraphics da , ⇒ varianzas iguales.
Paso 4: contraste de medias con varianzas iguales:
Salida: , .
Paso 5: ⇒ rechazo .
Conclusión: hay evidencia de que el tiempo de reacción medio difiere entre hombres y mujeres al .
Errores típicos
- Olvidar verificar normalidad antes de usar o (te quitan puntos seguro).
- Confundir muestras pareadas con independientes: si el sujeto es el mismo, son pareadas.
- Usar el contraste "varianzas iguales" sin haber hecho antes el contraste .
- Leer mal la cola: si , Statgraphics te da p-valor de dos colas; divídelo por 2 (con cuidado del signo del estadístico).
- Concluir "se acepta " en lugar de "no se rechaza " (matiz importante).
- Olvidar el nivel de confianza correcto: si el IC es al , no al .
- Reportar el p-valor pero no comparar con explícitamente.
Resumen en una tarjeta
- Menú correcto = mitad del examen: descriptiva, ajuste, dos muestras, regresión.
- Regla de oro: ⇒ rechazo .
- Antes del va el , antes del va el K-S.
- Pareadas = mismo sujeto dos veces; independientes = dos grupos distintos.
- Concluye en palabras del enunciado, no solo en jerga estadística.