PyE
Tema 7 - Comparación de muestras

Comparación de dos muestras

Comparar dos poblaciones (medias y varianzas) usando contrastes F y t, distinguiendo si las muestras son independientes o pareadas.

Para qué sirve este tema

Decidir si dos grupos (hombres vs mujeres, antes vs después, marca A vs marca B...) se diferencian en su media o en su variabilidad. Es la herramienta estrella de la inferencia aplicada: casi cualquier estudio comparativo cae aquí.

Cuándo aplicarlo (señales del enunciado)

  • Aparecen dos grupos o dos mediciones: vas a este tema.
  • "Los mismos individuos medidos dos veces" / "antes y después" / "con A y con B en el mismo sujeto" → muestras pareadas (trabajas con , una sola muestra).
  • "Grupo de chicos vs grupo de chicas", tamaños distintos, sujetos distintos → muestras independientes.
  • "¿Tienen la misma dispersión / varianza?" → contraste F.
  • "¿Tienen la misma media?" o "¿la media de A es mayor que la de B en más de k?" → contraste t.
  • Si te piden ambos: primero F, luego t. El F te dice si en la t asumes varianzas iguales o distintas (Welch).
  • Antes de F o t siempre verifica normalidad con Kolmogorov-Smirnov (KS).

Conceptos clave

Independientes vs pareadas

  • Idea: Pareadas = mismo individuo dos veces (correlación interna). Independientes = dos grupos sin relación entre sujetos.
  • Regla: si puedes restar fila a fila con sentido físico, son pareadas.
  • Consecuencia: pareadas se resuelven como una muestra única de ; independientes requieren F + t.

Contraste F de varianzas (muestras independientes)

  • Idea: comparar y vía el cociente de cuasivarianzas muestrales.
  • Fórmula clave:
  • Cuándo se usa: ambas poblaciones normales, muestras independientes. Truco: pon en el numerador la muestra que en "debe" tener mayor varianza, así queda como y el contraste es unilateral derecho.

Contraste t de medias, varianzas iguales

  • Idea: si el F no rechaza, usamos la cuasivarianza ponderada .
  • Fórmula clave: con .
  • Cuándo se usa: normalidad + varianzas iguales (no se rechaza el F).

Contraste t de Welch, varianzas distintas

  • Idea: si el F rechaza, no podemos juntar varianzas.
  • Fórmula clave: con grados de libertad de Welch (Statgraphics los calcula).
  • Cuándo se usa: normalidad pero varianzas distintas. En Statgraphics marcas la casilla "unequal variances".

t para muestras pareadas

  • Idea: reduces el problema a una sola muestra de diferencias y aplicas la t de una muestra.
  • Fórmula clave:
  • IC: .
  • Cuándo se usa: mismos individuos, dos mediciones. Verifica normalidad de , no de cada muestra por separado.

p-valor y decisión

  • Regla universal: si → rechazas . Si → no rechazas.
  • En contrastes unilaterales, Statgraphics suele dar el p-valor bilateral; divide entre 2 si la dirección coincide con .

Plantilla de resolución

  1. Identifica el tipo de muestras: pareadas vs independientes.
  2. Plantea y con cuidado de la dirección (¿bilateral o unilateral? ¿qué grupo en numerador?).
  3. Verifica normalidad con KS en cada muestra (independientes) o en (pareadas). Compara con .
  4. Si son independientes y piden comparar medias: haz primero el contraste F de varianzas. Decide si asumes varianzas iguales o no.
  5. Aplica el contraste t adecuado (clásico, Welch o pareado) leyendo estadístico y -valor en Statgraphics.
  6. Decide comparando -valor con y escribe la conclusión en lenguaje del enunciado.
  7. Si te piden IC: usa la misma estructura . Para decidir si un valor es plausible, comprueba si está dentro del IC.

Mini-ejemplo paso a paso

Se comparan los tiempos (s) de dos métodos de entrenamiento, A y B, en grupos distintos de atletas. , , . , , . ¿Es la media de A mayor que la de B en más de 1 segundo? .

Paso 1: muestras independientes (atletas distintos).

Paso 2: vs .

Paso 3: KS en cada muestra → -valores y , ambos : aceptamos normalidad.

Paso 4 (F): . Con , -valor unilateral : rechazamos varianzas iguales → usamos Welch.

Paso 5 (t Welch): Con gl de Welch , -valor unilateral .

Paso 6: No se rechaza . No hay evidencia para afirmar que A supere a B en más de 1 s.

Errores típicos

  • Tratar muestras pareadas como independientes (o al revés): siempre lees el enunciado para ver si los datos están emparejados.
  • Saltarse la verificación de normalidad antes de F y t.
  • En pareadas, hacer KS sobre cada columna en vez de sobre .
  • Equivocar la dirección en el F: mete en el numerador la varianza que crees mayor.
  • Olvidar dividir entre 2 el p-valor cuando el contraste es unilateral y el software te lo da bilateral.
  • Confundir con confianza (no ): siempre .
  • En IC, responder solo "sí/no" sin comprobar la pertenencia del valor al intervalo.

Resumen en una tarjeta

  • Pareadas → una muestra de . Independientes → F y luego t.
  • F decide si la t es "varianzas iguales" (no rechaza) o "Welch" (rechaza).
  • Antes de todo: KS para normalidad, comparando -valor con .
  • Decisión: → rechazo ; valor dentro del IC → es plausible.
  • En Statgraphics: "Compare Two Samples" para independientes, "Paired-Sample Comparison" para pareadas. Lee F, p, IC y listo.

📺 Vídeos sugeridos

Búsquedas en YouTube de canales reales en español. Click → abre YouTube.

🧠 Pon en práctica

Problemas reales de examen que aplican este tema (de los más fáciles a los más complejos).