PyE — Plataforma de estudio

Para qué sirve este tema

Decidir si dos grupos (hombres vs mujeres, antes vs después, marca A vs marca B...) se diferencian en su media o en su variabilidad. Es la herramienta estrella de la inferencia aplicada: casi cualquier estudio comparativo cae aquí.

Cuándo aplicarlo (señales del enunciado)

Aparecen dos grupos o dos mediciones: vas a este tema.
"Los mismos individuos medidos dos veces" / "antes y después" / "con A y con B en el mismo sujeto" → muestras pareadas (trabajas con $D = X_{1} - X_{2}$ , una sola muestra).
"Grupo de chicos vs grupo de chicas", tamaños distintos, sujetos distintos → muestras independientes.
"¿Tienen la misma dispersión / varianza?" → contraste F.
"¿Tienen la misma media?" o "¿la media de A es mayor que la de B en más de k?" → contraste t.
Si te piden ambos: primero F, luego t. El F te dice si en la t asumes varianzas iguales o distintas (Welch).
Antes de F o t siempre verifica normalidad con Kolmogorov-Smirnov (KS).

Conceptos clave

Independientes vs pareadas

Idea: Pareadas = mismo individuo dos veces (correlación interna). Independientes = dos grupos sin relación entre sujetos.
Regla: si puedes restar fila a fila con sentido físico, son pareadas.
Consecuencia: pareadas se resuelven como una muestra única de $D$ ; independientes requieren F + t.

Contraste F de varianzas (muestras independientes)

Idea: comparar $σ_{1}^{2}$ y $σ_{2}^{2}$ vía el cociente de cuasivarianzas muestrales.
Fórmula clave: $F = \frac{s _{1}^{2}}{s _{2}^{2}} \sim F_{n_{1} - 1, n_{2} - 1} bajo H_{0}$
Cuándo se usa: ambas poblaciones normales, muestras independientes. Truco: pon en el numerador la muestra que en $H_{1}$ "debe" tener mayor varianza, así $H_{1}$ queda como $> 1$ y el contraste es unilateral derecho.

Contraste t de medias, varianzas iguales

Idea: si el F no rechaza, usamos la cuasivarianza ponderada $s_{p}^{2}$ .
Fórmula clave: $t = \frac{( X ˉ _{1} - X ˉ _{2} ) - Δ _{0}}{s _{p} \frac{1}{n _{1}} + \frac{1}{n _{2}}} \sim t_{n_{1} + n_{2} - 2}$ con $s_{p}^{2} = \frac{( n _{1} - 1 ) s _{1}^{2} + ( n _{2} - 1 ) s _{2}^{2}}{n _{1} + n _{2} - 2}$ .
Cuándo se usa: normalidad + varianzas iguales (no se rechaza el F).

Contraste t de Welch, varianzas distintas

Idea: si el F sí rechaza, no podemos juntar varianzas.
Fórmula clave: $t = \frac{( X ˉ _{1} - X ˉ _{2} ) - Δ _{0}}{s _{1}^{2} / n _{1} + s _{2}^{2} / n _{2}}$ con grados de libertad de Welch (Statgraphics los calcula).
Cuándo se usa: normalidad pero varianzas distintas. En Statgraphics marcas la casilla "unequal variances".

t para muestras pareadas

Idea: reduces el problema a una sola muestra de diferencias $D_{i} = X_{1 i} - X_{2 i}$ y aplicas la t de una muestra.
Fórmula clave: $T = \frac{D ˉ - μ _{D, 0}}{s _{D} / n} \sim t_{n - 1}$
IC: $\overset{ˉ}{D} \pm t_{n - 1, α /2} \cdot s_{D} / n$ .
Cuándo se usa: mismos individuos, dos mediciones. Verifica normalidad de $D$ , no de cada muestra por separado.

p-valor y decisión

Regla universal: si $p -valor < α$ → rechazas $H_{0}$ . Si $\geq α$ → no rechazas.
En contrastes unilaterales, Statgraphics suele dar el p-valor bilateral; divide entre 2 si la dirección coincide con $H_{1}$ .

Plantilla de resolución

Identifica el tipo de muestras: pareadas vs independientes.
Plantea $H_{0}$ y $H_{1}$ con cuidado de la dirección (¿bilateral o unilateral? ¿qué grupo en numerador?).
Verifica normalidad con KS en cada muestra (independientes) o en $D$ (pareadas). Compara $p$ con $α$ .
Si son independientes y piden comparar medias: haz primero el contraste F de varianzas. Decide si asumes varianzas iguales o no.
Aplica el contraste t adecuado (clásico, Welch o pareado) leyendo estadístico y $p$ -valor en Statgraphics.
Decide comparando $p$ -valor con $α$ y escribe la conclusión en lenguaje del enunciado.
Si te piden IC: usa la misma estructura $estimador \pm t_{g l, α /2} \cdot ES$ . Para decidir si un valor $k$ es plausible, comprueba si $k$ está dentro del IC.

Mini-ejemplo paso a paso

Se comparan los tiempos (s) de dos métodos de entrenamiento, A y B, en grupos distintos de atletas. $n_{A} = 12$ , $\overset{x}{ˉ}_{A} = 14.8$ , $s_{A} = 1.2$ . $n_{B} = 10$ , $\overset{x}{ˉ}_{B} = 13.5$ , $s_{B} = 0.6$ . ¿Es la media de A mayor que la de B en más de 1 segundo? $α = 0.05$ .

Paso 1: muestras independientes (atletas distintos).

Paso 2: $H_{0} : μ_{A} - μ_{B} \leq 1$ vs $H_{1} : μ_{A} - μ_{B} > 1$ .

Paso 3: KS en cada muestra → $p$ -valores $0.6$ y $0.4$ , ambos $> 0.05$ : aceptamos normalidad.

Paso 4 (F): $F = s_{A}^{2} / s_{B}^{2} = 1.44/0.36 = 4$ . Con $F_{11, 9}$ , $p$ -valor unilateral $\approx 0.02 < 0.05$ : rechazamos varianzas iguales → usamos Welch.

Paso 5 (t Welch): $t = \frac{( 14.8 - 13.5 ) - 1}{1.44/12 + 0.36/10} = \frac{0.3}{0.156} \approx 0.76$ Con gl de Welch $\approx 17$ , $p$ -valor unilateral $\approx 0.23 > 0.05$ .

Paso 6: No se rechaza $H_{0}$ . No hay evidencia para afirmar que A supere a B en más de 1 s.

Errores típicos

Tratar muestras pareadas como independientes (o al revés): siempre lees el enunciado para ver si los datos están emparejados.
Saltarse la verificación de normalidad antes de F y t.
En pareadas, hacer KS sobre cada columna en vez de sobre $D$ .
Equivocar la dirección en el F: mete en el numerador la varianza que crees mayor.
Olvidar dividir entre 2 el p-valor cuando el contraste es unilateral y el software te lo da bilateral.
Confundir $α = 0.04$ con confianza $96%$ (no $94%$ ): siempre $1 - α$ .
En IC, responder solo "sí/no" sin comprobar la pertenencia del valor al intervalo.

Resumen en una tarjeta

Pareadas → una muestra de $D$ . Independientes → F y luego t.
F decide si la t es "varianzas iguales" (no rechaza) o "Welch" (rechaza).
Antes de todo: KS para normalidad, comparando $p$ -valor con $α$ .
Decisión: $p < α$ → rechazo $H_{0}$ ; valor dentro del IC → es plausible.
En Statgraphics: "Compare Two Samples" para independientes, "Paired-Sample Comparison" para pareadas. Lee F, p, IC y listo.

Comparación de dos muestras