Como ejemplo se estima un intervalo de confianza para la el tiempo de carrera de los participantes en la carrera La Luz 2022, para una muestra de n=100 competidores
x=sample(CarreraLuz22$timerun/60, 100)
t.test(x,conf.level = 0.95)$conf.int
[1] 63.26491 69.73875
attr(,"conf.level")
[1] 0.95
Intervalo de confianza para una proporción
Como ejemplo se estima un intervalo de confianza para una muestra de tamaño 1000 para la proporción de fallecidos por covid en el Valle
t1=table(CarreraLuz22$sex)
t1
Hombre Mujer
1178 744
prop.test(t1[1],length(CarreraLuz22$sex), conf.level = 0.95)$conf.int
[1] 0.5906603 0.6346903
attr(,"conf.level")
[1] 0.95
Para calcular el intervalo de confianza para una varianza, he creado la siguiente función, dado que no está disponible en R
# Parámetros de entrada : x variable
# a alpha (confianza del 95% : a=0.05)
ic.var=function(x,a){
n=length(x)
per.chi2=qchisq(c(1-a/2, a/2), n-1) # Percentiles chi-cuadrado para 95% de confianza
icvar=(n-1)*var(x)/per.chi2
return(icvar)
}
x1=sample(CarreraLuz22$edad, 200)
ic.var(x1, 0.05)
[1] 93.1839 138.1753
Intervalo de confianza para la comparación de varianzas
xM=sample(CarreraLuz22M$timerun/60, 100)
xF=sample(CarreraLuz22F$timerun/60, 100)
var.test(xM, xF)$conf.int
[1] 0.5400836 1.1929858
attr(,"conf.level")
[1] 0.95
Como el intervalo contiene el valor de uno, nos indica que la varianza de los tiempos masculinos y la varioanza de los tiempos femeninos son iguales
Intervalo de confianza para la comparación de medias grupos independientes, suponiendo varianzas iguales
Como ejemplo se toman dos muestras para comparar el tiempo empleado por los atletas mujeres (\(xF\)) y hombres (\(xM\)). Se emplea una muestra de tamaño \(n=200\) para cada grupo
xM=sample(CarreraLuz22M$timerun/60, 100)
xF=sample(CarreraLuz22F$timerun/60, 100)
t.test(xM, xF, # Variables a comparar
mu = 0, # Por defecto se toma el valor de cero
paired = FALSE, # Los grupos son independientes (no pareados)
var.equal = TRUE, # Las varianzas se asumen iguales
conf.level = 0.95 )$conf.int # Nivel de confianza
[1] -12.447827 -6.168506
attr(,"conf.level")
[1] 0.95
El valor \((-,-)\) indica que la diferencia de medias siempre es negativa indicando que \(\mu_{_{M}} < \mu_{_{F}}\)
Para el ejemplo se toma una muestra de tamaño 100 y se compara las proporciones de atletas mujeres vs proporción atletas hombre en la categoría abierta
library(tidyverse)
t1=CarreraLuz22F$categoria %>%
sample(.,100) %>%
table()
p1=t1[2]/sum(t1)
t2=CarreraLuz22M$categoria %>%
sample(.,100) %>%
table()
p2=t2[2]/sum(t2)
prop.test(c(p1,p2),c(100,100), conf.level = 0.95)$conf.int
[1] -0.02453141 0.01813141
attr(,"conf.level")
[1] 0.95
Como el resultado obtenido contiene a cero, lo que indica que las proporciones son similares. Para concluir que las proporciones se asumen como iguales debemos realizar una prueba de hipótesis para diferencia de proporciones.