Las probabilidad se puede definir para eventos simples (\(A\), \(B\),…) o compuestos (\((A \cup B)\), \((A \cap B)\), \((B|A)\) ) que incluyen varios eventos. Dependiendo el tipo de evento puede tomar los siguientes nombres:



Tabla 2.1 Distribución de probabilidades

Figura 2.2 Diagrama de Venn



Probabilidad simple o marginal




Probabilidad conjunta




Probabilidad condicional


Definición

La probabilidad condicional de \(B\), dado \(A\), se denota como \(P(B|A)\), se define como:

\[P(B|A)=\dfrac{P(A \cap B)}{P(A)}\]

Siempre que \(P(A) > 0\)


\(P(B|A)\) se puede leer como :


El efecto de conocer la ocurrencia del evento \(A\) hace que el espacio muestral de referencia pase de ser \(S\) a solo \(A\). Ahora dentro de este nuevo espacio muestal de referencia se debe establecer la probabilidad de que ocurra \(B\)

De esta manera la probabilidad se expresa como la razón entre la probabilidad conjunta \(P(A \cap B)\) con la probabilidad de \(A\), \(P(A)\).



Ejemplo

Supongamos que se tiene la siguiente información escrita en una tabla de doble entrada o tabla cruzada que contiene dos eventos \(A\) y \(B\). En la siguiente tabla se representan los tres tipos de probabilidad :

Tabla2.2 Distribución frecuencias absolutas

Tabla 2.3 Frecuencias relativas



Probabilidades simples o marginales


  • \(P(A) =\dfrac{600}{900} = 0.6667\)

  • \(P(A') = A- P(A) = 1- \dfrac{600}{900} = 1 - 0.6667 = 0.3333\)

  • \(P(B) = \dfrac{500}{900} = 0.5556\)

  • \(P(B' = \dfrac{400}{900}) = 0.4444\)



Probabilidad conjunta


  • \(P(A \cap B) = \dfrac{460}{900} = 0.51111\)

  • \(P(A' \cap B) = \dfrac{40}{900} = 0.0444\)

  • \(P(A \cap B') = \dfrac{140}{900} = 0.1556\)

  • \(P(A' \cap B') = \dfrac{260}{900} = 2889\)



Esta información también se puede representar como un diagrama de árbol


Figura 2.3 Diagrama de árbol de probabilidades



O también como un diagrama de Venn:


Figura 2.4 Diagrama de Venn de probabilidades



Por despeje se pueden obtener la llanada regla de la multiplicación :


Definición: Regla de la multiplicación de eventos

La probabilidad de que ocurra A y B asociados a un experimento aleatorio es :

\(P(A \cap B) = P(A) P(B|A)\) o \(P(A \cap B) = P(B) P(A|B)\)

En el caso de los eventos A y B sean independientes entonces :

\[P(A \cap B) = P(A) P(B)\]



Eventos independientes


En el caso que se requiera evaluar si dos eventos son independientes o no, partiendo de la definición de probabilidad condicional se podría obtener la siguiente regla al despejar \(P(A \cap B\) de la ecuación para obtener : \(P(A \cap B) = P(A) * P(B|A)\). En caso de que la ocurrencia del evento \(A\) previamente al evento \(B\), no cambie su probabilidad, se podría escribir que \(P(B|A)= P(B)\) y en este caso la regla indica que la probabilidad conjunta de los eventos A y B es igual a la probabilidad de sus probabilidades marginales :



Definición: Independencia de eventos

Dos eventos A y B son independientes si y solo si la probabilidad del evento B no es afectada por la ocurrencia del evento A o viceversa.

\(P(A \cap B) = P(A) P(B)\) o \(P(B|A)=P(B)\)




Para determinar si los eventos A y B son eventos independientes se debe cumplir que :

\[P(A \cap B) = P(A) P(B)\] \[P(A \cap B') = P(A) P(B')\] \[P(A' \cap B) = P(A') P(B)\] \[P(A' \cap B') = P(A') P(B')\]

Tabla 2.4 Probabilidades conjuntas y marginales


En el caso que se cumplan todas las condiciones, diremos que los eventos son independientes. En caso contrario, los eventos no son independientes. Una aplicación de este concepto se ilustra con los siguientes ejemplos:



Ejemplo

Se tiene un circuito formado por dos componentes \(A_{1}\) y \(A_{2}\) cada uno con probabilidad de funcionamiento \(P(A_{1}) = 0.90\) y \(P(A_{2}) = 0.95\) . Determinar la probabilidad de que el componente funcione.

Figura 2.5 Disposición de componentes en serie



Solución:

Inicialmente se supone que los componentes \(A_{1}\) y \(A_{2}\) funcionan de manera independiente. Esto implica que \(P(A_{1} \cap A_{2}) = P(A_{1}) P(A_{2})\)

Como para que el circuito funcione debe funcionar el componente \(A_{1}\) y \(A_{2}\), utilizando el principio de independencia tenemos que:

\[P(A_{1} \cap A_{2}) = P(A_{1}) P(A_{2}) = 0.90 \times 0.95 = 0.855\]




Ejemplo

Ahora supongamos que el circuito anterior está conectado en paralelo. Determinar la probabilidad de que el circuito funciones

Figura 2.6 Disposición de componentes en paralelo



Solución:

En este caso solo hay una manera como el circuito no funciona y es cuando ambos componentes no funcionan. Esto implica que la probabilidad de que no funcione bajo el supuesto que los dos componentes son independientes es:

\[P(A_{1}^{'} \cap A_{2}^{'}) = P(A_{1}^{'}) \times P(A_{2}^{'}) = 0.10 \times 0.05 = 0.005 \]

Ahora como se requiere la probabilidad de que el circuito funciones se utiliza el axioma \(A_{4}\) : Para cualquier evento \(A\), \(P(A')=1-P(A)\)

\[1-0.005 = 0.995\]



Ejemplo

El departamento de crédito de la universidad, informa que el 30% de los pagos realizados en la universidad se efectúan en efectivo, un 40% con tarjeta de crédito y el resto con tarjeta débito. En todos los casos estos pagos solo son recibidos en la caja ubicada en la oficina de Registro Académico de la universidad.

También se conoce que 20% de los pagos realizados en efectivo, 70% de los pagos realizados con tarjeta de crédito y el 80% de los pagos realizados con tarjeta débito, corresponden a pagos por valores superiores a $500 mil pesos.

Con el fin de mejorar el servicio, se esta diseñando un sistema de turnos que agilice el procedimiento de atención . El ingeniero a cargo del diseño de sistema requiere le ayude a valorar las prioridades para las personas que deben pagar mas de $500 mil pesos, pues el ingeniero sospecha que es más probable que una persona requiere pagar más de $500 mil pesos, lo haga con efectivo.

Ayude al ingeniero con la información necesaria que le permita reafirmar su sospecha o por el contrario a valorar las diferentes posibilidades.


Solución:


Definimos los siguientes eventos :


Información :

por diferencia
\(P(E) = 0.30\) \(P(+5 | E) = 0.20\) \(P(-5 | E) = 0.80\)
\(P(TC) = 0.40\) \(P(+5 | TC) = 0.70\) \(P(-5 | TC) = 0.30\)
\(P(TD) = 0.30\) \(P(+5 | TD) = 0.80\) \(P(-5 | TD) = 0.20\)



Figura 2.7 Árbol de probabilidades marginales y condicionales


\(P(E|+5) = \dfrac{P(E \cap +5)}{P(+5)} = \dfrac{0.06}{0.58} = 0.1034\) TERCERO
\(P(TC | +5) = \dfrac{P(TC \cap +5)}{P(+5)} = \dfrac{0.28}{0.58} = 0.4827\) PRIMERO
\(P(TD | +5) = \dfrac{P(TD \cap +5)}{P(+5)} = \dfrac{0.24}{0.58} = 0.4138\) SEGUNDO



Probabilidad Total


Ahora supongamos que el espacio muestral esta formado por un conjunto de eventos lo podemos representar como una partición del conjunto \(S\) así :

Figura 2.8 Partición del espacion muestral



Nota

Una partición de un conjunto de \(S\) está formada por subconjuntos \(A_{1}\), \(A_{2}\), \(\dots\) , \(A_{n}\), que deben cumplir las siguiente propiedades :

  • \(A_{1} \cup A_{2} \cup \dots \cup A_{n}=S\)

  • \(A_{i} \cap A_{j} = \phi\) , para todo \(i \neq j\)

  • \(A_{i} \neq \phi\)



En nuestro caso podemos tener solo cinco particiones para simplificar el procedimiento


Figura 2.9 Partición del espacio muestral con evento B



Podemos resaltar los conjuntos que conforman a \(B\) :

Figura 2.10 Evento B representado por subconjuntos



También podemos reconstruir \(B\) como :

\(B = (A_{1} \cap B) \cup (A_{2} \cap B) \cup (A_{3} \cap B) \cup (A_{4} \cap B) \cup (A_{5} \cap B)\)



En términos de probabilidad tenemos

\(P(B) = P(A_{1} \cap B) + P(A_{2} \cap B) + P(A_{3} \cap B) + P(A_{4} \cap B) + P(A_{5} \cap B)\)

Este resultado se puede expresar en otros términos de la regla de la multiplicación:

\(P(B) = P(A_{1})P(B|A_{1}) + P(A_{2})P(B|A_{2}) +P(A_{3})P(B|A_{}) + P(A_{4})P(B|A_{4}) + P(A_{5})P(B|A_{5})\)


En general :



Definición: Regla de la probabilidad total

Dado una serie de eventos que conforman una partición \(E_{1}\), \(E_{2}\), \(E_{3}\), \(\dots\), \(E_{k}\), que son mutuamente excluyentes y exhaustivos y un evento A, la probabilidad del evento A se expresa como :

\[P(A)=P(E_{1})P(A|E_{1})+ P(E_{2})P(A|E_{2})+ P(E_{3})P(A|E_{3})+ \dots P(E_{k})P(A|E_{k})\]




En el caso que en el ejemplo anterior se requiere calcular la probabilidad \(P(+5)\) utilizamos la regla de la probabilidad total:

\(P(+5) = P(E)P(+5|E) + P(TC)P(+5|TC) +P(TD)P(+5|TD)\)

\(P(+5) = P(E)P(+5|E) + P(TC)P(+5|TC) +P(TD)P(+5|TD)\)

\(P(+5) = 0.30 \times 0.20 + 0.40 \times 0.70 + 0.30 \times 0.80\)

\(P(+5) = 0.06 + 0.28 +0.24 = 0.58\)



Teorema de Bayes


Figura 2.11 Tomas Bayes (1701-1761)


Thomas Bayes (Londres, Inglaterra, ~1702 - Tunbridge Wells, 1761) fue un matemático británico y ministro presbiteriano. Su obra más conocida es el Teorema de Bayes.



El teorema de Bayes, que lleva el nombre del matemático británico del siglo XVIII Thomas Bayes, es una fórmula matemática para determinar la probabilidad condicional . La probabilidad condicional es la probabilidad de que ocurra un resultado, basada en un resultado previo. El teorema de Bayes proporciona una forma de revisar las predicciones o teorías existentes (actualizar las probabilidades) dada la evidencia nueva o adicional. En finanzas, el teorema de Bayes se puede utilizar para calificar el riesgo de prestar dinero a posibles prestatarios. Tomado de :investopedia
Lectura recomendada



Definición: Teorema de Bayes

Dado una serie de eventos que conforma una partición \(E_{1}\), \(E_{2}\), \(E_{3}\), \(\dots\), \(E_{k}\) , que son mutuamente excluyentes y exhautivos, con probabilidad a priori \(P(E_{1})\), \(P(E_{2})\) \(P(E_{3})\), \(\dots\), \(P(E_{k})\). Si ocurre un evento \(A\), la probabilidad a posteriori de \(E_{i}\) dados \(A\), es la probabilidad condicional :

\[P(E_{i}|A)=\dfrac{P(E_{i} \cap A)}{P(A)}= \dfrac{P(E_{i}) P(A|E_{i})}{\displaystyle\sum_{j=1}^{k} P(E_{j})P(A|E_{j})} \]


Ejemplo


Continuando con el ejemplo anterior puede ser necesario calcular la probabilidad : \(P(E|+5)\) para lo cual utilizamos el Teorema de Bayes

\(P(E|+5) = \dfrac{P(E \cap +5)}{P(+5)} = \dfrac{P(E)P(+5|E)}{P(E)P(+5|E) + P(TC)P(+5|TC) +P(TD)P(+5|TD)}\)

\(P(E|+5) = \dfrac{0.30 \times 0.20}{0.30 \times 0.20 + 0.40 \times 0.70 + 0.30 \times 0.80} = \dfrac{0.06}{0.58} = 0.1034\)



En una fábrica de artículos para protección biodegradables, cuatro operarios colocan etiquetas de caducidad en cada articulo al final de la linea de producción. Juan, quien coloca la fecha de caducidad en un 40% de los paquetes no logra ponerla en uno de cada 200 paquetes; Luis, quien coloca en 30 % de los paquetes, no logra colocarla en uno de 100 paquetes; Maria, quien coloca etiquetas en el 15 % de los paquetes, no lo hace una vez en 90 paquetes; y Santiago que fecha 15 % de los paquetes, falla en uno de cada 200 paquetes. Si un cliente se queja de que su paquete no muestra la fecha de caducidad.

¿Cuál de los empleados es el más probable culpable de esta omisión?

Solución

Información

Juan Luis Maria Santiago
\(P(J) = 0.40\) \(P(L) =0.30\) \(P(M)=0.15\) \(P(S)=0.15\)
\(P(N|J)=1/200\) \(P(N|L) = 1/100\) \(P(N|M)=1/90\) \(P(N|S)=1/200\)



\[N = (J \cap N) \cup (L \cap N) \cup (M \cap N) \cup (S \cap N) \] \[P(N) = P(J \cap N) + P(L \cap N) + P(M \cap N) + P(S \cap N) \] \[P(N) = P(J)P(N|J) + P(L)P(N|L) + P(M)P(N|M) + P(S)P(N|S)\] \[P(N) = 0.40 \dfrac{1}{200} + 0.30 \dfrac{1}{100} + 0.15 \dfrac{1}{90} + 0.15 \dfrac{1}{200}\]

\[P(N) = 0.0020 + 0.0030+ 0.0017 + 0.0008 = 0.0075\]



Aplicaciones

Árboles de decisión


#  install.packages("titanic")  # instalar paquete titatic
library(titanic) #  cargar paquete
data(titanic_train)  # cargar los datos

# install.packages("rpart")
# install.packages("rattle")
#install.packages("rpart.plot")

library(rpart)
library(rattle)
library(rpart.plot)

arbol=rpart( formula = Survived ~ Sex,
data = titanic_train,
method = "class")
fancyRpartPlot(arbol)


Figura 2.12 Árbol de probabilidades Titanic

Código basado en: https://www.youtube.com/watch?v=t0lmtrm_aa0



Resultados del árbol


Eventos

  • \(S\) : sobrevive
  • \(S'\) : no sobrevive
  • \(H\) : hombre
  • \(M\) : mujer



Probabilidades

  • \(P(S') = 0.62\)
  • \(P(S) = 0.28\)
  • \(P(M) = 0.35\)
  • \(P(H) = 0.64\)
  • \(P(S'|M= = 0.26\)
  • \(P(S|M= = 0.74\)
  • \(P(S'|H) = 0.81\)
  • \(P(S|H) = 0.19\)



t= table(titanic_train$Survived,
titanic_train$Sex)       # Construcción tabla cruzada

t = t %>%  
prop.table() %>% 
addmargins() %>% 
round(.,4)

rownames(t)=c("Died","Survived", "Sum")


t        # Tabla de probabilidades
          
           female   male    Sum
  Died     0.0909 0.5253 0.6162
  Survived 0.2615 0.1223 0.3838
  Sum      0.3524 0.6476 1.0000