UNIDAD # 4
INTRODUCCION A LA PROBABILIDAD
1. Experimentos reglas de conteo y asignación de probabilidades
2 .Eventos y sus probabilidades
3. Algunas relaciones básicas de probabilidades
4. probabilidadcondicional
5. teorema de bayes
EXPERIMENTO Y REGLAS DE CONTEO, Y ASIGNACIONES DE PROBABILIDAD
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento.
ASIGNACIÓN DE PROBABILIDADES
MÉTODO CLÁSICO
Asigna probabilidades basado en la suposición de resultados igualmente probables p(a) = a/n
MÉTODO DE FRENCUENCIA RELATIVA
Asigna probabilidades basado en la experimentación o datos históricos.
MÉTODO SUBJETIVO
Asigna probabilidades basado en el juicio o criterio del analista.
EVENTOS Y SUS PROBABILIDADES
Un experimento es un proceso que genera salidas o resultados bien definidos.
A un resultado de un experimento también se le llama punto muestral o elemento del espacio muestral.
El espacio muestral de un experimento es el conjunto de todos los puntos muéstrales o resultados
Un evento es un subconjunto del espacio muestral
MÉTODO CLÁSICO
Si un experimento tiene n posibles resultados, este método asignará una probabilidad de 1/n a cada resultado favorable.
Ejemplo
Experimento: Lanzar un dado
Espacio Muestral: S = (1, 2, 3, 4, 5,6)
Probabilidades: Cada Punto muestral tiene 1/6 de probabilidad de ocurrir.
EXPERIMENTO Y ESPACIO MUESTRAL:
Desde el punto de vista de la probabilidad, definimos un experimento como cualquier proceso que se puede generar uno de un conjunto de resultados bien definidos. En cualquier ejecución única de un experimento ocurrirá uno y solo uno de los posibles resultados experimentales, a continuación ejemplos de experimentos y sus resultados asociados.
Desde el punto de vista de la probabilidad, definimos un experimento como cualquier proceso que se puede generar uno de un conjunto de resultados bien definidos. En cualquier ejecución única de un experimento ocurrirá uno y solo uno de los posibles resultados experimentales, a continuación ejemplos de experimentos y sus resultados asociados.
EVENTO Y SUS PROBABILIDADES
Un evento es un subconjunto del espacio muestral.
Definición clásica de la probabilidad de un evento
Sea un experimento aleatorio cuyo correspondiente espacio muestral S está formado por un número infinito de posibles resultados distintos y con la misma probabilidad de ocurrir
|
Regla de la Adición
Regla especial de la adición. Establece que si dos eventos A y B son mutuamente excluyentes la probabilidad de que uno u otro evento ocurra es igual a la suma de sus probabilidades. De lo anterior se puede deducir que la probabilidad de que ocurra A más la probabilidad de que no ocurra A debe sumar 1. A esto se le llama la regla del complemento. Esta regla establece que para determinar la probabilidad de que ocurra un evento se puede restar de 1 la probabilidad de que no ocurra.
La Regla de la Adición expresa que: la probabilidad de ocurrencia de al menos dos sucesos A y B es igual a: P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente P(A o B) = P(A) + P(B) - P(A y B) si A y B son no excluyentes Siendo: P(A) = probabilidad de ocurrencia del evento A P(B) = probabilidad de ocurrencia del evento B P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B
ejemplo: Si A y B son dos eventos que no son mutuamente excluyentes, entonces P(A o B) se calcula con la siguiente fórmula: P(A o B) = P(A) + P(B) - P(A y B) El Diagrama de Venn ilustra esta regla
ejemplo: En una muestra de 500 estudiantes, 320 dijeron tener un estéreo,
175 dijeron tener una TV y 100 dijeron tener ambos Si un estudiante es seleccionado aleatoriamente, ¿cuál es la probabilidad de que tenga sólo un estéreo, sólo una TV y uno de cada uno? P(S) = 320 /500 = .64. P(T) = 175 /500 = .35. P(S y T) = 100 /500 = .20.
Si un estudiante es seleccionado aleatoriamente, ¿cuál es la probabilidad de que tenga un estéreo o una TV en su habitación? P(S o T) = P(S) + P(T) - P(S y T) = .64 +.35 - .20 = .79.
|
|
En este caso solo nos interesa que en el segundo mes o sea al final los clientes compren el producto A, esto quiere decir, que solo vamos a tomar encuentra los porcentajes de aceptación del producto A, ya sea que desde el inicio compro el producto A o no pero que al final si compro A.
Por lo que nos quedaría de esta forma: P( C ) = ( 0.6*0.75) + (0.4*0.45) = 0.63 Donde el primer paréntesis representa que al inicio prefiere A y luego permanece en A, y el segundo paréntesis representa que al inicio prefiere B pero que luego al final prefiere A. Obteniendo así las 2 formas donde terminan comprando al final el producto A. También se puede hacer de la siguiente forma: P( C ) = (A 1 A 2 ) U (B 1 A 2 ) P( C ) = P(A 1 ) * P(A 2 /A 1 ) + P(B 1 ) * P(A 2 /B 1 ) En donde; P(A)= 0.6 P(B)= 0.4 P(A 2 /A 1 ) = 0.75 P(B 2 /A 1 )= 0.25 P(B 2 /B 1 )= 0.55 P(A 2 /B 1 )= 0.45 Por lo que nos quedaría de la siguiente forma; P( C ) = (0.6) * (0.75) + (0.4) * ( 0.45) = 0.63 |
Otro ejemplo:
Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las otras dos verdes. Definimos A1 = {la 1ª bola es azul}; A2 = {la 2ª bola es verde}; A3 = {la 3ª bola es verde} p(A1) = 2/10 aplicando la definición clásica de probabilidad, puesto que hay 10 bolas y 2 son verdes. p(A2|A1) = 5/9; si la primera bola extraída es azul, en la urna quedan 9 bolas, 5 de ellas verdes. p(A3|A1 Ç A2) = 4/8; si la primera bola extraída es azul y la segunda verde en la urna quedan 8 bolas, 4 de ellas verdes. p(A1 Ç A2 Ç A3) = 2/10 x 5/9 x 4/8 = 1/18 |
Ley de la Multiplicación |
Si se tienen varios eventos sucesivos e independientes entre sí, la probabilidad de que ocurran todos ellos a la vez corresponde a la multiplicación de las probabilidades de cada uno de los eventos.
|
Cuando se busca la probabilidad de dos eventos independientes (dos cosas sucediendo, donde los resultados no se afectan mutuamente), multiplique las probabilidades de cada evento que esté sucediendo, para obtener la probabilidad de los dos eventos que están sucediendo. Por ejemplo, para obtener la probabilidad de que salga “cara” y luego “sello” cuando se lanza una moneda dos veces, multiplique la probabilidad de obtener una vez cara por la probabilidad de obtener una vez sello.
* La regla especial de la multiplicación requiere d A B i d di que dos eventos y sean independientes. *Dos eventos son independientes si la ocurrencia de uno no altera la posibilidad de que suceda el otro. *Si lo anterior se cumple la probabilidad de que ocurran ambos eventos se obtiene multiplicando las dos probabilidades – P(A y B)=P(A)P(B) *Esta regla supone que un segundo evento no se ve afectado por el primero. Por lo que para tres eventos tendremos – P(A y B y C)=P(A)P(B)P(C) |
TEOREMA DE BAYES
El Teorema de Bayes enunciado por Thomas Bayes es el resultado que da la distribución de probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución marginal de sólo A.
Generalmente se comienza el análisis con estimaciones iniciales o de probabilidad previa para los eventos específicos que nos interesan; luego, de fuentes tales como una muestra, un reporte especial o una prueba de producto obtenemos alguna información adicional sobre los eventos. Con esta nueva información actualizamos los valores de probabilidad previa calculando probabilidades revisadas, conocidas como probabilidades posteriores. El Teorema de Bayes proporciona un medio para hacer estos cálculos de probabilidad. A continuación se indica la formula respectiva.
P (A1/B) = P (A1) P (B/A1) / P (A1) P (B/A1) + P(A2) P(B/A2)
UNIDAD # 5
DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
1. variablesaleatorias
2. distribuciones discretas De probabilidad
3. valor esperado y varianza
4. distribución de probabilidad
5. distribución de probabilidad poisson
6. distribución de probabilidad hipergeometrica
VARIABLE ALEATORIA
Una Variable aleatoria X es una regla que asigna un valor numérico a cada resultado en el espacio menstrual de un experimento.
Una variable aleatoria discreta puede tomar en específico, aislado valor numérico, como resultado de lanzar un dado, o el número de dólares en una cuenta bancaria escogido de forma aleatoria.
Una variable aleatoria continua puede tomar cualquier valor dentro de un continuo intervalo de tiempo, como la temperatura en el Parque Central, o la altura de un atleta en centímetros.
Variable aleatoria discreta que sólo puede asumir finitamente muchos valores (como el resultado de lanzar un dado) se llama variables aleatorias finitas.
DISTRIBUCIÓN DE PROBABILIDAD
La probabilidad P(X = x) es la probabilidad de que X realiza el valor x. Del mismo modo, la probabilidad P(a<X<b) es la probabilidad de que X se encuentre entre a y b.
Estas probabilidades pueden ser estimadas, o teoréticas (modeladas) (vea el capítulo 7 de Matemáticas Finitas o el resumen de probabilidad para una discusión de los tipos de probabilidad.)
Para una variable aleatoria finita, la colección de números P(X = x) a medida que varíax se llama la distribución de probabilidad de X. Es frecuentemente útil representar gráficamente la distribución de probabilidades por un histograma.
Distribución de probabilidad
En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los sucesos, cada uno de los sucesos es el rango de valores de la variable aleatoria.
La distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x.
Definición de función de distribución
Por simplicidad, cuando no hay lugar a confusión, suele omitirse el subíndice y se escribe, simplemente, f(x) .
Propiedades
Como consecuencia casi inmediata de la definición, la función de distribución:
- Es una función continua por la derecha.
- Es una función monótona no decreciente.
Para dos números reales cualesquiera a y b tal que (a<b) , los sucesos (x<_a) y (a<x<_b) son mutuamente excluyentes y su unión es el suceso(x<_b) , por lo que tenemos entonces que:
p(x<_b)= P(x<_a)+P(a<x<_b)
p(a<x>_b) =P(x<_b)-P(x<_a)
y finalmente
p(a<x<_b)=F(b)-f(a)
Por lo tanto una vez conocida la función de distribución f(x) para todos los valores de la variable aleatoria conoceremos completamente la distribución de probabilidad de la variable.
=
La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.
Para realizar cálculos es más cómodo conocer la distribución de probabilidad, y sin embargo para ver una representación gráfica de la probabilidad es más práctico el uso de la función de densidad.
Distribuciones de variable discreta
Se denomina distribución de variable discreta a aquella cuya función de probabilidad sólo toma valores positivos en un conjunto de valores de finito o infinito numerable. A dicha función se le llama función de masa de probabilidad. En este caso la distribución de probabilidad es la suma de la función de masa, por lo que tenemos entonces que:
Y, tal como corresponde a la definición de distribución de probabilidad, esta expresión representa la suma de todas las probabilidades desde hasta el valor .
Distribuciones de variable discreta más importantes
Las distribuciones de variable discreta más importantes son las siguientes:
- Distribución binomial
- Distribución binomial negativa
- Distribución Poisson
- Distribución geométrica
- Distribución hipergeométrica
- Distribución de Bernoulli
- Distribución Rademacher, que toma el valor 1 con probabilidad ½ y el valor -1 con probabilidad ½.
- Distribución uniforme discreta, donde todos los elementos de un conjunto finito son equiprobables.
VALOR ESPERADO
El valor esperado o esperanza de una variable aleatoria tiene su origen en los juegos de azar, debido a que los jugadores deseaban saber cual era su esperanza de ganar o perder con un juego determinado. Como a cada resultado particular del juego le corresponde una probabilidad determinada, esto equivale a una función de probabilidad de una variable aleatoria y el conjunto de todos los resultados posibles del juego estará representado por la distribución de probabilidad de la variable aleatoria. El valor esperado o esperanza es muy importante, ya que es uno de los parámetros que describen una variable aleatoria.
Sea X una variable aleatoria discreta con función de probabilidades f(x). Entonces, el valor esperado de la variable aleatoria X, el cual se representa por E(X), está definido por:
E(X) = å xi f(xi)
Lo anterior significa, que para calcular E(X) se multiplica cada valor que puede tomar la variable aleatoria por la probabilidad que le corresponde y después se suman esos productos.
El valor esperado representa el valor promedio que se espera suceda, al repetir el experimento en forma independiente una gran cantidad de veces. El valor esperado se interpreta físicamente como el centro de masa o centro de gravedad de la distribución de probabilidad, por lo que es igual a la media o promedio aritmético, los cuales se representan con la letram.
De acuerdo a lo anterior podemos escribir que:
E(X) = m= å xi f(xi)
VARIANZA.
Existen dos aspectos que caracterizan de forma simple el comportamiento de la distribución de probabilidad, porque proporcionan una descripción completa de la forma en que se comporta: la medida de tendencia central y la de dispersión.
La primera está representada por la media o valor esperado, ya vista en el punto anterior, y la segunda por la variancia o por la desviación estándar, que evalúan la dispersión de la distribución de probabilidad o grado en que se separan del promedio los valores de la variable aleatoria X.
Por ejemplo, en un espacio muestralequiprobable vemos que los valores 5, 10 y 15 tienen una media de 10 y que los valores 9.9, 10 y 10.1 la media también es 10. Sin embargo, advertimos que los dos conjuntos de valores difieren notablemente en la dispersión de los valores respecto a su media y que tal dispersión es de gran importancia. Por lo tanto, para tener un conocimiento claro y completo del comportamiento de los valores que puede tomar la variable aleatoria, es indispensable conocer tanto la media como la variancia o la desviación estándar de la distribución de probabilidad.
Las desviaciones (X - m ) toman valores: (x1 - m), (x2 - m), (x3 - m), ,(xi - m), con probabilidades respectivas: f(x1), f(x2), f(x3), . . . , f(xi). Sin embargo, al tomar el valor esperado de estas desviaciones nos encontramos con que:
E(X - m ) = å(xi - m ) f(xi) = åxi f(xi) - måf(xi) = åxi f(xi) - m = m - m = 0
Esto se debe a que las desviaciones positivas se compensan con las desviaciones negativas. Para determinar una medida de dispersión, necesitamos considerar únicamente la magnitud de las desviaciones sin sus signos.
Una manera de eliminar el signo de las desviaciones, es considerar el cuadrado de las mismas, es decir, (xi- m)2.
Si obtenemos el valor esperado de las desviaciones elevadas al cuadrado, obtenemos una medida de la dispersión de la distribución de probabilidad, la cual es conocida como Variancia y se simboliza por s2 ó Var (X) óV(X).
La variancia de una variable aleatoria X se define como
s2 = V(X) = Var (X) = E (X - m )2 = å(xi- m)2 f(xi)
A partir de ésta ecuación y mediante un pequeño desarrollo matemático, se obtiene la siguiente expresión:
s2 = V(X) = åxi2 f(xi) - m2
Si representamos a åxi2 f(xi) por E( X2), podemos escribir:
s2 = V(X) = Var (X) = E( X2) - [E(X)]2 = E( X2) - m2
Al usar la variancia como medida de dispersión o variabilidad se presenta una dificultad. Las unidades con que se miden los valores que toma la variable aleatoria X son lineales, por ejemplo kilogramos, metros, litros, etc., por lo que m = E(X) también será lineal, pero la variancia s2 está en unidades cuadráticas, como kilogramos elevados al cuadrado, metros elevados al cuadrado, litros elevados al cuadrado, etc.
En vista de lo anterior, si queremos expresar la medida de dispersión en las mismas unidades en que se miden los valores de la variable aleatoria X, debemos tomar la raíz cuadrada positiva de la variancia. A esta cantidad se le conoce con el nombre de desviación estándar y se representa cons.
La desviación estándar de una variable aleatoria X se define y simboliza como:
DISTRIBUCIÓN BINOMIAL
.
En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.
Para representar que una variable aleatoriaX sigue una distribución binomial de parámetros n y p, se escribe:
DISTRIBUCIÓN DE POISSON
En teoría de probabilidad y estadística, la distribución de Poisson es una probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado número de eventos durante cierto periodo de tiempo.
Fue descubierta por Simeón-Denis Poisson, que la dio a conocer en 1838 en su trabajo Re cherches sur la probabilité des jugements en matièrescriminelles et matièrecivile (Investigación sobre la probabilidad de los juicios en materias criminales y civiles).
Propiedades
La función de masa de la distribución de Poisson es
Donde
- k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces).
- λ es un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
- e es la base de los logaritmos naturales (e = 2,71828...)
Tanto el valor esperado como la varianza de una variable aleatoria con distribución de Poisson son iguales a λ. Los momentos de orden superior son polinomios de Touchard en λ cuyos coeficientes tienen una interpretación combinatoria. De hecho, cuando el valor esperado de la distribución de Poisson es 1, entonces según la fórmula de Dobinski, el n-ésimo momento iguala al número de particiones de tamaño n.
La moda de una variable aleatoria de distribución de Poisson con un λ no entero es igual a , el mayor de los enteros menores que λ (los símbolos representan la función parte entera). Cuando λ es un entero positivo, las modas son λ y λ − 1.
La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parámetro λ0 a otra de parámetro λ es
Kikidie
DISTRIBUCIÓN HIPERGEOMÉTRICA
En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x ( ) elementos de la categoría A en una muestra de n elementos de la población original.
Propiedades
La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a
Donde es el tamaño de población, es el tamaño de la muestra extraída, es el número de elementos en la población original que pertenecen a la categoría deseada y es el número de elementos en la muestra que pertenecen a dicha categoría. La notación hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar elementos de un total .
UNIDAD # 6
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
1. DISTRIBUCION DE PROBABILIDAD EXPONENCIAL
2. DISTRIBUCION DE PROBABILIDAD UNIFORME
3. DISTRIBUCION DE PROBABILIDAD NORMAL
DISTRIBUCIÓN EXPONENCIAL
En estadística la distribución exponencial es una distribución de probabilidad continua con un parámetro λ > 0 cuya función de densidad es
DISTRIBUCIÓN UNIFORME
En estadística la distribución uniforme es una distribución de probabilidad cuyos valores tienen la misma probabilidad.
Distribución uniforme (caso continuo).
Se dice que una variable aleatoria X continua tiene una distribución uniforme en el intervalo [a,b] si la función de densidad de probabilidad (FDP) es
DISTRIBUCIÓN NORMAL
En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
· etc.
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal.1 Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchas tesis estadísticas están basadas en una supuesta "normalidad".
En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continuas y discretas