You are on page 1of 15

ESTADISTICA DESCRIPTIVA

SEMANA 1

I. CONCEPTOS DE ESTADÍSTICA

La estadística descriptiva corresponde a un conjunto de métodos que implican recopilación,


presentación y caracterización de un conjunto de datos, entrega información de la que se puedan
obtener conclusiones acerca de un grupo grande de personas, lugares o cosas, por medio de la
observación de solo una pequeña parte del conjunto total; se denomina inferencia estadística, se
fundamenta en la teoría de probabilidades.

La población es el conjunto completo de la información numérica sobre una característica particular


en la que el investigador está interesado.

Una muestra es un subconjunto de los valores poblaciones observados.

Un individuo es cada elemento de la población.

II. VARIABLE; ESTADÍSTICAS Y SU CLASIFICACIÓN

Las variables estadísticas se dividen en cuantitativas y cualitativas:

a) Las variables cualitativas son las que recoge una cualidad, y se distinguen:

las variables cualitativas nominales y las ordinales; las variables cualitativas nominales son las que
reconocen solo una etiqueta o nombre, por otra parte, en las variables cualitativas ordinales existen
categorizaciones entre las variables.

b) las variables cuantitativas: entregan respuestas numéricas y estas, a la vez, se subdividen en


discretas y continuas.

Las discretas son las que se pueden contar, una forma de distinguir una variable discreta es si entre
dos valores consecutivos no se puede intercalar un tercero.

Las continuas son las que pueden tomar cualquier valor dentro de un intervalo de números

1
III. MEDIDAS DE TENDENCIA CENTRAL

La media de un conjunto de observaciones numéricas es la suma de los valores del conjunto dividida
por el número de observaciones.

La mediana de un conjunto de observaciones, ordenadas de menor a mayor, se busca la que ocupa


el lugar central si el número de observaciones es impar; si el número de observaciones es par se
toma el promedio de las dos observaciones centrales.

La moda es el valor con mayor frecuencia o equivalentemente el valor que más se repite.

IV. MEDIDA DE VARIABILIDAD

Rango: diferencia entre el mayor y el menor valor del conjunto de datos.

R = Máx.–Mín.

Desviación estándar: raíz cuadrada de la varianza, por tanto, es el promedio de distancias de cada
observación con respecto a la media.

Coeficiente de variación: medida relativa de dispersión; mide la dispersión de los datos en torno a
la media

2
SEMANA 2

TEORÍA DE CONJUNTOS

Una notación usual para definir un conjunto y sus elementos es la siguiente:

𝐴= {𝑎1, 𝑎2, 𝑎3}

El conjunto que contiene a todos los elementos es llamado conjunto universo y en este apunte se
denotará con la letra griega mayúscula Ω (omega). Es claro que todo conjunto tiene todos sus
elementos en el conjunto Ω, a esa propiedad se le llama subconjunto. Formalmente se dice que A
es subconjunto de B (𝐴⊂𝐵) si todo elemento de A pertenece a B, pero no necesariamente todo
elemento de B pertenece a A.

Otras definiciones importantes son:

Unión, se dice que x pertenece a 𝐴∪𝐵, si x pertenece a A o pertenece a B.

Intersección, se dice que x pertenece a 𝐴∩𝐵, si x pertenece a A y pertenece a B.

Complemento, se dice que x pertenece al complemento de A, si no pertenece A y se denota


𝐴𝑐=𝐴−Ω.

PROPIEDADES DE LOS CONJUNTOS

Ley de Morgan (𝐴∪𝐵) 𝑐=𝐴𝑐∩𝐵𝑐

(𝐴∩𝐵) 𝑐=𝐴𝑐∪𝐵𝑐

𝐴𝑐∪𝐴=Ω

Conjunto vacío: 𝐴𝑐∩𝐴=∅

𝐴∪∅=𝐴

𝐴∩∅=∅

𝐴𝑐𝑐=𝐴

𝐴∪(𝐵∩𝐶) =(𝐴∪𝐵) ∩(𝐴∪𝐶)

𝐴∩(𝐵∪𝐶) =(𝐴∩𝐵) ∪(𝐴∩𝐶)

3
Espacio Muestral

El conjunto de todos los posibles valores que pueden tomar los sucesos es llamado espacio muestral,
que es equivalente al universo en la teoría de conjuntos y se denota con letra griega mayúscula
omega Ω.

Por ejemplo: si se define 𝐴: ={𝑆1} 𝑦 𝐵: ={𝑆2}, se tiene que: Ω= {S1, S2} además que A⊆Ω, B⊆Ω

Entonces, es claro que todo evento aleatorio es un subconjunto del espacio muestral. Además, se
puede definir como evento simple al subconjunto del espacio muestral que contiene un único
elemento, por lo que para el ejemplo A y B son eventos simples.

Definición de Sucesos

El suceso o evento aleatorio es cada uno de los resultados posibles de un experimento aleatorio.

DEFINICIÓN DE PROBABILIDAD

La definición clásica de probabilidad es el grado o nivel de posibilidad o certeza que ocurra un


determinado suceso o evento, medido en un espacio determinado. En términos simples la
probabilidad de A es equivalente a:

Para calcular probabilidades es necesario definir y recordar los siguientes axiomas:

1. La probabilidad del espacio muestral es igual a 1, por ejemplo, 𝑃(Ω)=1.

2. La probabilidad de todo evento subconjunto del espacio muestral Ω es mayor que cero, por
ejemplo, 𝐴⊂Ω, 𝑃(𝐴)≥0.

3. Sean 𝐴1, 𝐴2, 𝐴3, una sucesión de eventos mutuamente excluyentes por pares en el espacio
muestral Ω (i.e, 𝐴𝑖∩𝐴𝑗=∅, 𝑠𝑖 𝑖≠𝑗.) se tiene que 𝑃 (𝐴1∪𝐴2∪𝐴3∪…) =Σ𝑃(𝐴𝑖)∞𝑖=1.

4. Sean 𝐴 𝑦 𝐵 dos eventos aleatorios tales que 𝐴∩𝐵=𝐶≠∅, entonces: 𝑃(𝐴∩𝐵) =𝑃(𝐴)+𝑃(𝐵)−𝑃(𝐴∩𝐵)

5. 𝑃(Ω)=𝑃(𝐴)+𝑃(𝐴𝑐)=1.

4
Independencia de los Sucesos.

Una idea intuitiva de independencia es considerar dos eventos que no están relacionados de
ninguna manera.

Formalmente se dirá que dos eventos 𝐴 𝑦 𝐵 son independientes si 𝑃(𝐴∩𝐵) =𝑃(𝐴)𝑃(𝐵).

La representación gráfica de estos dos eventos independientes es a través de un diagrama de árbol.

5
SEMANA 3

I. COMBINATORIAS Y PERMUTACIONES

Las combinatorias y permutaciones son una forma de conteo y proporcionan fórmulas para contar
con rapidez todas las alternativas que hay de elegir en un determinado conjunto de elementos o
desde un grupo de individuos. Se diferencian entre ellas, básicamente en que en una hay un tipo de
extracción de elementos en que sí importa el orden y en la otra, hay una forma de extraer dónde
este no importa el orden.

a. Permutaciones: cantidad de arreglos u ordenaciones posibles de realizar al tomar una cantidad


determinada de objetos (r), dentro de un conjunto de ellos (n).

De acuerdo con lo anterior, se generan dos tipos de permutaciones, la primera no importa que los
individuos dentro del subconjunto escogido se repitan, en ese caso es con repetición y cuando es
sin repetición en el subconjunto el individuo es único.

b. Combinaciones: cantidad de formas posibles de tomar r objetos de entre un total de n.

II. PROBABILIDAD CONDICIONAL

La probabilidad condicional corresponde a aquellos tipos de probabilidades en que el resultado


tiene una dependencia de otro suceso determinado previo. Se refiere a aquellos sucesos que cuando
ocurren tienen una influencia o efecto en la ocurrencia de otro u otros sucesos.

A partir de esta definición se tiene:

𝑃(𝐴𝐵⁄) y se lee: dado que sucedió el evento B ¿cuál es la probabilidad que suceda el evento A? y se
calcula:

Es decir, es la probabilidad de que ocurra A y B sobre la probabilidad de que ocurra B. Se debe hacer
que la 𝑃 (𝐴 ∩ 𝐵) ≠ 𝑃(𝐴) ∗ 𝑃(𝐵), es decir los sucesos no son independientes.

6
III. PROBABILIDAD TOTAL

El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso a partir de


probabilidades condicionadas. La fórmula para calcular esta probabilidad es:

Es decir, la probabilidad de que ocurra el suceso B es igual a la suma de multiplicar cada una de las
probabilidades condicionadas de este suceso con los diferentes sucesos A por la probabilidad de
cada suceso A.

IV. TEOREMA DE BAYES

Este teorema es una generalización de la probabilidad condicional, que permite tener conocimiento
respecto de:

𝑃(𝐴⁄𝐵) ≠ 𝑃(𝐵⁄𝐴)

7
SEMANA 4

I. VARIABLE ALEATORIA

Una variable aleatoria puede concebirse como un número que varía con el azar, en consecuencia,
no se puede conocer con certeza el valor que tomará está al ser medida o determinada, aunque sí
se conoce que toma valores en probabilidad, es decir existe una distribución de probabilidad
asociada al conjunto de valores posibles.

Es claro que la variable aleatoria depende del espacio muestral a trabajar, este se clasifica
dependiendo la naturaleza de sus elementos, por lo que puede tomar También se pueden observar
valores discretos o continuos; dentro de los discretos están los finitos e infinitos; por otro lado,
dentro de los continuos se encuentran los acotados y no acotados.

Formalmente se define variable aleatoria discreta como:

Se dice que x es una variable aleatoria discreta si puede tomar solo un número finito o
contablemente infinito de valores distintos.

Se tiene la definición análoga para el caso continuo, es decir:

Se dice que x es una variable aleatoria continua si puede tomar valores continuos acotados o no
acotados.

8
II. FUNCIÓN DE DISTRIBUCIÓN

La función de distribución es la que entrega los valores de probabilidad de las variables aleatorias,
tomando un valor menor igual a un valor x.

Formalmente, se define la función de distribución como:

Sea x una variable aleatoria, entonces se define la función de distribución de probabilidad como la
probabilidad de que la variable aleatoria x tome un valor menor igual x ∈ R, y se simboliza como:

La función de distribución cumple las siguientes propiedades

Si x es una variable aleatoria discreta, se dice que es una función de distribución discreta.

En el caso de que la variable aleatoria sea continua, la función de distribución está dada por:

Otra definición importante es la de cuantía o masa de probabilidad, en la cual entrega la


probabilidad de que la variable aleatoria tome el valor específico. Entonces, sea x una variable
aleatoria discreta, se define esta como función de cuantía o masa de probabilidad a la probabilidad
de que la variable aleatoria x tome el valor específico x, se simboliza por además,
cumple con las siguientes propiedades:

9
Para el caso continuo, la función de densidad o de masa de probabilidad se define como:

Sea T variable aleatoria continua, se define como función de densidad o masa de probabilidad a la
probabilidad de que la variable aleatoria T tome el valor especifico t, se simboliza por
además cumple con las siguientes propiedades:

III. ESPERANZA Y VARIANZA

a) La Esperanza, se relaciona con los valores promedio. El concepto de esperanza que formalmente
se define como: Sea 𝑋 una variable aleatoria, entonces se define el valor esperado como:

Además, sean 𝑎, 𝑏 constantes y 𝑋 una variable aleatoria, entonces:

Sea X una variable aleatoria y C(x) una función real, entonces se define el valor esperado de C(X)
como:

Además, si 𝑎, 𝑏 son constantes y 𝑋 una variable aleatoria, entonces:

Una vez definida la esperanza, se procede a estudiar la varianza:

10
b) La varianza se relaciona con la desviación estándar. Sea 𝑋 una variable aleatoria, entonces se
define la varianza de X como:

Además, si 𝑎, 𝑏 son constantes y 𝑋 es una variable aleatoria, entonces:

11
SEMANA 5

I. DISTRIBUCIÓN DE BERNOULLI

es la distribución base de probabilidad discreta; de ella nacen muchas otras distribuciones, que
miden el éxito en un único experimento con dos posibles resultados y que asume el valor 1 para la
probabilidad de éxito p y valor 0 para la probabilidad de fracaso (1- p), a esta última también se le
conoce por q. Así la función de probabilidad o función de cuantía está dada por:

Entonces se está en condiciones de comprobar: 𝐸(𝑋)=𝑝; 𝑉(𝑋)=𝑝∗𝑞

II. DISTRIBUCIÓN BINOMIAL

La distribución binomial es una generalización de la distribución de Bernoulli, es decir un


experimento que se repite en reiteradas ocasiones (se repite exactamente n veces), tiene las
siguientes propiedades:

1. Consiste en un número fijo, n, de pruebas idénticas o repeticiones.

2. Cada prueba resulta en uno de dos resultados: éxito, E, o fracaso, F.

3. La probabilidad de éxito en una prueba es igual a algún valor p y es el mismo en cada una de las
pruebas. La probabilidad de fracaso, del mismo modo es igual a q = (1 – p) en todas las pruebas.

4. Las pruebas son independientes.

5. La variable aleatoria de interés es X, el número de éxitos observado durante los n ensayos.

Entonces, la función de cuantía de la variable aleatoria X, está dada por:

La notación de la distribución es: 𝑋~𝐵 (𝑛; 𝑝)

Y se lee; X se distribuye binomial con parámetros n y p. Entonces, igual que en el caso anterior, se
podrá comprobar que: 𝐸(𝑋)=𝑛𝑝; 𝑉(𝑋)=𝑛∗𝑝∗𝑞 𝑜 𝑒𝑞𝑢𝑖𝑣𝑎𝑙𝑒𝑛𝑡𝑒𝑚𝑒𝑛𝑡𝑒 𝑛∗𝑝∗(1−𝑝)

12
III. DISTRIBUCIÓN DE POISSON

Se emplea para describir procesos independientes, es decir, que no tienen memoria, y que ocurren
en un intervalo determinado, el que puede ser un intervalo de tiempo, minutos, horas, días, meses,
etc., o de un lugar determinado de espacio. Es importante aclarar que la unidad de medición es
continua (tiempo, área, volumen), pero la variable aleatoria es discreta.

Se lee 𝑋~𝑃(𝜆) es decir: “X se distribuye Poisson con parámetro (λ) Lamda”

Donde:

e equivale a 2,71828 (número e, es la base de logaritmo natural).

𝜆 𝑛u𝑚𝑒𝑟𝑜 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑝𝑜𝑟 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑜 𝑒𝑠𝑝𝑎𝑐𝑖𝑜

P(X=x): probabilidad de x éxitos en un tiempo determinado o espacio dado λ.

Entonces, igual que en el caso anterior, se podrá comprobar que: 𝐸(𝑋)=𝜆; 𝑉(𝑋)=𝜆

IV. APROXIMACIÓN DE BINOMIAL A POISSON

Si se analiza con detenimiento la distribución de Poisson, este corresponde a un caso particular de


distribución binomial, particularmente a una distribución binomial cuyo valor p tiende a 0 (cero) y n
tiene de infinito. Y cada experimento es independiente uno del otro.

Por lo tanto, la distribución de Poisson se puede utilizar como una aproximación a una distribución
binomial cuando n es grande y al mismo tiempo la probabilidad p es pequeña. Como norma general
resulta n * p, que es la esperanza en una distribución binomial, equivalente a λ y, a su vez, el
resultado sea inferior a 7 (la mayoría de los autores coinciden con dicho valor, siete, sin embargo,
basta con que n sea lo suficientemente grande y p muy pero muy pequeño).

V. VARIABLES CONTINUAS

a. Distribución normal

La función de densidad de la variable X que se distribuye normal con media μ y varianza σ2 está
dada por:

La notación de la distribución es: 𝑥~𝑁 (𝜇; 𝜎2). Y se lee “x se distribuye normal, con media μ y
varianza σ2”

13
Algunas propiedades de la distribución normal:

1. La moda, la media y la mediana son iguales.

2. La campana de Gauss es simétrica respecto de la media.

3. En el intervalo (μ - σ; μ + σ) se encuentra, aproximadamente, el 68,26% de la distribución.

4. En el intervalo (μ -2𝜎; μ + 2𝜎) se encuentra, aproximadamente, el 95% de la distribución

B. Distribución Normal Estándar

Calcular la probabilidad de que x este entre a y b, según la distribución normal es equivalente a


calcular:

El proceso de estandarización de la distribución estándar: Cualquier variable X cuya distribución sea


una distribución normal con media μ y varianza σ2 (es decir, 𝑥~𝑁 (𝜇; 𝜎2)), a dicha variable se le resta
su media y divide por su desviación estándar, automáticamente se convierte en una distribución
normal con media cero y varianza 1.

Lo anterior se expresa como: 𝑥~𝑁 (𝜇; 𝜎2) 𝑠𝑖 𝑠𝑒 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎: (Recuerde que se estandariza la
variable).

Esta distribución normal estándar se encuentra tabulada en muchos libros y Excel permite además
el rápido cálculo de las probabilidades.

C. Teorema Central del Límite

Este es un teorema fundamental de estadística y dice que si se tiene un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que este sea), la
suma de ellas se distribuye aproximadamente según una distribución normal.

La importancia práctica del teorema central del límite es que la función de distribución de la normal
puede usarse como aproximación de algunas otras funciones de distribución.

Si: 𝑋~𝐵 (𝑛; 𝑝) con p no demasiado cerca de los extremos 𝑥~𝑁 (𝑛𝑝; 𝑛𝑝(1−𝑝))

Si: 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆), entonces 𝑥~𝑁 (𝜆; 𝜆)

14
SEMANA 6

SOFTWARE ESTADÍSTICO R

Fue desarrollado por el Departamento de Estadística de la Universidad de Auckland en 1993.

El programa R, entrega al usuario diversas herramientas estadísticas, entre las cuales se puede
destacar: series de tiempo, modelos lineales, no lineales, análisis de cluster , modelos multivariados
y una gran variedad de test, etc.

Su principal virtud es que es un proyecto colaborativo y abierto, es decir, todos las personas que
acceden al programa tienen la posibilidad de contribuir al software publicando paquetes y
extensiones a paquetes actuales para así, mejorar el alcance de dicho programa

Uno de los grandes atributos que tiene el Software es que su uso es libre o gratuito, Y disponible
para Linux, Mac o Windows.

15

You might also like