You are on page 1of 21

Avance Proyecto Profesional

Universidad Latinoamericana

Estadstica I

Reporte Final
Hernndez Daz ngel

Prof.: Tello Campos Alejandro

RES.341

08/2017

08/2017
Introduccin

La estadstica es la rama de las matemticas que se encarga de recopilar y organizar datos. Una de las palabras ms usadas en la
estadstica es; Poblacin, que es el conjunto de individuos sobre el que se va a estudiar una caracterstica. Tambin la estadstica se
encarga de estudiar fenmeno que recopilan datos para estudiar algunos. (Ocampo, A. 2017).

Ejemplos:

Si nosotros queremos hacer un estudios sobre el peso de todos los estudiantes del curso, Cul sera la poblacin? Son todos los
estudiantes del curso porque a ellos sern a los que les vamos a hacer el estudio. Pero si quisiramos hacer otro estudio acerca del
color preferido del color de los estudiantes de la universidad, entonces estamos hablando de otra poblacin que sera todos esos
estudiantes de esa universidad. Otro seria por ejemplo la intencin de voto para la Presidencia de un pas, entonces la poblacin
seria todas las personas que pueden votar de ese pas, pero en este caso no serian todas las personas del Pas por que no todas
las personas del pas van a realizar la actividad que yo voy a investigar, entonces solo se tomara a unos cuantos.

A esto en la estadstica le agregamos otra palabra que sera; Individuo, o unidad estadstica, que es cada uno de los elementos que
componen la poblacin. Esto es cada uno de los elementos o de las personas a las que se les va a hacer el estudio. Esto
representa solo una unidad.

Tambin se utiliza la palabra Muestra; Que es un conjunto representativo de la poblacin, entonces la poblacin es todos, el
individuo o unidad es solo uno y muestra, es una parte que se toma cuando la poblacin es muy grande.

La otra palabra que ocupamos es Dato; estas son cada una de las respuestas que las encuestas me dan, para estas se pueden
ocupar, nmeros, Letras del abecedario, Incisos y afirmaciones, (SI, NO, NO SABE, TAL VEZ, NINGUNO).

Para poder realizar las estadsticas se debe de elaborar una tabla de frecuencias, esta consta de datos complejos que nos ayudaran
a la solucin de un problema. La tabla est compuesta por una cantidad de datos que nos ayudaran a realizar su solucin.

Tiene tambin un rango que es la diferencia entre el numero mayor y menor de nuestros datos, para esto existe una pequea
formula que es la siguiente.
R= X mximo X mnimo = Rango

Tambin requerimos de un nmero de intervalos esta igual se adquiere con una frmula que es la siguiente:

K= Numero de intervalos

K=1+ 3.3 Long (n) = Intervalos

n = Numero de datos

Los intervalos son el nmero de casillas que se tienen que realizar en la tabla para acomodar los datos

Se utiliza una amplitud que es lo grande de cada uno de los intervalos.

A= R/K= Amplitud

Medidas de tendencia central, (La Media, Mediana y Moda)

Cuando hay una serie de datos, se pueden realizar u organizar, en tablas de frecuencia, tambin los podemos representar en
graficas, a su vez se requiere obtener un valor representativo de estos datos.

La media: Es el promedio aritmtico de los datos, esta se puede realizar sumando el valor de cada uno de los datos y dividirlo entre
los datos que tenemos

La frmula que la representa es la siguiente:

x X x
N n

La Mediana: Cuando los datos se encuentran agrupados, la mediana es la que queda al centro, cuando estn ordenados. Se
representa con el smbolo Me. Cuando el nmero de datos es impar solo hay que ordenar y seleccionar el del centro.

La moda: Esta es el valor que aparece con mayor frecuencia, pueden existir ms de un valor con mayor frecuencia (Biomodal o
Multimodal. Se representa con el smbolo Mo.
Probabilidad

Es una medida de la posible medida de un evento cuando se realiza un experimento, sirve para resaltar algna efectividad o algn
resultado de que tan probable se podra decir la eficacia de un medicamento o en este caso que tanta probabilidad hay de sacarse la
lotera o inclusive desarrollar un antdoto de algn virus mortal. La probabilidad se representa con una P y el tipo de eventos con
letras ya sea A o B. Una probabilidad puede tomar un valor comience desde el cero hasta el uno, pero nunca puede superar el uno o
ser negativo. Cuando la probabilidad da igual a 0, significa que el evento no ocurrir, de lo contrario si da igual a 1 es que el evento
ocurrir, pero sin embargo el evento tiene un valor intermedio ejemplo: 0.1, 0.2, 0.3, 0.4, 0.5 significa que tiene un porcentaje de
que el evento ocurre por ejemplo; si cae en el 0.2 significa que tiene un 20% de probabilidad en una cantidad de veces.

Tipos de Probabilidad

Probabilidad clsica: Es aquella que dado un seceso (A), el numero de probabilidad de que (a) ocurra se define como el nmero de
casos favorables al evento, dividido al nmero de casos totales

ncasosfavorablesaA
P( A)
ncasostotales

Probabilidad conjunta o regla de la comunicacin: Es aquella que expresa la experiencia de un suceso (A) y el suceso (B), pueden
ocurrir de dos formas que el segundo suceso dependa del primero es decir sucesos dependientes o cuando ningn suceso depenta
del otro es decir sucesos independientes, Para esto se ocupan dos formulas y son las siguientes;

Sucesos dependientes.
P ( AnB ) P ( A) P ( B / A)

Sucesos independientes
P ( AnB ) P ( A) * P ( B )

Probabilidad condicional: Es aquella que nos ayuda a determinar como afecta la probabilidad de (A), el hecho de saber que ha
ocurrido otro evento (B)

P ( AnB )
P( A / B )
P( B)
Probabilidad experimental: Es aquella que nos permite calcular la probabilidad de sucesos irregulares, es decir es la probabilidad
que asignamos a un suceso mediante el clculo de su frecuencia relativa, al repetir el experimento muchas veces, en resumen es el
resultado basada de pruebas repetidas. Esta probabilidad se calcula con la relacin que un nmero de veces que un evento a
ocurrido con el nmero de veces que se ha ensayado.

n Eventosocurridos
P
nTotaldeeve ntos

Distribuciones continas de probabilidad

La distribucin normal nos sirve para detectar la cantidad de fenmenos que explica la mas importante de las distribuciones
estadsticas. Tambin se le denomina con el nombre de campana de GAUSS, pues al representar su informe de probabilidad tiende
a tener forma de campana. Una variable aleatoria continua, es aquella que puede asumir un nmero infinito de valores dentro de un
determinado rango.

Distribucin de probabilidad normal

La normal es la distribucin de probabilidad mas importante, multitud de variables aleatorias continuas siguen una distribucin
normal o aproximadamente una normal,. Una de sus caractersticas mas importantes es que casi cualquier distribucin de
probabilidad tanto discreta como continua, se puede aproximar bajo una normal bajo ciertas condiciones.

La distribucin de probabilidad normal y la curva normal que la representa, tiene las siguientes caractersticas:

- La curva normal tiene forma de campana y un solo pico en el centro de la distribucin. De esta manera, la media aritmtica,
la mediana y la moda de la distribucin son iguales y se localizan en el pico. As, la mitad de mitad del rea bajo la curva se
encuentran a la derecha de este punto central la otra mitad esta a la izquierda de dicho punto.

- La distribucin de probabilidad normal es simtrica alrededor de de su media.


- La curva normal desciende suavemente en ambas direcciones a partir del valor central. La curva llega a acercarse cada vez
mas al eje X, pero nunca llega a tocarlo, es decir, las colas de la curva se extienden de manera indefinida en ambas
direcciones, (Sedano, M. 2001).

.5 .5

X
Z
la variable Z con la siguiente formula:
Para trabajar con la distribucin normal se debe de calcular

X
Z

El valor de Z, indica a cuantas desviaciones estndar de la media se localiza el valor de X. Si el valor de X es mayor que la media, el
valor de Z, ser positivo, si es menor, Z ser negativo. Para calcular estas probabilidades de acuerdo al valor de la Z, se utiliza una
tabla estandarizada de valores de distribucin normal. La tabla corresponde a la probabilidad de que el valor de Z, este entre 0 y el
valor obtenido de Z.

TABLA DE PROBABILIDAD
Ejemplo a realizar

En un programa de capacitacin laboral para estimular las habilidades creativas y emprendedoras del personal, se aplico un
diagnostico inicial adecuado donde la puntuacin media fue de 237 puntos. Al finalizar el programa, los trabajadores presentaron
una evaluacin similar con los siguientes resultados. Adems se les pregunto si consideraban til o no este tipo de actividades para
su desarrollo profesional. S= SI, N= NO

PUNTAJE RESPUESTA PUNTAJE RESPUESTA PUNTUAJE RESPUESTA PUNTUAJE RESPUESTA PUNTUAJE RESPUESTA
244 N 237 S 241 N 234 S 234 S
233 N 242 S 231 S 237 S 236 S
236 S 249 S 236 N 246 S 238 S
231 N 238 S 238 S 240 S 232 S
238 S 236 S 245 S 231 S 242 S
237 S 231 S 239 S 236 S 241 S
243 S 237 S 234 S 235 S 234 S
242 S 234 S 232 N 238 N 238 S
232 S 238 S 242 S 237 S 231 N
235 S 231 S 236 S 234 S 240 N
241 S 235 S 242 S 229 S 242 S
231 S 236 N 240 S 231 N 224 S
234 N 228 S 244 S 240 S 233 S
240 S 240 S 234 S 237 S 232 S
238 S 233 S 243 S 234 S 244 S
229 S 247 S 241 S 229 S 242 S
237 S 232 S 238 S 241 S 249 S
241 S 236 S 238 S 233 S 231 S
239 S 231 N 237 N 239 S 242 S
235 S 243 S 231 S 236 S 245 N
PUNTUAJES X f fr F
Solucin:
O
Rango INTERVALO

R = 249 224 = 25 224, 228 226 1 0.01 * 100 = 1% 1

Intervalos 228, 232 230 15 0.15 * 100 =15% 16

232, 236 234 22 0.22 * 100 =22% 38


K= 1+ 3.3 Log (100) = 7.6
236, 240 238 30 0.3 * 100 = 30% 68
K= 7
240, 244 242 23 0.23 * 100 = 23% 91
Amplitud
244, 248 246 7 0.07 * 100 = 7% 98
A = 25 / 7 = 3.57
248, 252 250 2 0.02 * 100 = 2% 100
A=4

(X), es la marca de clase, esta es el promedio entre los lmites de cada intervalo es decir:

X = 224 + 228 / 2 = 226 = Intervalo 1, X = 228 + 232 / 2 = 230= Intervalo 2, X = 232 + 236 / 2 = 234 = Intervalo 3, X = 236 + 240 / 2 = 238 =Intervalo
4, X = 240 + 244 / 2 = 242 Intervalo 5, X = 244 + 248 / 2 = 246 Intervalo 6, X = 248 + 252 / 2 = 250 Intervalo 7.

La divisin de entre dos sale del nmero de datos que hay en cada intervalo.

La frecuencia es el nmero de veces que el dato aparece dentro de nuestra tabla de datos, se representa con una (f).

La frecuencia relativa es, La frecuencia entre el numero de datos fr= f / n = Frecuencia Relativa.

Ejemplo de nuestro primer Intervalo: fr = 1 / 100 = 0.01, y as sucesivamente con cada uno de los intervalos de la frecuencia. El resultado se
puede multiplicar por cien para que nos d el porcentaje de la fr.

Por ltimo La frecuencia absoluta acumulada es, la acumulacin del intervalo de cada celda de frecuencia es decir se van sumando los nmeros.
Histogramas

Son los diagramas o graficas que representan los datos adquiridos por cada frecuencia o clase. Estas se pueden representar en una hoja de
clculo.

El Histograma de nuestras afirmaciones de arriba de S= Si y N= No se representa de la siguiente manera.

En nuestra tabla tenemos 85 si que si lo dividimos entre el nmero de datos que son 100 y lo multiplicamos por cien que sera nuestro porcentaje
nos da 85

S = 85/ 100 * 100 = 85 % COLOR AZUL

Y N, tenemos que son 15

N = 15 / 100 * 100 = 15 % COLOR ROJO

Estos valores lo ms recomendable es utilizar la grafica de pastel


HIistograma de Marca de Clase Histograma de frecuencia

Histograma de frecuencia relativa Histograma de Frecuencia Acumulada


Medidas de Tendencia Central, Media, Mediana y Moda en datos agrupados en Intervalos

PUNTUAJES Xi fi F
O
INTERVALO

224, 228 226 1 1

228, 232 230 15 16

232, 236 234 22 38

236, 240 238 30 68

240, 244 242 23 91

244, 248 246 7 98

248, 252 250 2 100

X 238 Me=238 Mo=238, fr=30

Media xi
Para poder encontrar la media requeriremos de la siguiente formula; X N La cual se tuvo que crear una nueva casilla con
ese nombre, que se logra haciendo la multiplicacin de la casilla x por f, de cada uno d los intervalos y se suma al final el total y
ahora si podemos hacer la siguiente operacin aplicando la frmula para obtener la media.
1666
X
20 = 238
Mediana

Para la mediana requerimos ordenar los datos del menor al mayor y el dato que quede en medio ser la mediana en este caso
nuestros datos ya se encuentran ordenador y el numero que queda en medio es el 238 nuevamente, queda mensionar que no
siempre este dato se repite. Esto se reconoce por que el numero de datos que tenemos es in par, cuando nuestro numero de datos
es par se agarran los dos de en medio y le sacamos la media en este caso se suman esos dos datos y se divide entre esos dos
datos y esa ser la mediana.

Moda

La moda recordemos que es el dato que ms se repite y para sacarla en nuestra tabla de frecuencias solo hay que ver cuntas
veces se repite un dato ese sera el numero de moda, hay ocasiones en que el dato se repite dos veces a esto se le llama Bimodal.
En nuestra tabla de frecuencias la frecuencia relativa que ms se repite es 238 nuevamente con 30 repeticiones.

Ejercicio de Probabilidad

Organizar los datos en una tabla de contingencia explorando las posibles relaciones entre las variables consideradas en el estudio.

Organizar los datos cruzados en una tabla de contingencia explorando las posibles relaciones entre las variables consideradas en
el estudio.

Para ello contempla los siguientes grupos de personal: aquellos que consideran til el programa y los que no; quienes tuvieron
puntuaciones por arriba de la media y quines no.
244 N 237 S 241 N 234 S 234 S
233 N 242 S 231 S 237 S 236 S
236 S 249 S 236 N 246 S 238 S
231 N 238 S 238 S 240 S 232 S
238 S 236 S 245 S 231 S 242 S
237 S 231 S 239 S 236 S 241 S
243 S 237 S 234 S 235 S 234 S
242 S 234 S 232 N 238 N 238 S
232 S 238 S 242 S 237 S 231 N
235 S 231 S 236 S 234 S 240 N
241 S 235 S 242 S 229 S 242 S
231 S 236 N 240 S 231 N 224 S
234 N 228 S 244 S 240 S 233 S
240 S 240 S 234 S 237 S 232 S
238 S 233 S 243 S 234 S 244 S
229 S 247 S 241 S 229 S 242 S
237 S 232 S 238 S 241 S 249 S
241 S 236 S 238 S 233 S 231 S
239 S 231 N 237 N 239 S 242 S
235 S 243 S 231 S 236 S 245 N
SI por arriba de la media 28
Si por debajo de la
media 38
No por arriba de la
media 0
No por debajo de la
media 9
Arriba de Debajo de total
la media la media
El programa es til?

SI 66
28 38

NO 0 9 9

28 47 75

TOTAL

Pregunta: Cual es la probabilidad de que un trabajador considere til tomar un curso de capacitacin dado que se
encuentra en el grupo de las puntuaciones por arriba de la media?
P ( A B ) 28 El 100%
P( A / B ) 1
P( B ) 28

Inferencia de la puntuacin tpica

El Histograma de frecuencias relativas contruido en el ejercicio de arriba, esta conformado por una media que es muy representativa, y se asimila
mucho a la forma de la campana que puede llegar a tener un distribucion continua de probabilidad, tiene formas decendentes de ambos lados
tanto del lado derecho como de la lado izquierdo. Esta nos representa el porcentaje que tiene cada intervalo en su valor de repeticiones y la suma
en total de este porcentaje equivale al 100% pero la media nos representa un 80% en este ejemplo que puede ocurrir en su proceso. La
interpretacion de este Histograma es medir el valor de porcentaje de acuerdo a la mediana de los valores proporcionados de acuerdo a la X,
numero de datos. En este ejercicio que realizamos mi frecuencia relativa de acuerdo a la mediana si tomo una forma de campana y se ve
representativo como mencione arriba, a la distribucion normal de la media, ya que este tambien tomo una forma de campana y nor representa el
histrograma con una forma puntiaguda por en medio y tiene forma desendente de ambos lados.

Aqu falto incluir lo siguiente:

3. Resultados del proyecto. Presenta y explica los datos que obtuviste.


De manera adicional, obtn e integra los intervalos de confianza correspondientes a los parmetros de cada una de las variables
estudiadas.
- Para la variable cuantitativa de puntuacin en una habilidad determina el intervalo de confianza donde es ms probable que se
encuentre la media poblacional de esta calificacin.
- Para la variable cualitativa de utilidad o ventaja percibida por el trabajador determina el intervalo de confianza correspondiente a la
proporcin poblacional.

Conclusin

Podemos observar que la importancia de la estadstica no solo sirve para la solucin de algn problema sino tambin, nos ayuda a
tener informacin que representa la aproximacin de un estudio y el clculo exacto representado en tablas y en graficas. Esta nos
puede ayudar a organizar informacin de varios estudios que realizan las empresas por medio de encuestas a la poblacin en base
a algo que sea de su importancia

Por ejemplo; muchas empresas buscan o quieren saber que tan bueno es su producto, y como la poblacin es muy grande solo
escogen un lugar, supongamos una tienda comercial para poder adquirir las respuestas del publico que consume ese producto, en
base a eso se adquieren resultados para que puedan comprobar por ejemplo que de cada 100 personas 90 se sienten satisfechas
con el producto.
La estadstica tambin se puede representar por medio de graficas que sirve para poder tener ordenada la informacin adquirida y
se pueda representar de una mejor manera. Nos va a ayudar a detectar los datos ms rpidamente y a poder distinguir valores ms
altos y los ms bajos. A estas graficas se les conoce como Histogramas.

La utilizacin de las formulas en este ejemplo son las ms acertadas para poder adquirir informacin congruente y exacta, de
acuerdo a las normas de estadstica son formulas sencillas y fciles de aprender.

Para la adquisicin de las diferentes medidas de tendencia central como lo es la Media, Mediana y Moda, podemos observar que
solo basta con seguir unas sencillas formulas que se aplican en este caso a una tabla de frecuencias con datos agrupados por
intervalos, estas medidas las adquirimos para poder tener un nmero promedio que sera nuestra media, tambin para obtener el
numero central que sera nuestra mediana y para obtener el numero que ms se repite que sera nuestra moda.

En el caso de la moda no siempre existe en los datos solamente un numero que se repite varias veces sino que a veces hay
diferentes datos que se repiten varias veces y las mismas veces de otro dato a esto se le llama Bimodal cuando aparece dos datos
repetidos dos veces o multimodal cuando se repiten 3 datos con la misma cantidad de veces.

La probabilidad por ende nos sirve para poder detectar la efectividad de un resultado en general a travs de un estudio realizado
utilizando datos confiables. Es decir si un laboratorio de medicina acaba de desarrollar un nuevo medicamento contra la gripa y
quiere saber qu tan eficaz es su frmula utilizada en personas, deber tener datos exactos de el tiempo y la edad de las personas
que lo tomaron y a travs de eso saber que probabilidad hay que funcione en las personas de acuerdo a la edad que tienen y que
probabilidad hay de que no funcione en personas ms jvenes o adultas. La probabilidad nos puede ayudar a tener resultados que la
mayora de las empresas desean saber por la cuestin de lograr resultados en sus productos que venden o en su propio personal.

En la distribucin normal de la media nos ayuda mucho a representar datos que a travs de una media se puede encontrar su
porcentaje de probabilidad que tenga una reaccin a cumplir con su confirmacin de que este experimento suceda o no suceda a
esto se refiere la probabilidad y la forma de calcular una media desde el punto ms alto hasta el punto ms bajo y esta se representa
con un histograma en forma de campana que baja de manera descendente sin tocar el punto de la X que es la media y a travs de
ella darnos nmeros proporcionales a l porcentaje de reaccin de acuerdo a los datos que se quieran obtener. Para esto tambin
ocupamos una tabla de inferencias para lograr estos resultados, necesitamos el valor de la Z, ya explicado arriba y de acuerdo a
este valor sacaremos el valor representativo de la probabilidad de acuerdo a esta tabla que nos ayudara a ser mas precisos en este
dato y se pueda graficar esta grafica de la campana y obtener un resultado cabe mencionar que la probabilidad de porcentaje de un
experimento es de cero a 1, que se representan en porcentaje de 0% a 100% y los puntos medios .10, .20, .30, etc., son porcentajes
de 10, 20 y 30% de que este experimento el acto se repita cierto nmero de cantidad de veces.

La estadstica no solo nos sirve para calcular la media, mediana y la moda que nos ayudan a detectar y ordenar ciertos datos que se
aportan y quienes estn en la media, cuales se repiten mas y cul es el dato del medio sin ordenarlos. Posteriormente de acuerdo a
estos datos podemos tener probabilidades para poder saber con qu frecuencia puede suceder un acto en el experimento y cul
podra ser la probabilidad de que tenga xito o error, tambin a travs de histogramas nos podemos dar una ayuda para representar
toda la informacin de una manera ms sencilla y fcil de entender para poderla representar.

Referencias:

Bologna, E. (2013) Estadstica para psicologa y educacin (3. ed). Argentina: Brujas.
Captulo 6. Bases probabilsticas para la inferencia.
Sedano., M (2001). LA DISTRIBUCIN NORMAL. 2011, de Secretaria del Estado de la Educacin Sitio web: Disponible en Linea
Ocampo, A. (Marzo, 2017). Conceptos Bsicos de Estadstica. 03.17, de UAM Sitio web: Disponible en Lnea

Ocampo, A. (Febrero, 2017). Tabla de frecuencia agrupada en intervalos. 02.17, de UAM Sitio web: Disponible en Lnea

Ocampo, A. (Marzo, 2017). Media, Mediana y Moda, datos agrupados en intervalos. 03.17, de UAM Sitio web: Disponible en Lnea
Triola, M. (2013). Estadstica. (10a. ed.). Mxico: Pearson.

Triola, M. (2013) Estadstica. (11a. ed.). Mxico: Pearson.

You might also like