You are on page 1of 65

ESTADISTICA DESCRIPTIVA

Profesor: Vctor Hugo Jerez G.

ESTADISTICA DESCRIPTIVA

ESTADSTICA DESCRIPTIVA CIENCIA QUE SE ENCARGA DE OBTENER, CLASIFICAR, DESCRIBIR, PRESENTAR E INTERPRETAR LOS DATOS Y SINTETIZAR SU COMPORTAMIENTO COMO INFORMACION ( NUMRICA Y GRFICA ). OBJETIVO DE LA ESTADISTICA DESCRIPTIVA OBTENER, CLASIFICAR, DESCRIBIR, PRESENTAR E INTERPRETAR LOS DATOS QUE REPRESENTAN UNA MUESTRA DE UNA DETERMINADA POBLACIN. UTILIDAD DE LA ESTADISTICA DESCRIPTIVA SINTETIZAR EL COMPORTAMIENTO DE LOS DATOS COMO INFORMACIN, YA SEA NUMRICA O GRFICA, AS COMO LOS MTODOS DE CLCULO Y LA REPRESENTACIN DE LOS ESTADISTICOS ( DE POSICIN Y DISPERSIN), QUE FACILITAN LA TOMA DE DECISIONES.

ESTADISTICA DESCRIPTIVA

ETAPAS DE LA RESOLUSION ESTADISTICA DE UN PROBLEMA 1. SE DEFINE CUIDADOSA Y COMPLETAMENTE LA SITUACIN QUE SE EST INVESTIGANDO. 2. SE OBTIENE UNA MUESTRA DE DATOS DE UNA POBLACIN APROPIADA SIGUIENDO UN PROCEDIMIENTO ESTABLECIDO Y ADECUADO. 3. LOS DATOS MUESTRALES SON CONVERTIDOS EN INFORMACIN UTILIZABLE ( ESTA INFORMACIN, NUMRICA O GRFICA, SE LLAMA ESTADISTICA DESCRIPTIVA). Y, 4. SE APLICAN LAS TEORAS DE LA INFERENCIA ESTADSTICA A LA INFORMACIN MUESTRAL PARA EXTRAER CONCLUSIONES SOBRE LA POBLACIN MUESTREADA (TALES CONCLUSIONES O RESPUESTAS SE LLAMAN INFERENCIAS).

ESTADISTICA DESCRIPTIVA

LA ESTADISTICA DESCRIPTIVA Y LA INFERENCIA ESTADISTICA ESTADISTICA DESCRIPTIVA INCLUYE LA RECOPILACIN, PRESENTACIN Y DESCRIPCIN DE DATOS. ESTADISTICA INFERENCIAL TCNICA DE INTREPRETAR LOS VALORES RESULTANTES DE LAS TCNICAS DESCRIPTIVAS, Y SU UTILIZACIN POSTERIOR PARA TOMAR DECISIONES.

ESTADISTICA DESCRIPTIVA

TRMINOS EN ESTADISTICA UNIDAD EXPERIMENTAL MBITO O FENMENO A ESTUDIAR QUE DEBE QUEDAR DEFINIDO Y DESCRITO COMO EXPERIMENTO. EXPERIMENTO ACTIVIDAD REALIZADA SEGN UN PLAN DEFINIDO CUYOS RESULTADOS PRODUCEN UN CONJUNTO DE DATOS. POBLACIN CONJUNTO DE INDIVIDUOS U OBJETOS CUYAS PROPIEDADES SE HAN DE ANALIZAR. MUESTRA SUBCONJUNTO DE UNA POBLACIN.

ESTADISTICA DESCRIPTIVA

VARIABLE CARACTERSTICA DE INTERS ACERCA DE CADA ELEMENTO DE UNA POBLACIN O UNA MUESTRA. NORMAL CUALITATIVA O ATRIBUTO ORDINAL VARIABLE DISCRETA CUANTITATIVA O NUMRICA CONTINUA

ESTADISTICA DESCRIPTIVA

VARIABLE NOMINAL VARIABLE CUALITATIVA QUE CARACTERIZA ( DESCRIBE O IDENTIFICA) A UN ELEMENTO DE UNA POBLACIN. PARA LOS DATOS RESULTANTES DE UNA VARIABLE NOMINAL, LAS OPERACIONES MATEMTICAS CARECEN DE SENTIDO E INCLUSO NO SE LES PUEDE ASIGNAR UN ORDEN EN CATEGORAS. (EJM: COLOR DE CABELLO, CIUDAD DONDE VIVE. VARIABLE ORDINAL VARIABLE CUALITATIVA QUE REPRESENTA UNA POSICIN O CLASIFICACIN, ORDENADA. (EJM: NIVEL DE SATISFACCIN; MUY SATISFECHO, SATISFECHO, ALGO SATISFECHO.

ESTADISTICA DESCRIPTIVA

VARIABLE DISCRETA VARIABLE CUANTITATIVA QUE PUEDE ASUMIR UN NMERO FINITO DE VALORES. (EJM: VARIABLE QUE TOMA SUS VALORES DE UNA RECTA NUMRICA DE LOS NATURALES). VARIABLE CONTINUA VARIABLE CUANTITATIVA QUE PUEDE ASUMIR UNA CANTIDAD INCONTABLE DE VALORES. (EJM: VARIABLE QUE TOMA SUS VALORES DE UNA RECTA NUMRICA DONDE TODAS LAS CIFRAS PERTENECEN A CONJUNTO Z ( DONDE LAS MAGNITUDES DE LOS VALORES SON INFINITESIMALES).

ESTADISTICA DESCRIPTIVA

DATO EXPRESIN DEL VALOR DE UNA VARIABLE ASOCIADA AL ELEMENTO DE UNA POBLACIN O MUESTRA. DATO (CUANTITATIVO) VALOR DE UNA VARIABLE ASOCIADO A UN ELEMENTO DE UNA POBLACIN O UNA MUESTRA. DATO CUALITATIVO O ATRIBUTO ES EL RESULTADO DE UN PROCESO QUE CATEGORIZA O DESCRIBE UN ELEMENTO DE UNA POBLACIN. ESCALAS DE MEDICIN DISTEMA DE GRADUACIN DE MEDIDAS QUE ORDENAN LOS DATOS POR VALOR DE UNA VARIABLE, QUE PUEDEN SER DE DIVERSA NDOLE (NUMERALES, ORDINALES, ENTRE OTROS).

ESTADISTICA DESCRIPTIVA

ETAPAS DE UNA INVESTIGACIN POR MUESTREO. MUESTREO. (RECOLECCIN DE DATOS). IMPLICA CONTAR CON BUENAS TCNICAS DE MUESTREO, DEBIDO A QUE LAS INFERENCIAS FINALES ESTN BASADAS EN LOS DATOS MUESTRALES. 1. DEFINICIN DE LOS OBJETIVOS DE LA INVESTIGACIN O DEL EXPERIMENTO. EXPERIMENTO. (EJM: COMPARACIN DE LA EFECTIVIDAD DE UNA VACUNA QUE SE HA UTILIZADO, RESPECTO DE UNA NUEVA). 2. DEFINICIN DE LA VARIABLE Y LAPOBLACIN DE INTERS. ( EJM: INTERS. INGRESO FAMILIAR DISP. EN EL CENTRO URBANO DE LA SERENA 3. DEFINICIN DE MTODOS DE OBTENCIN Y MEDICIN DE LOS DATOS. DATOS. (EJM: PROCEDIMENTOS DE MUESTREO, TAMAO DE LA MUESTRA Y EL INSTRUMENTO DE MEDICIN (CUESTIONARIO, POR TELFONO, E MIAL, OTROS) DE LOS DATOS. 4. RECOLECCIN DE LA MUESTRA. SELECCIONAR LOS SUJETOS A MUESTRA. SER MUESTREADOS Y RECOLECTAR LOS DATOS.

ESTADISTICA DESCRIPTIVA

5. REVISAR EL PROCESO DE MUESTREO PARA DETERMINAR LA RECOLECCIN. RECOLECCIN. (EJM: CORRECCIN DE ERRORES EN LOS DATOS GENERADOS DURANTE LA RECOLECCIN ( DATOS YA RECOLECTADOS, POSIBLEMENTE PARA OTROS FINES, LO QUE IMPOSIBILITA SABER SI LOS DATOS SON ADECUADOS O BUENOS PARA TRABAJAR. ES MEJOR RECOLECTAR UNO MISMO LOS DATOS).

TIPOS DE MUESTREO
MUESTREO DE UNA ETAPA MUESTRA ALEATORIA SIMPLE MUESTRA SISTEMTICA

DISEOS PROBABILSTICOS DISEOS MUESTRALES MUESTRAS DE JUICIO DISEOS MUESTRALES MUESTREO ALEATORIO MULTICAPA MUESTRA ALEATORIA ESTRATIFICADA MUESTRA PROPOCIONAL ESTRATIFICADA MUESTRA POR CONGLOMERADOS

ESTADISTICA DESCRIPTIVA

MARCO MUESTRAL LISTA O CONJUNTO DE ELEMENTOS QUE PERTENECEN A LA POBLACIN DE LA CUAL SE TOMA LA MUESTRA. MUESTRAS DE JUICIO MUESTRAS SELECCIONADAS EN BASE A SER CONSIDERADAS TPICAS. MUY CENTRDAS EN EL JUCIO DE LA PERSONA QUE ELABORA LA MUESTRA DE UNIDADES QUE CONSIDERA REPRESENTATIVAS DE LA POBLACIN. MUESTRAS PROBABILSTICAS AQUELLAS MUESTRAS EN QUE LOS ELEMENTOS A SELECCIONAR SE OBTIENEN CON BASE EN LA PROBABILIDAD. CADA ELEMENTO DE UNA POBLACIN TIENE CIERTA PROBABILIDAD DE SER ELEGIDO COMO PARTE DE LA MUESTRA.

ESTADISTICA DESCRIPTIVA

MUESTREO DE UNA CAPA DISEO MUESTRAL EN QUE LOS ELEMENTOS DEL MARCO MUESTRAL SE TRATAN DE LA MISMA FORMA Y NO HAY SUBDIVISIN O PARTICIN DEL MARCO MUESTRAL. MUESTREO ALEATORIO SIMPLE UNA MUESTRA QUE SE SELECCIONA DE MODO QUE TODOS LOS ELEMENTOS DE LA POBLACIN O MARCO MUESTRAL TENGAN LA MISMA PROBABILIDAD DE SER ELEGIDOS. DEL MISMO MODO, TODAS LAS MUESTRAS DE TAMAO n TIENEN IGUAL PROBABILIDAD DE SER ELEGIDAS. MUESTRA SISTEMTICA AQUELLA MUESTRA EN LA QUE SE SELECCIONA TODO K-SIMO KELEMENTO DEL MARCO MUESTRAL, EMPEZANDO CON UN PRIMER ELEMENTO QUE SE ELIGE DE MANERA ALEATORIA DE LOS PRIMEROS K ELEMENTOS.

ESTADISTICA DESCRIPTIVA

MTODOS MUESTRALES DE ETAPAS MLTIPLES MUESTREO ALEATORIO DE ETAPAS MLTIPLES


DISEO DE UNA MUESTRA EN EL QUE LOS ELEMENTOS DEL MARCO MUESTRAL SE SUBDIVIDEN Y LA MUESTRA SE ELIGE EN MS DE UNA ETAPA.

MUESTRA ALEATORIA ESTRATIFICADA


OBTENIDA AL ESTRATIFICAR LA POBLACIN, O MARCO MUESTRAL, Y LUEGO SELECCIONAR UN NMERO DE ELEMENTOS PARA CADA UNO DE LOS ESTRATOS POR MEDIO DE UNA TCNICA SENCILLA DE MUESTREO ALETORIO.

MUESTRA ESTRATIFICADA PROPORCIONAL


OBTENIDA AL ESTRATIFICAR LA POBLACIN, O MARCO MUESTRAL, Y LUEGO SELECCIONAR UN NMERO DE ELEMENTOS EN PROPORCIN AL TAMAO DE LOS ESTRATOS DE CADA UNO DE LOS ESTRATOS MEDIANTE UNA TCNICA DE MUESTREO ALEATORIO SIMPLE.

ESTADISTICA DESCRIPTIVA

MUESTRA POR CONGLOMERADOS OBTENIDA AL ESTRATIFICAR LA POBLACIN, O MARCO MUESTRAL, Y LUEGO SELECCIONAR ALGUNOS O TODOS LOS ELEMENTOS DE ALGUNO, PERO NO TODOS, LOS ESTRATOS.

TABULACIN DE DATOS, CONSTRUCCIN DE TABLAS DE FRECUENCIA. FRECUENCIA.


UNIDAD DE ANLISIS

DEFINICIN O DESCRIPCIN DE LA UNIDAD EXPERIMENTAL ( FENMENO A ESTUDIAR) PARA ASOCIAR LOS VALORES DE LOS DATOS RESULTANTES DEL EXPERIMENTO, Y SU REPRESENTACIN EN TABLAS DE FRECUENCIAS.
TIPOS DE VARIABLES VARIABLE SON EXPRESIONES CAUANTITATIVAS DE ALGUNAS PROPIEDADES DE LOS FENMENOS (PESO, ESTATURA, NMERO DE HIJOS, ENTRE OTROS). CUANTITATIVAS

VARIABLE QUE PUEDE SER EXPRESADA EN NMEROS O CIFRAS, ENTERAS Y/O FRACCIONARIAS.
CUALITATIVAS

VARIABLES QUE DESCRIBEN ATRIBUTOS O CUALIDADES DE LOS FENMENOS. EJ: PROFESIN (INGENIEROS, MDICOS, ENTRE OTROS), RAZA( EUROPEA, ASITICA, ENTRE OTRAS).

ESTADISTICA DESCRIPTIVA UNIVARIADA

VARIABLES ORDINALES

SERIE DE DATOS ESTADSTICOS DE UNA VARIABLE DONDE IMPORTA EL ORDEN O SECUENCIA CRONOLGICA (TEMPORAL). EJ: SERIE DE LA PRODUCCIN DE COBRE DE LOS LTIMOS 10 AOS.

SERIE ATEMPORAL
SERIE DE DATOS DE UNA VARIABLE DONDE NO IMPORTA EL ORDEN EN QUE SE PRESENTAN LAS OBSERVACIONES. EJ: ESTATURA, SALARIOS, PESO, ENTRE OTRAS. TABLA DE FRECUENCIA CATEGORIZACIN DE LOS DATOS DE LA VARIABLE OBTENIDA EN EL EXPERIMENTO QUE SE PRESENTAN DE MANERA INDIVIDUAL O POR TRAMOS. GRFICOS REPRESENTACIN DE UNA TABLA DE NMEROS QUE CORRESPONDE A DATOS DE UNA VARIABLE GRFICOS CIRCULARES .

ESTADISTICA DESCRIPTIVA UNIVARIADA

TABLA DE FRECUENCIA AGRUPACIN CATEGORIZADA DE LOS DATOS DE LA VARIABLE OBTENIDA EN EL EXPERIMENTO QUE SE PRESENTAN DE MANERA INDIVIDUAL O POR TRAMOS. FRECUENCIA NMERO DE VECES QUE SE REPITE LA VARIABLE POR TRAMOS O CONSIDERADA DE MANERA INDIVIDUAL. GRFICOS REPRESENTACIN DE UNA TABLA DE VALORES QUE CORRESPONDE A DATOS DE UNA VARIABLE A TRAVS DE UN TIPO DE GRFICO.

TABLA N1 PRODUCCIN DE PARTES Y PIEZAS DE UN COMPUTADOR SXX-WWW.06 SXXPERIODO 2000 AL 2010.


AO 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 TIPO PIEZA A.1 A.2 A.3 B.1 B.2 B.3 C.1 C.2 D.1 D.2 D.3 NMERO DE PIEZAS PRODUCIDAS 10 50 70 60 20 88 150 300 120 400 500

FUENTE: ELABORACIN PROP

GRFICOS CIRCULARES LLAMADOS TAMBIN DE TORTA, DEBIDO A QUE REPRESENTAN SECCIONES RELATIVAS (PORCENTUALES) DE LOS VALORES DE LA VARIABLE REFERIDO A UN INSTANTE EN EL TIEMPO.
PRODUCCIN DE PARTES Y PIEZAS DE COMPUTADOR SXX-WWW.06
A1 A.2 1%3% 28% 4% 3% 1% 5% 8% A.3 B.1 B.2 B.3 C.1 17% 23% 7% C.2 D.1 D.2 D.3

GRFICOS DE BARRA REPRESENENTA LA FRECUENCIA DE LA VARIABLE O EL VALOR DE LA VARIABLE EN CADA UNO DE LOS PERODO DE TIEMPOS CONSIDERADOS CON DATOS.
PRODUCCIN DE PARTES Y PIEZAS DEL COMPUTADOR SXX-WWW0.6. PERODO 2000 AL 2010

2000 A1 500 400 NMERO DE 300 PIEZAS PRODUCIDAS 200 100 0


TIP O DE PIEZ

2001 A.2 2002 A.3 2003 B.1 2004 B.2 2009 D.2 2006 C.1 TIPO DE 2003 B.1 PIEZAS 2000 A1 2005 B.3 2006 C.1 2007 C.2 2008 D.1 2009 D.2 2010 D.3

01/01/1900

ESTADISTICOS UNIVARIADOS

GRAFICO DE LNEAS REPRESENTAN LAS CIFRAS (EN VALOR ABSOLUTO O RELATIVO) DE LOS DATOS DE UNA VARIABLE (X) RESPECTO A OTRA (Y).
PRODUCCIN DE PIEZAS DEL COMPUTADOR SXX-WWW.06 PERODO 2000 AL 2001 CANTIDAD PRODUCIDA DE PIEZAS 600 500 400 300 200 100 0 TIPO DE PIEZA A1 A.2 A.3 B.1 B.2 B.3 C.1 C.2 D.1 D.2 D.3

TIPOS DE PIEZAS POR AO

20 09

20 03

20 07

20 01

20 05

HISTOGRAMA REPRESENTACIN DE LAS FRECUENCIAS (ABSOLUTAS) DE LOS DATOS OBSERVADOS DE LA VARIABLE. TODOS LOS INTERVALOS DE CLASES TENGAN IGUAL AMPLITUD (EJ: PERODOS DE TIEMPO; AOS, MESES, DAS, HORAS, MINUTOS, ENTRE OTROS).
PRODUCCIN DE PARTES Y PIEZAS DEL COMPUTADOR SXX-WWW.06 PERODO 2000 AL 2010 NMERO DE PIEZAS 500 400 CANTIDAD 300 PRODUCIDA DE 200 PIEZAS 100 0
A1 A.2 A.3 B.1 B.2 B.3 C.1 C.2 D.1 D.2 D.3 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

TIPO PIEZAS PRODUCIDAS POR PERODO ANUAL

HISTOGRAMA REPRESENTACIN DE LAS FRECUENCIAS (RELATIVAS) DE LOS OBSERVADOS DE LA VARIABLE.

DATOS

TODOS LOS INTERVALOS DE CLASES DEBEN TENER IGUAL AMPLITUD (EJ: PERODOS DE TIEMPO; AOS, MESES, DAS HORAS, MINUTOS, ENTRE OTROS).
FRENCUENCIA RELATIVA DE LA PRODUCCIN DE PARTES Y PIEZAS DEL
COMPUTADOR SXX-WWW.06 PERODO 2000 AL 2010.

100,00 80,00 % 60,00 40,00 20,00 0,00


A1
FRENCUENCIA RELATIVA

A.2

A.3

B.1

B.2

B.3

C.1

C.2

D.1

D.2

D.3

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

TIPO PIEZA PRODUCIDA POR AO

ESTADISTICA DESCRIPTIVA UNIVARIADA

DIAGRAMA DE CAJA BOX-PLOT BOX-

PRESENTA Y ASOCIA LAS CINCO MEDIDAS QUE SUELEN TRABAJARSE DE FORMA INDIVIDUAL. PRESENTA AL MISMO TIEMPO, INFORMACIN SOBRE LA TENDENCIA CENTRAL, DISPERSIN Y SIMETA DE LOS DATOS DE ESTUDIO. ADEMS, PERMITE IDENTIFICAR CON CLARIDAD Y DE FORMA INDIVIDUAL, OBSERVACIONES QUE SE ALEJAN DE MANERA POCO USUAL DEL RESTO DE LOS DATOS. A ESTAS OBSERVACIONES SE LES CONOCE COMO VALORES ATPICOS. POR SU FACILIDAD DE CONSTRUCCIN E INTERPRETACIN, PERMITE TAMBIN COMPARAR A LA VEZ VARIOS GRUPOS DE DATOS SIN PERDER INFORMACIN NI SATURARSE DE ELLA. ESTO HA SIDO PARTICULARMENTE IMPORTANTE A LA HORA DE ESCOGER ESTA REPRESENTACIN PARA MOSTRAR LA OPININ DE LOS ESTUDIANTES RESPECTO A LA ACTUACIN DOCENTE A TRAVS DE LAS DIVERSAS PREGUNTAS DEL INSTRUMENTO UTILIZADO.

ESTADISTICA DESCRIPTIVA UNIVARIADA

DIAGRAMA DE CAJA BOX-PLOT BOX1. LMITE SUPERIOR (LS): ES EL EXTREMO SUPERIOR DEL BIGOTE. LAS OPINIONES POR ENCIMA DE ESTE LMITE SE CONSIDERAN ATPICAS. 2. TERCER CUARTIL (Q3): POR DEBAJO DE ESTE VALOR SE ENCENTRAN COMO MXIMO EL 75% DE LAS OPINIONES DE LOS ESTUDIANTES. 3. MEDIANA: COINCIDE CON EL SEGUNDO CUARTIL. DIVIDE A LA DISTRIBUCIN EN DOS PARTES IGUALES. DE ESTE MODO, 50% DE LAS OBSERVACIONES ESTN POR DEBAJO DE LA MEDIANA Y 50% EST POR ENCIMA. 4. PRIMER CUARTIL (Q1): POR DEBAJO DE ESTE VALOR SE ENCUENTRA COMO MXIMO EL 25% DE LAS OPINIONES DE LOS ESTUDIANTES

ESTADISTICA DESCRIPTIVA UNIVARIADA DIAGRAMA DE CAJA BOX-PLOT BOX5. LMITE INFERIOR: ES EL EXTREMO INFERIOR DEL BIGOTE. LAS OPINIONES POR DEBAJO DE ESTE VALOR SE CONSIDERAN ATPICAS. 6. VALORES ATPICOS: OPINIONES QUE ESTN APARTADAS DEL CUERPO PRINCIPAL DE DATOS. PUEDEN REPRESENTAR EFECTOS DE CAUSAS EXTRAAS, OPINIONES EXTREMAS O EN EL CASO DE LA TABULACIN MANUAL, ERRORES DE MEDICIN O REGISTRO. SE COLOCAN EN LA GRFICA CON ASTERISCOS (*) O PUNTOS (.) SEGN SE ALEJAN MENOS O MS DEL CONJUNTO DE DATOS. SE UTILIZA UN SUPERNDICE NUMRICO PARA INDICAR EL NMERO DE VECES QUE APARECE ESE DATO COMO ATPICO. SE SEALAN LOS DATOS ATPICOS CON UNA CIRCUNFERENCIA (O) EN EL CASO DE SER NICA LA OBSERVACIN. EN CASO CONTRARIO, USTED SLO VER UN TRINGULO INVERTIDO ( ). SI ESTO SUCEDE, DEBE REMITIRSE AL REPORTE NUMRICO PARA VERIFICAR LA CANTIDAD DE OBSERVACIONES ATPICAS POR PREGUNTA. 7. MEDIA ARITMTICA: ES LO QUE TRADICIONALMENTE SE CONOCE COMO PROMEDIO. ORIGINALMENTE NO FORMA PARTE DEL BOXPLOT, SIN EMBARGO, SE CONSIDER SU INCLUSIN PARA DAR UNA IDEA DEL PUNTAJE GENERAL OBTENIDO POR PREGUNTA. ACTUALMENTE SE TRABAJA EN LA ELABORACIN DE ESTADISTICOS MS REPRESENTATIVOS QUE LA MEDIA ARITMTICA PARA DESCRIBIR EL CONJUNTO DE DATOS.

ESTADISTICA DESCRIPTIVA UNIVARIADA

GRAFICO LINEAL DE SERIES DE TIEMPO REPRESENTAN LAS CIFRAS (EN VALOR ABSOLUTO O RELATIVO) DE LOS DATOS DE UNA VARIABLE (Y) RESPECTO A OTRA (X) QUE CORRESPONDE A PERODOS DE TIEMPO.
Grfico n 9. Nmero de pacientes trasplantados renales en el Complexo Hospitalario "Juan Canalejo. Periodo 1981-1997. 1981-

ESTADISTICOS UNIVARIADOS

MEDIDAS DE TENDENCIA CENTRAL EN TORNO A UN VALOR CENTRAL O CARACTERSTICO. - MEDIA ARITMTICA. - MEDIA PONDERADA. - MEDIA ARMNICA. - MEDIA GEOMTRICA. - MEDIANA. - MODA.

ESTADISTICOS UNIVARIADOS

MEDIDAS DE TENDEDENCIA CENTRAL MEDIA ARTMTICA


DESARROLLADA EN LA PIZARRA DURANTE LA CLASE.

ESTADISTICA DESCRIPTIVA UNIVARIADA

MEDIA PONDERADA DESARROLLADA EN LA PIZARRA DURANTE LA CLASE. .

MEDIA ARMNICA (Mh)


SE EMPLEA PARA OBTENER UN VALOR REPRESENTATIVO DE UN CONJUNTO DE DATOS EXPRESADOS EN FORMA DE TASAS, O SEA, TANTAS UNIDADES DE UN TIPO POR CADA UNIDAD DE OTRA ESPECIE.

1 1 ! M Mh y
1 1 1 n1  n2  ...  nm y1 y2 ym 1 1 1 ! ni ! n Mh n y n Mh ! ni y i 1 Mh ! hi y i

EJERCICIO DE MEDIA ARMNICA (Mh)


EN EL CASO DE LA VARIABLE CONTINUA PARA LOS SALARIOS POR HORA: LA TABLA NECESARIA PARA CALCULAR LA MEDIA ARMNICA ES: Yi-1 - Yi-1 YiYi65 - 75,0 75,1 - 85,0 85,1 - 95,0 95,1 - 105,0 105,1 R:
h

Yi 70 80 90 100 110

ni 4 11 21 10 4 50

ni / Yi 0,0571 0,1375 0,2333 0,1000 0,0364 0,5703

115,0

n ! ni y i 50 ! ! $ 87,67 0,5703

INTERPRETACIN: LA MEDIA ARMNICA DE LOS SALARIOS ES DE $87,67 POR HORA.

MEDIA GEOMTRICA (Mg)


DE UN CONJUNTO DE VALORES ES

M g ! n x1 * x2 * x3 *...xn log M g n log M g ! hi logYi


Yi-1 - Yi-1 YiYi65 - 75,0 75,1 - 85,0 85,1 - 95,0 95,1 - 105,0 105,1 115,0 Yi 70 80 90 100 110 ni 4 11 21 10 4 50 log Yi 1,84510 1,90309 1,95424 2,00000 2,04139

n logY !
i

EN LA TABLA CONTINUA: SALARIOS POR HORA DE TRABAJADORES:

ni log Yi 7,38040 20,93399 41,03904 20,00000 8,16556 97,51899

MEDIA GEOMTRICA (Mg) DE LA TABLA DE FRECUENCIAS DE LA VARIABLE CONTINUA ES:

log log log


g

g g g

n i log Y i / anti log

! 97 , 51899 : 50 ! 1, 95038

! 89 , 20

INTERPRETACIN: EL SALARIOS MEDIO DE LA DISTRIBUCIN ES DE $ 89,20 LA HORA. INCONVENIENTES DE LA Mg: SI UNO DE LOS VALORES ES CERO, LA MEDIA RESULTA CERO. TAMPOCO SE PUEDE CALCULAR CUANDO EXISTEN VALORES NEGATIVOS EN LA DISTRIBUCIN.

EJERCICIO DE MEDIA GEOMTRICA (Mg): UN PAIS TIENE EN EL 1999 UNA POBLACIN DE 6,5 MILLONES DE HABITANTES, LA QUE SUBE EN EL 2009 A 8 MILLONES. CUL ES LA POBLACIN MEDIA DEL PERODO? CUL ES LA TASA ANUAL DE CRECIMIENTO?
R: a)

M g ! 10 6,5 * 8,0 ! 52 ! 7,21?Millones de Habi tan tesA


C 1  i ! M 6 , 5 1  i
10 n

b)

! 8 ,0
10

/ log

log 6 , 5 1  i

! log 8 , 0

log 6 , 5  10 log 1  i ! log 8 , 0 0 , 81291  10 log 1  i ! 0 , 90309 10 log 1  i ! 0 , 09018 log( 1  i ) ! 0 , 00902 / Anti log

1  i !

1 , 021 ! 2 ,1 %

i ! 1 , 021  1 i ! 0 , 021

R: a) 7,21 [MILLONES DE HABITANTES] ES LIGERAMENTE INFERIOR A LA MEDIA ARITMTICA DE 7,25 [MILLONES DE HABITANTES], COMO LA POBLACIN GENERALMENTE CRECE A UNA TASA RELATIVAMENTE CONSTANTE, LA Mg ES UNA RESPUESTA MS CORRECTA. O b) ENTONCES, EL AUMENTO DE LA DCADA (23,1%) SE OBTIENE DE UN INCREMENTO PROMEDIO ANUAL DE 2,1% QUE EN ESTE CASO ES UNA MEDIA GEOMTRICA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

MEDIANA (Me) ESTADISTICO QUE DIVIDE LA DISTRIBUCIN EN DOS GRUPOS CON IGUAL NMERO DE OBSERVACIONES. UNA VEZ ORDENADOS (DE MANERA CRECIENTE O DECRECIENTE) LOS VALORES, LA MEDIANA CORRESPONDE A TODO VALOR DE LA VARIABLE QUE SUPERE, A LO SUMO, LA MITAD DE LAS OBSERVACIONES Y QUE, AL MISMO TIEMPO, SEA SUPERADO, A LO SUMO, POR LA MITAD DE LAS OBSERVACIONES. PARA EL CALCULO DE LA Me: - SE CUENTAN (n+1) / 2 TEM DESDE CADA EXTREMO DE LA DISTRIBUCIN. - EL VALOR AL QUE SE LLEGA, EN AMBOS CASOS, ES EL CENTRAL, CON EL CUAL QUEDA DETERMINADA LA MEDIANA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

EJERCICIO: MEDIANA (Me) A.- PARA NMERO PAR DE OBSERVACIONES: A.CONSIDERE LAS SIGUIENTES OBSERVACIONES ORDENADAS DE MANERA CRECIENTE; 14 16 17 18 19 22. CUL ES EL VALOR QUE REPRESENTA LA MEDIANA DE LA DISTRIBUCIN? R: PARA EL CALCULO DE LA Me: - SE CUENTAN (n+1) / 2 TEM DESDE CADA EXTREMO DE LA DISTRIBUCIN: (7) / 2 = 3,5 QUE NO EXISTE EN LA DISTRIBUCIN, POR LO CUAL SE PUEDE OPTAR POR UN VALOR PROMEDIO ENTRE LOS DOS VALORES CENTRALES (17+18) / 2 = 17,5. EN LUGAR DE INIFINITOS VALORES ENTRE LAS OBSERVACIONES CON NMEROS 17 Y 18.

ESTADISTICA DESCRIPTIVA UNIVARIADA

EJERCICIO: MEDIANA (Me) A.A.- PARA DATOS TABULADOS: AL PARTIR DE LA DISTRIBUCIN DE FRECUENCIAS, SLO ES FACTIBLE IDENTIFICAR EL TRAMO DONDE SE ENCENTRA LA Me. EN LA SIGUIENTE TABLA, PARA EL CALCULO DE LA Me: - SE ESTABLECE LA MENOR DE LAS FRECUENCIAS ABSOLUTAS ACUMULADAS QUE SUPERA A LA MITAD DEL TOTAL DE ELEMENTOS. O SEA, ES NECESARIO ENCONTRAR EL VALOR j PARA EL CUAL Nj > n / 2. TABLA SALARIOS POR HORA.

Yi-1 - Yi-1 YiYi65 - 75,0 75,1 - 85,0 85,1 - 95,0 95,1 - 105,0 105,1 115,0

Yi 70 80 90 100 110

ni 4 11 21 10 4 50

Ni 4 15 36 46 50

ESTADISTICA DESCRIPTIVA UNIVARIADA EJERCICIO: MEDIANA (Me)

B.- PARA DATOS TABULADOS: B.-

Yi-1 - Yi-1 YiYi65 - 75,0 75,1 - 85,0 85,1 - 95,0 95,1 - 105,0 105,1 115,0

Yi
70 80 90 100 110

ni
4 11 21 10 4 50

Ni
4 15 36 46 50

Me ! Y i  1 

n  N i 1 2 ni

50  15 Me ! 85 , 0  10 2 ! 85  4 , 76 ! $ 89 , 76 21

ESTADISTICA DESCRIPTIVA UNIVARIADA EJERCICIO: MEDIANA (Me)

B.- PARA DATOS TABULADOS: B.INTERPRETACIN:

LA MITAD DE LOS TRABAJADORES GANA MENOS DE $89,76 LA HORA Y LA OTRA MITAD GANA MS DE ESA SUMA. C. PARA VARIABLES DISCRETAS Me Nj-1 < n / 2 NjLA Me CORRESPONDE AL VALOR DE LA VARIABLE DE ORDEN j, O MARCA DE CLASE DEL INTERVALO MEDIANO, O SEA: Me = Yj O Me = Yi

Me !

2  3 ! 5
2

! 2 ,5

C.- PARA DATOS TABULADOS: C.EN LA SIGUIENTE TABLA DE FRECUENCIAS DE LA VARIABLE DISCRETA NMERO DE HIJOS POR FAMILIA, LA Me: - SE ESTABLECE LA MENOR DE LAS FRECUENCIAS ABSOLUTAS ACUMULADAS QUE SUPERA A LA MITAD DEL TOTAL DE ELEMENTOS. O SEA, ES NECESARIO ENCONTRAR EL VALOR j PARA EL CUAL Nj > n / 2. Yi 0 1 2 3 4 ni 2 3 5 6 4 20 INTERPRETACIN: LA MITAD DE LAS FAMILIAS (10), TIENE MENOS DE 2,5 HIJOS, Y LA OTRA MITAD, MS DE ESA CIFRA. Ni 2 5 10 16 20 hi 0,10 0,15 0,25 0,30 0,20 Hi 0,10 0,25 0,50 0,80 1,00

MODA (Md) ES EL VALOR MS FRECUENTE EN LA DISTRIBUCIN OBSERVACIONES.

DE

65

VALOR QUE PRESENTA UNA FRECUENCIA MAYOR QUE LA DE LOS VALORES INMEDIATAMENTE ANTERIOR Y POSTERIOR. CONSTITUYE EL VALOR MS COMN O TPICO. CALCULAR LA MODA EN EL CASO DE Yi-1 - Yi-1 YiYiYi ni UNA VARIABLE CONTINUA
- 75,0 70 4 80 90 100 110 11 21 10 4 50

75,1 - 85,0 85,1 - 95,0 95,1 - 105,0 105,1 115,0

n j 1 M d ! Y j 1  c j n j 1  n j 1 EN EL CASO DE L V RI BLE CONTINU : 10 M d ! 85  10 ! 85  4,76 ! $ 89,76 11  10

ESTADISTICA DESCRIPTIVA UNIVARIADA

INTERPRETACIN: EL VALOR MS TPICO O FRECUENTE EN LOS SALARIOS POR HORA DE LOS TRABAJADORES ES DE $ 89,76.

EJERCICIO: LA PRODUCCIN DE IMPRESORAS POR HORA DE LA EMPRESA LASER JET S.A., ES DE:

27 5 18

9 17 30

15 21 16

xi 8 11 34

3 16

17 9

22 13

19 26

A UD. SE LE PIDE: A) CONTRUIR TABLA DE FRECUENCIAS CON INTERVALO 6 UNIDADES / HORA. B) CALCULE LA MEDIANA E INTERPRETE SU RESULTADO. C) CALCULE LA MODA E INTERPRETE SU RESULTADO. D) CALCULE LA MEDIA GEOMTRICA E INTERPRETE SU RESULTADO. E) CALCULE LA MEDIA ARMNICA E INTERPRETE SU RESULTADO. F) PRESENTE DE MANERA ORDENADA LOS ESTADIGRAFOS CALCULADOS Y CON SU VALOR ORDENADOS DE MENOR A MAYOR. NOTA: USE 5 DECIMLES. EL LTIMO DECIMAL SE APROXIMA; POR DEBAJO DE 0,000005 NO AUMENTA AL PRXIMO DECIMAL. POR ENCIMA DE 0,000005 SE APROXIMA AL DECIMAL INMEDIATAMENTE SUPERIOR.

ESTADISTICA DESCRIPTIVA UNIVARIADA

R: A) TABLA N1 PRODUCCIN DE IMPRESORAS POR HORA DE UN GRUPO DE TRABAJADORES DE LA EMPRESA LASER JET S.A. Yi-1 - Yi Yi0 - 6 7 - 13 14 - 20 21 28 27 34 Yi 3 10 17 24 31 ni 2 5 7 4 2 20 hi Hi Ni 2 7 logYi 0,47712 1,00000 Ni * logYi 0,95424 5,00000 8,61315 5,52084 2,98272 23,07095 ni / Yi 0,66667 0,50000 0,41177 0,16667 0,06452 1,80963

0,10 0,10 0,25 0,35

0,35 0,70 14 1,23045 0,20 0,90 18 1,38021 0,10 1,00 20 1,49136

FUENTE: ELABORACIN PROPIA EN BASE A DATOS DE LA EMPRESA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

B) MEDIANA (Me)
n j 2

1410 3er Intervalo, con C j ! 6

n  j 1 2 M e ! YJ 1  C j ni 20  7 2 3 ! 14  6 ! 14  6 ?0,42857 A M e ! 14  6 7 7 Im presoras M e ! 16,57143 } 16,6 hora

INTERPRETACIN: EN LA EMPRESA LASER JET S.A., LA MITAD DE LA PRODUCCIN ES INFERIOR A 16,6 IMPRESORAS POR HORA Y LA OTRA MITAD ES SUPERIOR A ESTA CIFRA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

C) MODA (Md)
n j 1 4 4 M d ! YJ 1  C j ! 14  6 ! 14  6 ! 14  6 ?0,44444A n j 1  n j 1 5  4 9 Im presoras M d ! 16,67 } 16,7 hora

INTERPRETACIN: EL VALOR MS TPICO O FRECUENTE DE PRODUCCIN EN LA EMPRESA LASER JET S.A. ES DE 16,7 IMPRESORAS POR HORA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

D) MEDIA GEOMTRICA (Mg)

log M g ! ni * log Yi log M g ! 23,07095 z 20 log M g ! 1,15355 / Anti log Im presoras M g ! 14,24 14,2 hora
INTERPRETACIN: EL VALOR DE LA PRODUCCIN MEDIA EN LA EMPRESA LASER JET S.A. ES DE 14,2 IMPRESORAS POR HORA O EN CADA HORA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

E) MEDIA ARMNICA (Mh)

n 20 ! Mh ! ! 11,05198 ni 1,80963 Yi Im presoras M h ! 11,1 hora


INTERPRETACIN: LA PRODUCCIN MEDIA ARMNICA DE LA EMPRESA LASER JET ES DE 11,1 IMPRESORAS POR HORA O CADA HORA.

ESTADISTICA DESCRIPTIVA UNIVARIADA

F) EL VALOR DE LOS ESTADSTICOS O ESTADGRAFOS CALCULADOS, ORDENADOS DE MANERA DESCENDENTE, SON:


Im presoras  Moda : M d 16,7 hora Im presoras  Mediana : M e 16,6 hora Im presoras  Media Geo trica : M g 14,2 hora  Media Ar nica : M h Im presoras 11,1 hora

NOTA: SE COMPRUEBA UNA PROPIEDAD DE LOS ESTADISTICOS DE TENDENCIA CENTRAL:

e M

e y

ESTADISTICA DESCRIPTIVA UNIVARIADA

MEDIDAS DE DISPERSIN
LA DISPERSIN SE CONCIBE COMO LA MAYOR O MENOR CONCENTRACIN DE LOS DATOS EN TORNO A UN VALOR CENTRAL, GENERALMENTE LA MEDIA ARITMTICA. EL MS IMPORTANTE ESTADSTICO DE DISPERSIN EN UNA DISTRIBUCIN DE FRECUENCIAS ES LA VARIANZA

S2 VARIANZA EL VALOR NUMRICO DE LA VARIANZA CUANTIFICA EL GRADO DE DISPERSIN DE LOS VALORES DE UNA DISTRIBUCIN DE FRECUENCIAS RESPECTO DE SU MEDIA ARITMTICA. A MAYOR MAGNITUD DE LAS DESVIACIONES RESPECTO DE SU MEDIA ARITMTICA, MAYOR ES EL VALOR NUMRICO DE LA VARIANZA.
FORMULA DE CLCULO:

Y

ESTADISTICA DESCRIPTIVA UNIVARIADA

LA VARIANZA SE EXPRESA EN UNIDADES DISTINTAS DE LA VARIABLE ORIGINAL. CUANDO LA VARIABLES ES ESTATURA EN CENTMETROS, LA VARIANZA SE CUANTIFICA EN CENTMETROS CUADRADOS. POR ESTA RAZN SE PREFIERE UTILIZAR OTRO ESTADGRAFO DE DISPERSIN: LA DESVIACIN ESTNDAR. DESVIACIN ESTNDAR O TPICA. (S). (S). SE DEFINE COMO LA RAIZ CUADRADA DE LA VARIANZA. LA DESVIACIN TPICA SE EXPRESA EN LAS MISMAS UNIDADES QUE LA VARIABLE ORIGINAL. EJEMPLO: SI LA S=10,29, DE DONDE 1,5 S=15,44. ENTONCES, DEBE HABER POR LO MENOS, 27 PERSONAS (55,5% DE 50) CUYOS SALARIOS OSCILAN ENTRE $89,80-15,44=$74,36 Y $89,8089,80+15,44=$105,24.
y - 1,5 S y + 1,5 S

ESTADISTICA DESCRIPTIVA UNIVARIADA

 1W  0,75W  0,50W  0, 25W

0,25W

0,50W

0,75W 1W

TRAMOS EN QUE SE DISTRIBUYE TODA LA MUESTRA DE DATOS DE LA DISTRIBUCIN DE FRECUENCIAS DE LAS VARIABLES.

S!W

ESTADISTICA DESCRIPTIVA UNIVARIADA

RANGO O RECORRIDO CORRESPONDE A LA DIFERENCIA ENTRE EL MAYOR Y MENOR VALOR DE LAS OBSERVACIONES. EN DATOS TABULADOS, EL RANGO ES LA DIFERENCIA ENTRE EL LMITE SUPERIOR DEL LTIMO INTERVALO Y EL LMITE INFERIOR DEL PRIMER INTERVALO FORMULA DE CLCULO: Li = Ym Yo EJEMPLO: L1= 115 66 =49 Y L1= 115 65 = 50

NO REVELA NADA ACERCA DE LA DISTRIBUCIN DE FRECUENCIAS, NI DE LA DISPERSIN, POR LO QUE SU UTILIZACIN ES MUY RESTRINGIDA. SUELE UTILIZARSES EN EL CONTROL DE CALIDAD, DEBIDO A QUE, LAS DISTINTAS MUESTRAS QUE SE CONSIDERAN EN CADA CASO SON DEL MISMO TAMAO, LA VARIACIN DEL RECORRIDO SEALA TAMBIN UNA ALTERACIN EN LA PRODUCCIN DE LOS ELEMENTOS OBSERVADOS.

ESTADISTICA DESCRIPTIVA UNIVARIADA

RANGO INTERCUARTIL O RANGO INTERCUARTLICO ES LA DIFERENCIA ENTRE LA TERCERA Y PRIMERA CUARTILAS DE LA DISTRIBUCIN, POR LO CUAL COMPRENDE EL 50% CENTRAL DE LAS FRECUENCIAS: FORMULA DE CLCULO:

L1 ! Q3  Q1
4

EJEMPLO L 1 ! 96,50 82,72 = 13,78


4

AL IGUAL QUE LA MEDIANA BUSCA ELIMINAR LAS INFLUENCIAS DE LOS VALORES EXTREMOS.

ESTADISTICA DESCRIPTIVA UNIVARIADA

RANGO INTERCUARTIL O RANGO INTERCUARTLICO ES LA DIFERENCIA ENTRE LA TERCERA Y PRIMERA CUARTILAS DE LA DISTRIBUCIN, POR LO CUAL COMPRENDE EL 50% CENTRAL DE LAS FRECUENCIAS: FORMULA DE CLCULO:

L1 ! Q3  Q1
4

EJEMPLO L 1 ! 96,50 82,72 = 13,78


4

AL IGUAL QUE LA MEDIANA BUSCA ELIMINAR LAS INFLUENCIAS DE LOS VALORES EXTREMOS.

ESTADISTICA DESCRIPTIVA UNIVARIADA

COEFICIENTE DE VARIACIN REPRESENTA CUANTO VARA LA DESVIACIN TPICA RESPECTO DE LA MEDIA ARITMTICA. FORMULA DE CLCULO S d! y EJEMPLO: CASO VISTO DE SUELDOS;
d! S $10,29 ! ! 0,115 *100 ! 11,5% y $89,80

EL COEFICIENTE DE VARIACIN SIRVE CUANDO LAS VARIABLES DE DOS DISTRIBUCIONES SE EXPRESAN EN UNIDADES DIFERENTES (AOS Y TONELADAS, POR EJEM). EL INCONVENIENTE DEL CV ES QUE, ES DIFERENTE CUANDO DOS DISTRIBUCIONES TIENEN IGUAL VARIANZA PERO DISTINTA MEDIA ARITMTICA .

ESTADISTICA DESCRIPTIVA UNIVARIADA

EJERCICIO: DADA LA DISTRIBUCIN DE FRECUENCIAS QUE APARECE EN LA SIGUIENTE TABLA N1, TABLA N1 REMUNERACIONES DE LOS TRABAJADORES NO CALIFICADOS DE LA EMPRESA BUENA ESPERANZA EN EL AO 2010. (EN MILES $) Yi-1 - Yi-1 YiYi200 - 300 301 - 400 401 - 500 501 - 600 601 - 700 ni 8 15 30 12 8 80
FUENTE: EMPRESA BUENA ESPERANZA

CALCULE, LAS MEDIDAS DE TENDENCIA CENTRAL Y LOS ESTADGRAFOS DE POSICIN VISTOS EN CLASES.

ESTADISTICA DESCRIPTIVA UNIVARIADA

MEDIDAS DE POSICIN PERCENTILES.

ESTADISTICA DESCRIPTIVA UNIVARIADA

CUANTILES.

ESTADISTICA DESCRIPTIVA UNIVARIADA

DECILES

ESTADISTICA DESCRIPTIVA UNIVARIADA

You might also like