You are on page 1of 5

PRIMER SEMESTE

UNIDAD 3. Muestreo, medidas de tendencia central y de dispersión

ACTIVIDAD 1. Muestreo
En el centro histórico y comercial de la ciudad de Hermosillo, Sonora.
Se tienen un total de 1,455 establecimientos conocidos comúnmente
como pymes, que si los clasificamos según tamaño (por número de
empleados), encontramos que siguiendo los criterios nacionales, los
establecimientos con un estrato de ocupación de a 0 a 10 personas se
concentran en el 95% del total.

Tenemos que la distribución de los establecimientos, siguiendo esta


variable es:

• Pequeña: 1382 empresas de 0 a 10 empleados.


• Mediana: 66 empresas de 11 a 30.
• Grande: 7 empresas con 31 a 100.

De estas pymes medianas (11 a 30), cuales son las más representativas de esta zona comercial de
acuerdo al número de empleados ocupados.

DATOS OBTENIDOS (NO AGRUPADOS):

Empresas con ocupación en el rango de 11 a 30 empleados.

15 14 11 16 14 18 12 21 13 25
12 16 15 16 16 12 12 17 12 20
12 21 11 15 14 16 11 13 11 20
14 14 16 18 12 14 11 16 14 12
16 11 11 12 15 19 13 12 14 13
13 16 15 24 11 12 15 17 12 15
14 17 14 16 15 23

1. Tamaño de la población de estudio y el parámetro a estudiar.

 Población de estudio: pymes medianas (de 11 a 30 empleados).


 Parámetro a estudiar. Número de empleados ocupados.

2. Enumerar a todas las unidades de análisis que integran la población, asignándoles un número
de identidad o identificación.

Número de identidad de la empresa 22


21 Total empleados ocupados

3. Definir la población de estudio (N) y el parámetro a estudiar.

Donde N = 66

a) El porcentaje de confianza (Z) con el cual se quiere generalizar los datos desde la muestra
hacia la población total. 95% de confiabilidad, entonces Z = 1.96

b) El porcentaje de error (E) que se pretende aceptar al momento de hacer la generalización. 5%


de error.

c) El nivel de variabilidad que se calcula para comprobar la hipótesis. Lo consideraremos como:


p = 0.5, y por lo tanto q = 1 – 0.5 = 0.5

Actividad 1. Muestreo Página 2 de 5


4. Determinar el tamaño óptimo de muestra (n) para el estudio.

Conociendo el tamaño de la población:

Fórmula n es el tamaño de la muestra


Z es el nivel de confianza
Z2 p q N p es la variabilidad positiva
n=
NE2 + Z2 p q q es la variabilidad negativa
N es el tamaño de la población
E es la precisión o error

Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del
5%. Si la variabilidad es de p = q = 0.5
2
Z2 p q N (1.96) (0.5)(0.5)(66) 63.3864
n= n= 2 2 = = 56
NE2 + Z2 p q (66 x 0.05 )+(1.96 x 0.5 x 0.5) 0.165+0.9604

Se ocupará una muestra de aproximadamente 56 empresas.

5. Seleccionar la muestra usando números aleatorios.

a) Numerar a los individuos de la población del 1 al N (donde N es el tamaño de la población).

1 2 3 4 5 6 7 8 9 10
15 14 11 16 14 18 12 21 13 25
11 12 13 14 15 16 17 18 19 20
12 16 15 16 16 12 12 17 12 20
21 22 23 24 25 26 27 28 29 30
12 21 11 15 14 16 11 13 11 20
31 32 33 34 35 36 37 38 39 40
14 14 16 18 12 14 11 16 14 12
41 42 43 44 45 46 47 48 49 50
16 11 11 12 15 19 13 12 14 13
51 52 53 54 55 56 57 58 59 60
13 16 15 24 11 12 15 17 12 15
61 62 63 64 65 66
14 17 14 16 15 23

1
b) Generar números aleatorios .

Seleccionar una muestra aleatoria de 10 números a eliminar, para obtener nuestra muestra de 56
empresas (n = 56)

9469960530065938484430920199507368844804841990060698988387673511403939568121425
7791187113856440355252065841181918542313340633396153447124597459208947297368412
0022943510984165069238518680855438661686648568774340590536486570684260862998711
1811548918339486630565309291983094510520900386680423119312206916780715822056911
6503836967674354492782501506725781021430984732088859208823338144458466089028979

Selecciona una fila al azar, por ejemplo la fila 2, y separa los números de 2 en 2:

77 91 18 71 13 85 64 40 35 52 52 06 58 41 18 19 18 54 23 13 34 06 33 39 61 53 44 71 24 59 74
59 20 89 47 29 73 68 41 2.

Elimino los números mayores a 66 y los que se repitan tomo solo el primero, quedando:

18 13 64 40 35 52 06 58 41 19 54 23 34 33 39 61 53 44 24 59 20 47 29.

Actividad 1. Muestreo Página 3 de 5


De izquierda a derecha, tomo los 10 primeros números:

18 13 64 40 35 52 06 58 41 19.

Esto significa que para obtener mí muestra aleatoria debo eliminar esos individuos.

18 13 64 40 35 52 6 58 41 19
17 15 16 12 12 16 18 17 16 12

c) Tomar los individuos correspondientes a los números elegidos.

Esta será nuestra muestra (n = 56) a estudiar.

15 14 11 16 14 12 21 13 25 12
16 16 16 12 12 20 12 21 11 15
14 16 11 13 11 20 14 14 16 18
14 11 16 14 11 11 12 15 19 13
12 14 13 13 15 24 11 12 15 12
15 14 17 14 15 23

ANÁLISIS DE LA INFORMACIÓN

Gráfica de tronco y hoja:

1 5416423266622215461314468416411259324335125254745
2 1501043

TABLA DE FRECUENCIAS

Datos Distribución
Distribución
obtenidos Frecuencia Frecuencia de
Frecuencia de
de la Acumulada Relativa porcentajes
porcentajes
variable acumulados
11 8 8 0.143 14.3 14.3
12 9 17 0.160 16.0 30.3
13 5 22 0.089 8.9 39.2
14 10 32 0.178 17.8 57.0
15 7 39 0.125 12.5 69.5
16 7 46 0.125 12.5 82.0
17 1 47 0.018 1.8 83.8
18 1 48 0.018 1.8 85.6
19 1 49 0.018 1.8 87.4
20 2 51 0.036 3.6 91.0
21 2 53 0.036 3.6 94.6
23 1 54 0.018 1.8 96.4
24 1 55 0.018 1.8 98.2
25 1 56 0.018 1.8 100.0

Total n = 56 100%

Actividad 1. Muestreo Página 4 de 5


CALCULAR LOS ESTADÍSTICOS DE TENDENCIA CENTRAL

Medida Formula Observaciones


Donde x i se refiere a todo y cada uno de los elementos de la
Media
muestra y n es el número total de elementos en la muestra.
a) p 1 = (n/2) Es la posición en donde se encuentra la mediana.
Mediana Si n es impar, entonces es la opción a), en caso contrario, la b).
b) p 2 = (n/2) + 1 El valor de la mediana se obtiene por observación
Moda Se obtiene el valor por observación

Aplicando, se obtienen los siguientes valores:

Para la media:

15+14+11+16+14+12+21+13+25+12+16+16+16+12+12+20+12+21+11+15+14+16+11+13+11+20+14+14+
𝑥� = 16+18+14+11+16+14+11+11+12+15+19+13+12+14+13+13+15+24+11+12+15+12+15+14+17+14+15+23
56
826
𝑥� = = 14.75
56

Para la mediana:

Es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, en
este caso ordenamos los valores de menor a mayor o lo tomamos de la tabla de frecuencias.

11 11 11 11 11 11 11 11 12 12 12 12 12 12 12 12 12 13 13 13 13 13 14 14 14 14 14 14 14 14 14
14 15 15 15 15 15 15 15 16 16 16 16 16 16 16 17 18 19 20 20 21 21 23 24 25

Utilizaremos la posición p 1 = 56/2 = 28 y p 2 = (56/2) + 1 = 29, entonces Me = p 1 + p 2 / 2. Donde el


valor de la posición 28 y el valor de la posición 29 es 14 por lo tanto Me = 14+14/2 = 14.

Para la moda:

El valor de un conjunto de datos que aparece con mayor frecuencia. Estaría determinada por
observación directa, y en este análisis correspondería al valor 14, que se presenta hasta 10 veces
en la muestra (tomado de la tabla de frecuencias).

De esta manera se puede construir la siguiente tabla:

Medida Valor Calculado Observaciones


Media 14.75
Mediana 14 Se requirió el cálculo de la frecuencia acumulada
Moda 14

BIBLIOGRAFIA

Universidad Juarez Autonoma de Tabasco. Análisis de Datos con Herramientas Estadísticas.


Recuperado de: https://sites.google.com/site/estadisticadm/b-organizacion-y-presentacon-de-datos/b-3-medidas-de-
tendencia-central

1
Jach A. (s/f) Usar una tabla de números aleatorios para seleccionar una muestra aleatoria simple.
Tomado de: http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf

Actividad 1. Muestreo Página 5 de 5

You might also like