Professional Documents
Culture Documents
INVESTIGACIN
Autores:
Arana Cerna Branco Ernesto
Arruntegui Huamn Betsy Pamela
Guerrero Ojeda Guillermo Arturo
De la presente edicin:
Centro Editorial de la Universidad Seor de Sipn
Diseo de portada:
Correccin: Patricia Chavarry Ysla
Editor: Norma del Carmen Glvez Daz
Diagramacin:
CONTENIDO
Presentacin
Variable
.
- Definicin...
- Clasificacin ..
05
05
05
Muestreo
...
- Terminologa bsica en muestreo ...............
- Caractersticas de una muestra ....
- Tipos de muestreo .
- Frmulas de tamao de muestra...
08
08
09
10
15
Validez y Confiabilidad..
- Validez de un instrumento..
- Confiabilidad del Instrumento..
16
16
18
Prueba de Hiptesis ..
- Metodologa para desarrollar hiptesis..
- Resumen de Pruebas estadsticas..
- Desarrollo de pruebas..
21
21
22
23
Casos Aplicativos.....
33
Anexo
55
Referencias .........
Presentacin
La presente gua denominada Estadstica Aplicada a la Investigacin, ha sido elaborado con el fin
de que oriente, guie y sirva de complemento a los contenidos temticos desarrollados a lo largo del
proyecto e informe de investigacin, logrando implementar la metodologa estadstica en la
desarrollada en estos trabajos de investigacin que sern el pase para otorgar el ttulo profesional
a los estudiantes de todas las escuelas acadmico profesionales.
La importancia de la Estadstica dentro del proceso investigativo, es que dota al estudiante de
conocimientos que permitan describir situaciones de inters, hacer inferencias sobre la base de
observaciones y evaluar hiptesis relacionadas con alguna circunstancia prctica; adems, pueden
iniciarse en el estudio de los fenmenos y experimentos aleatorios, estableciendo el vnculo entre
los conocimientos y habilidades de los contenidos de la estadstica descriptiva e inferencial,
necesaria para generar los objetivos presentados en el trabajo de investigacin.
La presente bibliografa est compuesta por contenidos en donde se desarrolla de manera didctica
y sencilla los contenidos de la Estadstica Descriptiva, iniciando con la definicin y clasificacin de
variables hasta el desarrollo de pruebas de hiptesis que permitirn mediante los estadsticos de
prueba generar los resultados del proyecto o informe de Investigacin.
As mismo al final del presente texto se presentan casos aplicativos en donde se desarrolla la
metodologa estadstica por cada una de las facultades que tiene esta casa de estudios, mostrando
de manera adecuada la presentacin de los resultados.
Es deseo de los autores que la presente bibliografa se constituya en una herramienta de consulta
para todos los estudiantes que se encuentren elaborando un trabajo de investigacin y adems sea
un complemento acadmico para el asesor metodlogo puesto que contribuir a generar un
producto de calidad.
Los Autores
VARIABLE
DEFINICIN
Es una caracterstica que representa a aquello que vara o que est sujeto a algn
tipo de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y
mudable.
1. ELEMENTOS DE UNA VARIABLE
Segn Martnez (2012): La identificacin y definicin de variables es la
2. CLASIFICACION DE LA VARIABLE
2.1 Variables cualitativas: Son las variables que expresan distintas
cualidades, caractersticas o modalidad. Cada modalidad que se presenta
se denomina atributo o categora, sus datos se expresan mediante una
palabra, es no numrico. Las variables cualitativas pueden ser dicotmicas
cuando slo pueden tomar dos valores posibles como: s y no, hombre y
mujer, etc. o son politmicas cuando pueden adquirir tres o ms valores.
Se clasifican en variables cualitativas nominales y ordinales. (Martnez,
2012)
Lugar de nacimiento.
Color de ojos.
Partidos polticos.
Cul de estas marcas de jugo de naranja ha probado?
1. Marca A
2. Marca B
3. Marca C
4. Ninguna de las tres.
Clase social.
Grado de estudio.
Grado dentro del mando militar.
Cuntas veces a la semana toma Ud. Jugo de naranja?
1. Menos de tres veces a la semana
2. De tres a cinco veces
3. Seis a siete veces
4. Ms de siete veces
Ejemplo
El nmero de hijos por familia (1, 2, 3, 4, 5, etc).
Nmero de accidentes de trnsito por das.
Nmero de trabajadores por empresa.
MUESTREO
2. INTRODUCCIN AL MUESTREO
El muestreo es una herramienta de la investigacin cientfica. Su funcin bsica
es determinar qu parte de la realidad en estudio de la poblacin debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacin. Obtener
una muestra adecuada significa lograr una visin simplificada de la poblacin,
que reproduzca de algn modo sus rasgos bsicos. (Webster, 2008)
Grficamente
Tcnica de
Muestreo
POBLACIN
MUESTRA
Inferencia
3. MUESTREO
Se conoce con el nombre de muestreo al proceso de extraccin de una muestra
a partir de la poblacin. El proceso esencial del muestreo consiste en identificar
la poblacin qu estar representada en el estudio.
4. TERMINOLOGA BSICA EN MUESTREO
4.1 Poblacin o Universo: es un conjunto de unidades o elementos que
presentan una caracterstica comn; tambin se le considera como un
conjunto de medidas. Si la caracterstica observada ha sido medida, recibe
8
5. TIPOS DE MUESTREO
Aqu destacan los muestreos de tipo probabilstico y no probabilstico:
5.1 Muestreo Probabilstico: Se denomina probabilstico cuando los
elementos que constituyen la poblacin o universo tienen la misma
posibilidad de ser seleccionados.
Caractersticas
Se basan en el principio de la equiprobabilidad.
Cada elemento de la poblacin tiene una probabilidad conocida de
formar parte de la muestra.
Los componentes de la muestra son elegidos al azar.
Es cientfico, permite acotar el error y medir la confianza de obtener
buenas estimaciones.
Aseguran la representatividad de la muestra extrada y son por lo
tanto los ms recomendables. (Webster, 2008)
Ejemplos:
Los estudios de opinin publica ( probabilstico)
Las encuestas que realiza el INEI: (ENAHO, ENDES, etc.)
Los trabajos de investigacin cientfica.
5.1.1
11
K = N/n = 100/20 = 5
Se escoge un nmero aleatorio entre 1 y 5
Nmero seleccionado r = 4
Empezamos con el 4 y escoger cada quinto nmero
1
26
51
76
2
27
52
77
3
28
53
78
4
29
54
79
5
30
55
80
6
31
56
81
7
32
57
82
8
33
58
83
9
34
59
84
10
35
60
85
11
36
61
86
12
37
62
87
13
38
63
88
14... 39... 64... 89...
15
40
65
90
16
41
66
91
5.1.4. Muestreo por17
conglomerados:
este
42
67
92 muestreo se utiliza cuando no
existe listado, o bien las unidades estn demasiado dispersas y no permiten
18
43
68
93
llegar directamente a las fuentes de informacin. Esto nos obliga a sustituir
19
44
69
94
las unidades fsicas o elementales, por grupos de unidades, que llamaremos
20
45
70
95
conglomerados; generalmente son superficies o reas en las que se ha
21
46por la71poblacin.
96 Supongamos que se desea
dividido el espacio ocupado
47 en 72
97
realizar estudios a 22
familias
una ciudad,
cada unidad o familia se
23
48
73
98
constituye en un conglomerado, por tal razn se aplica en muestreo
24 es 49
99 la investigacin en una sola
aleatorio monoetpico,
decir, 74
se realiza
25
50
75
100
etapa. (Martinez, 2012)
Caracterstica principal
Hay una variacin considerable dentro de cada grupo, pero los grupos son
esencialmente similares entre s.
13
Cuando se conoce N
TAMAO DE
Cuando NO se conoce
N
MUESTRA
Cuando la variable
principal es
2 2
( 1) 2 + 2 2
2 2
2
CUANTITATIVA
Cuando la variable
principal es
2
( 1) 2 + 2
2
2
CUALITATIVA
Donde:
n: Tamao de muestra
Z: Nivel de confianza
E: Margen de error
2 : Varianza poblacional
: Desviacin estndar de la poblacin
P: Proporcin de la poblacin que tiene la
caracterstica de inters
Q: 1- P
N: Tamao de la poblacin
15
Nivel de
confianza
90%
Valor de
Z
1,65
95%
1,96
99%
2,58
VALIDEZ Y CONFIABILIDAD
18
Confiabilidad nula
0,54 a 0,59
Confiabilidad baja
0,60 a 0,65
Confiable
0,66 a 0,71
Muy Confiable
0,72 a 0,99
Excelente confiabilidad
1.0
Confiabilidad perfecta
19
Mtodo
Tcnica
Propsito
Test-Retest
Coeficiente de correlacin r de
Pearson
Consistencia en el tiempo
de los puntajes
Formas
equivalentes
Coeficiente de correlacin r de
Pearson
Coeficiente de
equivalencia, variacin en
el tiempo de los puntajes
Correlacin de Pearson
Divisin por
mitades
Correlacin de Spearman-Brown
Coefiente de Rulon
Establecer la
homogeneidad de los
temes al medir el
constructo
Coeficiente de Guttman
Coeficiente Alfa de Cronbach
Homogeneidad
de las
Coeficiente de Kuder Richarson 20
preguntas o
temes
20
PRUEBA DE HIPTESIS
8. Pruebas de hiptesis
Uno de los criterios ms importante en la Inferencia estadstica necesaria en la
investigacin es la prueba de hiptesis. Es decir, probar enunciados o afirmaciones
sobre los parmetros de las poblaciones.
Metodologa para desarrollar pruebas de hiptesis:
Para desarrollar una prueba de hiptesis puedes hacerlo haciendo uso de estos
siete pasos:
1 Planteamiento de hiptesis: aqu debers plantear la hiptesis nula (H0) y
la hiptesis alternativa (H1)
2 Nivel de significancia: es el valor que te ayudar a tomar la decisin de
aceptar o rechazar H0
3 Estadstico de prueba: aqu slo se plasmar la funcin pivotal.
4 Regin de aceptacin y rechazo: Se determinar en funcin a los puntos
crticos.
5 Calculamos el estadstico de prueba: se reemplaza los datos en la funcin
pivotal.
6 Decisin: en este paso se tomar la decisin de aceptar o rechazar H0.
7 Conclusin: se describir y/o dar respuesta al problema presentado.
(Webster, 2008).
21
22
Caracterstica
A (i)
1
1
1,1
2,1
.
.
1
Total n.j
muestras
2
1,2
2,2
.
.
,1
.1
,2
.2
Total A
.
1,
2,
.
.
,
.
.
..
. =
. =
=1
=1
= =1 . = =1 . = =1
Con la informacin de este cuadro se procede a realizar la prueba de
hiptesis, la cual debe seguir el procedimiento que se muestra a
continuacin.
Ejemplo
Alicia Garca es la directora de investigacin de Plaguicidas de un importante
Laboratorio en la ciudad de Chiclayo. En su proyecto actual Alicia debe
determinar si existe alguna relacin entre la clasificacin de efectividad que
los consumidores asignan a un nuevo insecticida y el sitio (urbano o rural) en
23
Urbano
Rural
Total
Arriba del
promedio
Promedio
20
11
31
40
48
Debajo del
promedio
Total
15
21
75
25
100
Solucin
1. Planteamiento de hiptesis
H0: La clasificacin y la ubicacin son independientes.
H1: La clasificacin y la ubicacin No son independientes.
2. Nivel de significancia:
=0.10
3. Estadstico de prueba
2 = =1
( )2
.;
= .
Rural
11
7.75
8
12
6
5.25
Total
31
Debajo del
promedio
Urbano
20
23.3
40
36
15
15.8
Total
75
25
100
24
48
21
1. .2 (25)(31)
=
= 7.75
(100)
. .
11 =
2. .1 (75)(48)
=
= 36
(100)
. .
11 =
2. .2 (25)(48)
=
= 12
(100)
. .
11 =
3. .1 (75)(21)
=
= 15.75
(100)
. .
11 =
3. .2 (25)(21)
=
= 5.25
(100)
. .
Estadstico de prueba:
6. Decisin
Como 2 < 2 , entonces No se rechaza la Ho
7. Conclusin
No existen suficientes evidencias estadsticas con un nivel de significacin =0,05
para afirmar que la clasificacin de la efectividad y la ubicacin donde se utiliza sean
independientes.
25
A. El coeficiente de determinacin: R2
El coeficiente de determinacin en un anlisis de regresin simple es r2, es
decir el coeficiente de correlacin al cuadrado y nos indica el porcentaje de
variaciones observadas en la variable dependiente que es explicado por las
variaciones de la variable independiente. El coeficiente de determinacin
expresa la variabilidad explicada por el modelo de regresin. A partir de l
podeos calcular el coeficiente de alineacin. Este coeficiente expresa la
proporcin de la variabilidad de la variable dependiente no explicada por el
modelo y viene dado por la siguiente expresin: [1 R2 ] (Webster,2008).
Ejemplo
Se conduce un experimento en 12 sujetos para analizar si la dosis de cierta
droga (en ml) est relacionada con el tiempo de reaccin a un estmulo en
segundos.
Droga (ml)
1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
Tiempo (segs) 1,0 0,8 1,8 1,4 2,1 1,8 2,2 3,0 2,7 3,0 4,1 4,9
Realizar un anlisis de correlacin de las variables en estudio. En el caso de que
las variables estn correlacionadas realizar un anlisis de regresin.
Grfico de dispersin del tiempo de reaccin a estmulo
versus dosis de droga
5
R = 0.8824
0
26
B. Coeficiente de correlacin
nY
n Yt X t Yt X t
2
Yt n X t2 X t
2
12 130.9 28.85 45
(12 85.7125)2 (12 204.5 452 )
= 0.939
C. Prueba t Student
Si (X,X1,X2,...,Xn) son n+1 variables aleatorias normales independientes de
media 0 y varianza 2, la variable
X
Yn
1 n 2
Xi
n i 1
Tiene una distribucin t-Student con n grados de libertad. Su funcin de
densidad es
n 1
n 1
2
2
1
x
2
f (x)
x0
n
n
n
2
27
(P) X P 1e x dx
0
Siendo
la funcin gamma de Euler con P>0. La media de la
distribucin t-Student es E(X)=0 y su varianza V(X)=n/(n-2), la cual no existe para
grados de libertad menores que 2.
T
tn
Z
2
T
tn
n
1
i
1 2
i
n
n
1
i
n
y adems,
Para calcular
n 1
( n 1) / 2
t
t
2 x2
P(T t ) f ( t )dt
dx
n
n
n
2
Sea un estadgrafo t calculado para la media con la relacin
x
t
n
28
0,375
n=120
n=2
n=11
0,125
-3,50
+3,50
8.38
s n
2.1 16
Para el cual en las tablas, para =5% y 15 gl es insignificante, y por tanto se puede
concluir que el consumo de 12 gal/h es real
D. ANLISIS DE VARIANZA
Cuando es necesario hacer comparaciones entre tres o ms medias muestrales
para determinar si provienen de poblaciones iguales utilizamos la tcnica de anlisis
de varianza. Esta tcnica se realiza utilizando la distribucin de probabilidad F vista
anteriormente. Para el uso de esta tcnica es necesario seguir los siguientes
supuestos:
1) Las poblaciones siguen una Distribucin de Probabilidad Normal
2) Las poblaciones tienen desviaciones estndar () iguales
3) Las muestras se seleccionan de modo independiente
La tcnica del anlisis de varianza descompone la variacin total en dos
componentes de variacin llamados variacin debida a los tratamientos y variacin
aleatoria.
Cuando estamos frente a un problema de anlisis de varianza lo primero que
debemos hacer es identificar en trminos del problema lo siguiente:
29
a) Planteamiento de hiptesis
Se pueden plantear en cualquiera de estas formas
H0: 1 = 2 = 3 = = c
H1: Alguna de las medias difiere
H0: Los tratamientos no producen efecto
H1: Alguno de los tratamientos produce efecto
H0: 1 = 2 = 3 = = c
H1: Algn es diferente
b) Se realizan los siguientes clculos para obtener la tabla ANOVA
TRATAMIENTO O NIVELES DEL FACTOR
1
2
j
C
Y11
Y12
Y1j
Y1c
Y21
Y22
Y2j
Y2c
Yi1
Yi2
Yij
Yic
Yn11 Yn22 Ynjj Yncc
31
T.1
n1
T.2
n2
Y .1
Y .2
T.j
nj
Y. j
T.c
Nc
Y.c
Donde:
T.j
nj
Y. j
n nj
j 1
T .. T. j
j 1
c nj
T ..2
2
SCT Yij
n
j 1 i 1
c T. j 2 T ..2
SCTr
n
j 1 n j
Fuente de
Variacin
Tratamientos
TABLA ANOVA
Grados de
Suma de
Libertad
Cuadrados
c-1
SCTr
Error
n-c
SCE
Total
n-1
SCT
32
Cuadrados
Medios
SCTr
CMTr
c 1
SCE
CME
nc
Fc
Fc
CMTr
CME
Frmula:
2
(1) 2 + 2
Donde:
n: Tamao de muestra
Z: Valor que se obtiene de la tabla
de distribucin normal y depende
del nivel de confianza (95%), = 1.96
e:Tolerancia de error, = 0.9
p: Proporcin. = 0.5
q: Proporcin. = 0.5
N: Tamao de la poblacin = 350
. . .
=
. ( ) + . . .
34
N de elementos
Cronbach
,852
1.4. RESULTADOS
Los resultados se presentarn en funcin a los objetivos planteados:
35
Tabla 1
Caractersticas sociodemogrficas de mujeres violentadas que realizaron denuncia
de maltrato en la Direccin Territorial de Polica (DIRTEPOL), Lambayeque
2015
PERFIL SOCIODEMOGRFICO
EDAD
18 - 25 aos
17
31
PROCEDENCIA
Sierra
21
39
ESTADO CIVIL
Conviviente
28
51
OCUPACIN
Ama de casa
26
47
NIVEL EDUCATIVO
Secundaria
22
40
b) Otro objetivo presentado fue: Analizar la relacin que existe entre las
necesidades de cuidado y la dinmica familiar de las mujeres violentadas
en Chiclayo, 2015.
Tabla 2
Anlisis de relacin entre las necesidades de cuidado y la dinmica familiar de las
mujeres violentadas que realizaron denuncia de maltrato en la Direccin
Territorial de Polica (DIRTEPOL), Lambayeque 2015
Correlaciones
PUNTAJE_APG PUNTAJE_NEC
AR
ESIDADES_DE
_CUIDADO
Correlacin de Pearson
FUNCIONAMIENTO_FAMIL
IAR
Sig. (bilateral)
,662**
,000
N
Correlacin de Pearson
NECESIDADES_ CUIDADO Sig. (bilateral)
55
55
,662**
,000
55
36
55
INTERPRETACIN:
Encontrando un coeficiente de correlacin de Pearson r = 0.662, se puede
concluir que existe una alta relacin entre las necesidades de cuidado y la
dinmica familiar de las mujeres violentadas.
37
38
39
40
Poblacin
La poblacin est conformada por los procesos del sistema de produccin de la
Empresa Molinera Sudamrica S.A.C., los cuales son: secado y pilado.
Muestra
Se us el muestreo no probabilstico por conveniencia el cual corresponde a los
procesos de la misma poblacin.
3.3. CONFIABILIDAD DE INSTRUMENTOS: Este trabajo de investigacin utiliz la
tcnica del cuestionario, con preguntas que se aplic al personal que labora en
la empresa Molinera Sudamrica S.A.C. Se obtuvo informacin sobre cmo se
encontraba el lugar donde trabajan, si tienen una buena comunicacin con la
parte Gerencial de dicha empresa y entre otras preguntas que ayud a
desarrollar nuestra investigacin. Para determinar la confiabilidad del mismo se
hizo uso del coeficiente alfa de Crombach, detallado en el caso 1.
3.4. RESULTADOS: Dando respuesta a los objetivos se plantearon los siguientes
resultados.
a) Objetivo 1: Diagnosticar la situacin actual de la Molinera Sudamrica
S.A.C.
41
Poblacin
La poblacin estuvo conformada por todas las emisiones del mes de julio de
2015 de los programas radiales Acuarela (2 horas diarias) y Fuego Noticias (3
horas diarias), un total de 50 emisiones.
42
Tabla 1
Total de emisiones en julio.
Programas
Acuarela
Total de
Total de emisiones al
emisiones
da
a la semana
1 emisin = 120
minutos
Fuego
1 emisin = 180
Noticias
minutos
Total
2 emisiones
Total de emisiones al
mes
5 emisiones
23 emisiones
6 emisiones
27 emisiones
11 emisiones
50 emisiones
Muestra
Para definir el tamao de la muestra se aplic la siguiente formula:
Dnde:
n= Muestra
Z= Nivel de confianza (95%)
p: Probabilidad de xito (60%)
q: Probabilidad de fracaso (40%)
E: Nivel de error (0.5%)
N: Poblacin
2
=
( 1) 2 + 2
43
Dnde:
Nh: Subpoblacin
N: Poblacin total
n: muestra Total
nh: muestra de los grupos
Tabla 2
Tabla del total de emisiones a analizadas en el mes de julio de 2015.
Programas
Subpoblacin
Muestra proporcional
Acuarela
23 emisiones
15 emisiones
Fuego Noticias
27 emisiones
17 emisiones
50 emisiones
32 emisiones
Emisiones en el mes de
julio.
y si
refuerzan la noticia.
Cabe resaltar que para las fichas de observacin es opcional la confiabilidad de
instrumentos.
4.4. RESULTADOS:
a) Objetivo 1: Diagnosticar la tendencia de la temtica tratada en los programas
periodsticos Acuarela y Fuego Noticas de la ciudad de Chiclayo emitido
durante el mes de julio de 2015
12%
1%
0%
0%
0%
0%
Policial Judicial
29%
0%
Economa
Poltica
Curiosidades
Espectculos
Cultura
0%
Deportes
Medio ambiente
Educacin
Salud
58%
45
Restaurantes
3
Alojamiento
Guiado
Transporte
10
Total
24
Junio
Agosto
Total
N Turistas
150
150
300
46
5.4. RESULTADOS:
a) Objetivo 1: Identificar el nivel de involucramiento de la administracin que
tiene a cargo el rea de Conservacin Privada Chaparri, con respecto al
Turismo de Observacin de Aves.
TABLA 1:
Presupuesto de inversin en el rea de Conservacin Privada de Chaparri
ALTERNATIVA
Frecuencia
9
8
8
7
6
5
4
3
2
2
1
0
IGUAL QUE OTRAS AREAS
PROTEGIDAS
Figura 01: Los resultados en la Tabla y Figura 01, determinan que la mayora de
funcionarios encuestados opinan, que la inversin econmica del rea de
Conservacin Privada Chaparri (Chongoyape), es igual a otras reas Protegidas
a nivel regional (Lambayeque).
47
Tabla 2.
Proyectos por ao en el rea de Conservacin Privada de Chaparri
alternativa
frecuencia
2013
2014
2015
2.5
2
1.5
1
0.5
0
FRECUENCIA
2013
2014
2015
48
CALIDAD DE SERVICIO
Alternativa
Frecuencia
Porcentaje
buena
30
50.0
mala
30
50.0
60
50
40
30
50.0
50.0
20
30
30
10
0
buena
excelente
Frecuencia
30
30
Porcentaje
50.0
50.0
49
REFERENCIAS
50