You are on page 1of 35

Curso: Mtodos Estadsticos para la Investigacin

Experimentos con uno y


dos tratamientos
Dr. Ral Benito Siche Jara

UNIVERSIDAD NACIONAL DE TRUJILLO


ESCUELA ACADMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL

DEFINICIONES
Factor: Variable (Independiente) que manipula el
investigador para estudiar sus efectos sobre la
variable dependiente.
Nivel del Factor: es cada una de las categoras,
valores o formas especficas del factor.
Tratamientos: Conjunto de condiciones experimentales que sern impuestas a una unidad
experimental en un diseo elegido. En experimentos
unifactoriales, un tratamiento corresponde a un nivel
de factor. En experimentos multifactoriales, un
tratamiento corresponde a la combinacin de niveles
de factores.
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

DEFINICIONES
Tratamiento Control: tratamiento al que no se le
aplica tratamiento alguno.

Rplicas: corridas experimentales que corresponden


a una misma combinacin de tratamientos. Son
repeticiones del experimento bajo idnticas condiciones de los factores. Objetivos: Lograr mayor precisin
en la estimacin de los efectos de los factores y de
sus interacciones, y estimar el error experimental.

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

INFERENCIA ESTADISTICA

ALEATORIA

PARMETROS
(Siempre desconocidos)

ESTADSTICOS
(conocidos)

Representativa

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

MEDIDAS DE TENDENCIA

Si tuvieramos que resumir en un slo valor


representativo todo el conjunto de observaciones,
qu valor usamos?
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

MEDIDAS DE TENDENCIA
Media

La media (media aritmtica o promedio) es el valor


caracterstico de una serie de datos cuantitativos.
Cuando el conjunto es una muestra aleatoria recibe el
nombre de media muestral.
Una de las limitaciones de la media es que es una
medida muy sensible a los valores extremos; valores
muy grandes tienden a aumentarla mientras que
valores muy pequeos tienden a reducirla, lo que
implica que puede dejar de ser representativa de la
poblacin.
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

MEDIDAS DE TENDENCIA
Moda

Valor o clase de valores que se observa con mayor


frecuencia en la muestra.
Puede no existir o no ser nico.
Funciona para cualquier tipo de dato: categricos,
ordinales numricos.

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

MEDIDAS DE TENDENCIA
Mediana
Valor que divide el rango de valores observados en
dos mitades con el mismo nmero de observaciones.
Su cmputo requiere ordenar la muestra.

Si n (n de observaciones) es impar: Me = X n 1
2

Si n es par: Me =

X n/2 X (n/2) 1
2

Ejemplo: 2, 4, 6, 7, 8, 10, 10, 11 n = 8 (par)


Me = (7+8)/2 = 7,5
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

MEDIDAS DE TENDENCIA
Robustez de la Media versus la Mediana
La media es extremadamente sensible a situaciones en
que hay valores numricamente muy distantes del
resto (outliers)
La mediana en cambio permite obtener valores ms
representativos en estos casos

Ejemplo: 1, 2, 2, 2, 3, 9

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

MEDIDAS DE TENDENCIA
Robustez de la Media versus la Mediana
Mediana

0,5000

Moda

0,4500

Media
Aritmtica

0,4000

0,3500
0,3000

0,2500
0,2000
0,1500

Q1

0,1000

Q2

Q3

Q4

0,0500
0,0000
0

Rango
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

10

MEDIDAS DE DISPERSIN

Cmo damos cuenta de la variabilidad del conjunto


de observaciones?
Podemos medir las diferencias observadas con
respecto a nuestras medidas de tendencia
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

11

MEDIDAS DE DISPERSIN
Varianza
n

1
2
s (xi x )2
n i 1

s2
x
xi
n

: Variancia Muestral
: Media Aritmtica
: i-simo valor observado
: Tamao Muestra

Promedio de las diferencias al cuadrado con respecto


a la media.

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

12

MEDIDAS DE DISPERSIN
Desviacin estndar

1 n
2
s
(
x

x
)

i
n i 1
Raz cuadrada de la varianza.
Tiene las mismas unidades de medida que las
observaciones de la muestra

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

13

MEDIDAS DE DISPERSIN
Asimetra
ndice de asimetra de Pearson
Est basado en la relacin entre la media y la moda en
distribuciones simtricas y asimtricas:
X Mo
As
sx
Si la distribucin es simtrica As ser 0
Si la distribucin es asimtrica positiva, As ser mayor que 0
Si la distribucin es asimtrica negativa, As ser menor que 0

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

14

MEDIDAS DE DISPERSIN
Curtosis
Hace referencia al apuntamiento de la distribucin en relacin
a un estndar, que es la distribucin normal.
n

C r

(X
i 1

X
)
n
i

4
x

Si la distribucin es normal (mesocrtica), el ndice vale 0


Si la distribucin es leptocrtica, el ndice es superior a 0
Si la distribucin es platicrtica, el ndice es inferior a 0

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

15

MEDIDAS DE DISPERSIN
Curtosis
Distribucin normal (estndar): Distribucin Mesocrtica
Si la distribucin es ms apuntada que la distribucin normal:
Distribucin Leptocrtica

Si la distribucin es ms achatada que la distribucin normal:


Distribucin platicrtica.

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

16

EJEMPLO
En la siguiente tabla se muestran valores del parmetro de color
L (Luminosidad) medidas en 50 rodajas de yacn utilizando
Colormetro Konica Minolta (CKM) y Sistema de Visin
Computacional (SVC):
45
11
60
45
14
10
63
90
59
52

UNT

Colormetro Konica Minolta


45
45
48
63
37
45
89
73
60
40
34
34
23
15
56
5
50
34
70
63
64
57
54
56
60
68
70
52
35
51

Dr. Ral Siche

50
8
20
67
64
67
67
24
35
36

Sistema de Visin Computacional


42.3
45.3
45
53.8
45.1
19.1
63.2
36.3
47.4
2.6
67.8
86.7
81
59.5
17.3
27.5
50
25.5
27
70
14.6
21
12.7
56
66.6
10.1
5.4
54.3
34
68.9
42.2
78.6
63
70.4
67.1
75
57
51.9
56.1
15.4
59
60
75.1
72.5
31.4
52
55.9
39.1
48.2
32.1

Mtodos estadsticos para la investigacin

17

EJEMPLO
Secuencia - SPSS
Analizar
Estadsticos descriptivos
Frecuencias

Estadsticos
CKM
N

Vlidos
Perdidos

Media
Mediana
Moda
Desv . tp.
Varianza
As imetra
Error tp. de asimetra
Curtosis
Error tp. de curtos is
Mnimo
Mximo

50
0
47.6600
50.5000
45.00
20.37466
415.127
-.341
.337
-.310
.662
5.00
90.00

SV C
50
0
47.1600
50.9500
2.60a
21.64382
468.455
-.327
.337
-.790
.662
2.60
86.70

a. Existen varias modas. Se mostrar el menor de los valores .

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

18

PRUEBA ESTADSTICA: PASOS


Paso 1

Formulacin de la Hiptesis de nulidad

Paso 2

Formulacin de la Hiptesis alternativa

Paso 3

Estadstico de la prueba y nivel de significacin

Paso 4

Clculo del valor emprico del estadstico


de la prueba

Paso 5

Decisin estadstica de aceptar o rechazar la


hiptesis nula
Rechazo de H0

UNT

Dr. Ral Siche

Si p 0,05

Mtodos estadsticos para la investigacin

19

DISTRIBUCIN DE PROBABILIDAD
Es una descripcin del conjunto de valores
posibles de X, con la probabilidad asociada a
cada uno de estos valores.

Importancia
Modela los posibles valores de un estadstico
muestral, con lo que al observar un estadstico
se puede corroborar o rechazar supuestos
(prueba de hiptesis).

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

20

DISTRIBUCIN DE PROBABILIDAD

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

21

DISTRIBUCIN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Grficas
Histograma de Frecuencias
IQR/S
Grficos de Probabilidad normal
Pruebas Formales
Shapiro Wilk
N < 50
Kolmogorov Smirnov N > 50
Test de DAgostino
N 10
Ho = Los datos siguen una distribucin normal
Ha = Los datos no siguen una distribucin normal
UNT

Dr. Ral Siche

p 0.05
p < 0.05

Mtodos estadsticos para la investigacin

22

DISTRIBUCIN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Grficas
Histograma de Frecuencias

Secuencia - SPSS
Analizar
Estadsticos descriptivos
Frecuencias
Grficos
Histograma con curva normal

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

23

DISTRIBUCIN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Grficas

Shapiro Wilk
N < 50
Kolmogorov Smirnov N > 50

Ho = Los datos siguen una distribucin normal


Ha = Los datos no siguen una distribucin normal

UNT

Dr. Ral Siche

Secuencia SPSS
Analizar
Estadsticos descriptivos
Explorar

p 0.05
p < 0.05

Mtodos estadsticos para la investigacin

24

DISTRIBUCIN NORMAL

Pruebas Paramtricas

S
Prueba de
Normalidad

Distribucin
normal

No

No
Transformacin

Pruebas No Paramtricas

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

25

PRUEBAS PARAMTRICAS

Las PRUEBAS PARAMTRICAS, generalmente


requieren para su uso, el SUPUESTO DE
NORMALIDAD, es decir, que las muestras aleatorias
se extraen de poblaciones que estn normalmente
distribuidas, o aproximadamente normal.

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

26

PRUEBAS NO PARAMTRICAS
Las PRUEBAS NO PARAMTRICAS, son mtodos que
no suponen nada acerca de la distribucin poblacin
muestreada, por eso tambin a los mtodos de la
estadstica no paramtrica se le llama de
distribucin libre.
Estos mtodos se basan ms en el anlisis de los
rangos de los datos que en las propias
observaciones.

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

27

PRUEBAS ESTADSTICAS
Datos del Experimento
Shapiro Wilk
Kolmogorov Smirnov
Test de DAgostino

Prueba de Normalidad
Transformacin
Sin Distribucin Normal

n < 50
n 50
n 10
Si los datos vienen de muestras
transformadas, se debe
continuar con estos datos hasta
el final del anlisis estadstico.

Distribucin Normal
Pruebas Paramtricas

Pruebas No Paramtricas
Comparacin de medias

2 muestras

k muestras

Wilcoxon
(Relacionadas)

Test de Friedman
(Relacionadas)

Mann Whitney
(Independientes)

Kruskal Walis
(Independientes)

Dr. Ral Siche

Test de Levene

Transformacin
Varianzas
distintas

Varianzas
iguales

1 muestra

2 muestras

K muestras

2 muestras

k muestras

Kruskal Walis
Test de Friedman

Kruskal Walis
Test de Friedman

Prueb T
(Relacionada)

ANOVA
(1 Factor)

Si al menos un
trat. es
diferente

UNT

Test de Homogeneidad de
Varianzas

Test de
Tamhane

Prueb T
(Independ.)

Mtodos estadsticos para la investigacin

Duncan y/o
Tuckey

Prueba T

Si al menos un
tratamiento es
diferente

28

PRUEBAS PARAMTRICAS

UNT

PRUEBA T

Es la Prueba Paramtrica ms poderosa que existe para determinar


diferencia entre dos poblaciones ( tratamientos), sin embargo requiere
que los datos pertenezcan a una DISTRIBUCIN NORMAL y que LAS
VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para
varianzas distintas).

ANOVA

Requiere una DISTRIBUCIN NORMAL MODERADA (ROBUSTA), sin


embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre
las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o
el Test de Friedman (No Paramtricas)

DUNCAN
Y/O TUCKEY

Pruebas de Comparaciones mltiples de medias, son robustas a la falta


de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE
VARIANZAS, caso contrario usar la Prueba Paramtrica de Tamhane.

TAMHANE

Pruebas Paramtrica de Comparaciones mltiples de medias, robusta a la


falta de normalidad, no requiere que se cumpla la igualdad de varianzas.

Dr. Ral Siche

Mtodos estadsticos para la investigacin

29

PRUEBAS NO PARAMTRICAS
WILCOXON

MANN
WHITNEY

UNT

Prueba No Paramtrica, cuya finalidad es la misma que la Prueba


T para muestras relacionadas, por lo tanto requiere que los
individuos sean los mismos en ambos tratamientos.
Prueba No Paramtrica, cuya finalidad es la misma que la Prueba
T para muestras independientes, por lo tanto NO requiere que
los individuos sean los mismos en ambos tratamientos.

FRIEDMAN

Prueba de Comparacin de medias para ms de 2 poblaciones


(tratamientos), cuyos individuo deben haber sido los mismos en
todos los tratamientos.

KRUSKAL
WALIS

Prueba de Comparacin de medias para ms de 2 poblaciones


(tratamientos), cuyos individuos no necesariamente deben
haber sido los mismos en todos los tratamientos.

Dr. Ral Siche

Mtodos estadsticos para la investigacin

30

PRUEBA T PARA 1 TRATAMIENTO


45
11
60
45
14
10
63
90
59
52

UNT

Colormetro Konica Minolta


45
45
48
63
37
45
89
73
60
40
34
34
23
15
56
5
50
34
70
63
64
57
54
56
60
68
70
52
35
51

Dr. Ral Siche

50
8
20
67
64
67
67
24
35
36

Sistema de Visin Computacional


42.3
45.3
45
53.8
45.1
19.1
63.2
36.3
47.4
2.6
67.8
86.7
81
59.5
17.3
27.5
50
25.5
27
70
14.6
21
12.7
56
66.6
10.1
5.4
54.3
34
68.9
42.2
78.6
63
70.4
67.1
75
57
51.9
56.1
15.4
59
60
75.1
72.5
31.4
52
55.9
39.1
48.2
32.1

Determinar si el valor medio


de la muestra puede ser 47

Mtodos estadsticos para la investigacin

31

PRUEBA T PARA 2 TRATAMIENTOS


45
11
60
45
14
10
63
90
59
52

UNT

Colormetro Konica Minolta


45
45
48
63
37
45
89
73
60
40
34
34
23
15
56
5
50
34
70
63
64
57
54
56
60
68
70
52
35
51

Dr. Ral Siche

50
8
20
67
64
67
67
24
35
36

Sistema de Visin Computacional


42.3
45.3
45
53.8
45.1
19.1
63.2
36.3
47.4
2.6
67.8
86.7
81
59.5
17.3
27.5
50
25.5
27
70
14.6
21
12.7
56
66.6
10.1
5.4
54.3
34
68.9
42.2
78.6
63
70.4
67.1
75
57
51.9
56.1
15.4
59
60
75.1
72.5
31.4
52
55.9
39.1
48.2
32.1

Determinar si existen (o
no) diferencias estadsticas
entre los valores de L
obtenidos por el CKM y el
SVC

Mtodos estadsticos para la investigacin

32

PRUEBA T PARA 2 TRATAMIENTOS


Prueba de Homogeneidad de Varianzas
Uno de los pasos previos a la comprobacin de si
existen diferencias entre las medias de varias
muestras es determinar si las varianzas en tales
muestras son iguales (es decir, si se cumple la
condicin de homogeneidad de varianzas), ya que de
que se cumpla o no esta condicin depender la
formulacin que empleemos en el contraste de
medias.
Test de Levene
Valor p < 0.05 No se asume varianzas iguales
Valor p > 0.05 Se asume varianzas iguales
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

33

PRUEBA T PARA 2 TRATAMIENTOS


Prueba de Homogeneidad de Varianzas
Test de Levene
Valor p < 0.05 No se asume varianzas iguales
Valor p > 0.05 Se asume varianzas iguales

Prueba T Student
Valor p < 0.05 Existen diferencias significativas
Valor p > 0.05 No existen diferencias significativas
UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

34

PRUEBA T PARA 2 TRATAMIENTOS

Prueba T Student
Valor p < 0.05 Existen diferencias significativas
Valor p > 0.05 No existen diferencias significativas
No existen diferencias significativas entre los valores de L
obtenidos con CKM en relacin a los valores de L obtenidos
con el SVC

UNT

Dr. Ral Siche

Mtodos estadsticos para la investigacin

35

You might also like