Professional Documents
Culture Documents
c) Script de R
Mujer=rbind(75,77,78,79,77,73,78,79,78,80)
class(Mujer)
hist(Mujer,col="10")
summary(Mujer)
var(Mujer)
sd(Mujer)
boxplot(Mujer)
qqnorm(Mujer)
qqline(Mujer)
shapiro.test(Mujer)
SUPUESTOS
PRUEBA DE NORMALIDAD
Dado que el valor p=0,227 es mayor que 0,05 la prueba no es significativa al 5%,
es decir, los datos provienen de una población normalmente distribuida.
Hombre=rbind(74,72,77,76,76,73,75,73,74,75)
hist(Hombre,col="4")
summary(Hombre)
var(Hombre)
sd(Hombre)
boxplot(Hombre)
qqnorm(Hombre)
qqline(Hombre)
shapiro.test(Hombre)
Dado que el valor p=0,8486 es mayor que 0,05 la prueba no es significativa al 5%,
es decir, los datos provienen de una población normalmente distribuida.
PRUEBA DE VARIANZAS
data=data.frame(Mujer,Hombre)
data
attach(data)
Mujer=as.numeric(Mujer)
is.numeric(Mujer)
Hombre=as.numeric(Hombre)
is.numeric(Hombre)
var.test(Mujer,Hombre)
Como el valor p es mayor a 0,05 no se rechaza la hipótesis nula, es decir, que con
una confianza del 95% se puede asumir que las varianzas poblacionales son
iguales.
𝐻𝑜: 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
t.test(Mujer,Hombre,
alternative = c("two.sided"),
mu = 0, paired = FALSE, var.equal = TRUE,
conf.level = 0.95)
𝐻𝑜: 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
SUPUESTOS
NORMALIDAD
T_baja=rbind(17.2,21.4,17.5,20.9,18.6,19.8,15.9,20.4,16.4,20.6)
class(T_baja)
hist(T_baja,col="10")
summary(T_baja)
var(T_baja)
sd(T_baja)
boxplot(T_baja)
qqnorm(T_baja)
qqline(T_baja)
shapiro.test(T_baja)
Dado que el valor p=0,3151es mayor que 0,05 la prueba no es significativa al 5%,
es decir, los datos provienen de una población normalmente distribuida.
T_alta=rbind(17.3,21.0,16.8,20.8,18.4,19.9,16.7,21.1,17.6,20.3)
hist(T_alta,col="4")
summary(T_alta)
var(T_alta)
sd(T_alta)
boxplot(T_alta)
qqnorm(T_alta)
qqline(T_alta)
shapiro.test(T_alta)
Dado que el valor p=0,08527 es mayor que 0,05 la prueba no es significativa al
5%, es decir, los datos provienen de una población normalmente distribuida.
d) PRUEBA DE VARIANZAS
var.test(T_baja,T_alta)
Como el valor p es mayor a 0,05 no se rechaza la hipótesis nula, es decir, que con
una confianza del 95% se puede asumir que las varianzas poblacionales son
iguales.
b) INTEVALO DE CONFIANZA
t.test(T_baja,T_alta,
alternative = c("two.sided"),
mu = 0, paired = FALSE, var.equal = TRUE,
conf.level = 0.95)
e.
data=data.frame(T_baja,T_alta)
data
attach(data)
T_baja=as.numeric(T_baja)
is.numeric(T_baja)
T_alta=as.numeric(T_alta)
is.numeric(T_alta)
boxplot(data)
Como se concluyó en el punto c) es claro encogimiento promedio sufrido es igual
para las dos temperaturas.
a) SUPUESTOS
Ruta_A=rbind(18,24,30,21,32)
class(Ruta_A)
hist(Ruta_A,col="10")
summary(Ruta_A)
var(Ruta_A)
sd(Ruta_A)
boxplot(Ruta_A)
qqnorm(Ruta_A)
qqline(Ruta_A)
shapiro.test(Ruta_A)
Como el valor p=0,6723 es mayor que 0,05 la prueba no es significativa al 5%, es
decir, los datos provienen de una población normalmente distribuida.
Ruta_B=rbind(22,29,34,25,35)
hist(Ruta_B,col="4")
summary(Ruta_B)
var(Ruta_B)
sd(Ruta_B)
boxplot(Ruta_B)
qqnorm(Ruta_B)
qqline(Ruta_B)
shapiro.test(Ruta_B)
PRUEBA DE VARIANZAS
var.test(Ruta_A,Ruta_B)
Como el valor p es mayor a 0,05 no se rechaza la hipótesis nula, es decir, que con
una confianza del 95% se puede asumir que las varianzas poblacionales son
iguales.
PRUEBA DE HIPOTESIS
t.test(Ruta_A,Ruta_B,
alternative = c("two.sided"),
b) Script de R
data=data.frame(Ruta_A,Ruta_B)
data
attach(data)
Ruta_A=as.numeric(Ruta_A)
is.numeric(Ruta_A)
Ruta_B=as.numeric(Ruta_B)
is.numeric(Ruta_B)
boxplot(data)
De acuerdo a la figura y sin hacer la respectiva prueba de hipótesis se escogería la
ruta A, pero como se comprobó en el literal a) se estaría incurriendo en un error
tipo II.
c) Una mejor manera de obtener los datos es asignado los mismos choferes a
las dos rutas y haciendo una prueba pareada.
a) Nnn
b) SUPUESTOS
NORMALIDAD
Proveedor_1=rbind(21.38,20.13,19.12,19.85,20.54,18.00,22.24,21.94,19.07,18.60,
21.89,22.60,18.10,19.25)
class(Proveedor_1)
hist(Proveedor_1,col="10")
summary(Proveedor_1)
var(Proveedor_1)
sd(Proveedor_1)
boxplot(Proveedor_1)
qqnorm(Proveedor_1)
qqline(Proveedor_1)
shapiro.test(Proveedor_1)
Proveedor_2=rbind(21.51,22.22,21.49,21.91,21.52,22.06,21.51,21.29,22.71,22.65,
21.53,22.22,21.92,20.82)
hist(Proveedor_2,col="4")
summary(Proveedor_2)
var(Proveedor_2)
sd(Proveedor_2)
boxplot(Proveedor_2)
qqnorm(Proveedor_2)
qqline(Proveedor_2)
shapiro.test(Proveedor_2)
Dado que el valor p=0,2853 es mayor que 0,05 la prueba no es significativa al 5%,
es decir, los datos provienen de una población normalmente distribuida.
c) PRUEBA DE VARIANZAS
var.test(Proveedor_1,Proveedor_2)
HIPOTESIS
𝐻𝑜: 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
t.test(Proveedor_1,Proveedor_2,
alternative = c("two.sided"),
conf.level = 0.95)
Como el valor p es menor a 0,05 se rechaza la hipótesis nula, es decir, se tiene una
confianza del 95% que los promedios poblacionales de los diámetros de la piezas
de los dos proveedores no son iguales.
t.test(Proveedor_1)
t.test(Proveedor_2)
Como las especificaciones del diámetro 20,25 +/- 2,25 es (18 ; 22,5), de acuerdo al
intervalo de confianza el proveedor 2 produce menos piezas defectuosas.
a)
HIPOTESIS
𝐻𝑜: 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
b) Estadístico de prueba
NORMALIDAD
Barra_1=rbind(939,976,1025,1034,1015,1015,1022,815)
class(Barra_1)
hist(Barra_1,col="10")
summary(Barra_1)
var(Barra_1)
sd(Barra_1)
boxplot(Barra_1)
qqnorm(Barra_1)
qqline(Barra_1)
shapiro.test(Barra_1)
Como el valor p=0,0061 es menor que 0,05 la prueba es significativa al 5%, es
decir, los datos no provienen de una población normalmente distribuida.
Barra_2=rbind(1025,938,1015,983,843,1053,1038,938)
hist(Barra_2,col="4")
summary(Barra_2)
var(Barra_2)
sd(Barra_2)
boxplot(Barra_2)
qqnorm(Barra_2)
qqline(Barra_2)
shapiro.test(Barra_2)
wilcox.test(Barra_1,Barra_2,paired=FALSE,conf.level=0.95)
ESTADISTICO DE PRUEBA
CON
e) IGUALDAD DE VARIANZAS
var.test(Barra_1,Barra_2)
HIPOTESIS
𝐻𝑜: 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
b)
SUPUESTOS
NORMALIDAD
T1=rbind(76,85,74,78,82,75,82)
class(T1)
hist(T1,col="10")
summary(T1)
var(T1)
sd(T1)
boxplot(T1)
qqnorm(T1)
qqline(T1)
shapiro.test(T1)
T2=rbind(57,67,55,64,61,63,63)
hist(T2,col="4")
summary(T2)
var(T2)
sd(T2)
boxplot(T2)
qqnorm(T2)
qqline(T2)
shapiro.test(T2)
IGUALDAD DE VARIANZAS
var.test(T1,T2)
t.test(T1,T2,
alternative = c("two.sided"),
conf.level = 0.95)
Como el valor p es menor a 0,05 se rechaza la hipótesis nula, es decir, se tiene una
confianza del 95% que los promedios poblacionales de los tiempos de cocción es
diferente en los dos tratamientos.
Por el valor crítico de tablas se deben utilizar los grados de libertad n1+n2-2 = 7+7-
2=12
d) IGUALDAD DE VARIANZA
data=data.frame(T1,T2)
data
attach(data)
T1=as.numeric(T1)
is.numeric(T1)
T2=as.numeric(T2)
is.numeric(T2)
boxplot(data)
HIPOTESIS
𝐻𝑜: 𝜇1 ≤ 𝜇2
𝐻1 : 𝜇1 > 𝜇2
SUPUESTOS
Texcoco=rbind(60,40,95,55,40,20,10,10,55,15,35,25,70,20,20)
class(Texcoco)
hist(Texcoco,col="10")
summary(Texcoco)
var(Texcoco)
sd(Texcoco)
boxplot(Texcoco)
qqnorm(Texcoco)
qqline(Texcoco)
shapiro.test(Texcoco)
Como el valor p=0,1512 es mayor que 0,05 la prueba no es significativa al 5%, es
decir, los datos provienen de una población normalmente distribuida.
Celaya=rbind(95,100,70,40,35,100,30,100,100,100,25,15,85,15,30)
hist(Celaya,col="4")
summary(Celaya)
var(Celaya)
sd(Celaya)
boxplot(Celaya)
qqnorm(Celaya)
qqline(Celaya)
shapiro.test(Celaya)
Como el valor p=0,004754 es menor que 0,05 la prueba es significativa al 5%, es
decir, los datos no provienen de una población normalmente distribuida.
wilcox.test(Celaya,Texcoco,
alternative = c("greater"),
conf.level = 0.95)
Como el valor p=0,02766 es menos a 0,05 se rechaza la Ho, es decir, se puede
estar 95% seguro que el porcentaje promedio del hongo es mayor en Celaya que
en Texcoco, esta afirmación se confirma con la figura de Box-plot.
b) DIAGRAMA DE DISPERSIÓN3
Texcobertura=rbind(60,40,95,55,40,20,10,10,55,15,35,25,70,20,20)
Texgramos=rbind(122.6,182.74,203.45,84.03,128.46,31.85,12.81,57.05,145.83,49.
49,103.66,95.05,125.02,40.57,19.36)
plot(Texcobertura,Texgramos)
De acuerdo al diagrama de dispersión si parece haber una relación lineal directa
entre el % de cobertura de la mazorca con los gramos de huitlacoche.
c) HIPOTESIS
𝐻𝑜: 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
SUPUESTOS
NORMALIDAD
Texgramos=rbind(122.6,182.74,203.45,84.03,128.46,31.85,12.81,57.05,145.83,49.
49,103.66,95.05,125.02,40.57,19.36)
Celayagramos=rbind(231.80,346.74,231.41,141.49,149.69,291.28,86.03,158.74,1
67.25,120.89,19.70,22.08,134.02,28.76,24.87)
summary(Texgramos)
summary(Celayagramos)
var(Texgramos)
var(Celayagramos)
shapiro.test(Texgramos)
shapiro.test(Celayagramos)
De acuerdo a los valore p mayores a 0.05, existe normalidad en los datos de las 2
poblaciones.
t.test(Texgramos,Celayagramos,
alternative = c("two.sided"),
MActual=rbind(1.88,1.84,1.83,1.90,2.19,1.89,2.27,2.03,1.96,1.98,2.00,1.92,1.83,1.
94,1.94,1.95,1.93,2.01)
class(MActual)
hist(MActual,col="10")
summary(MActual)
var(MActual)
sd(MActual)
boxplot(MActual)
qqnorm(MActual)
qqline(MActual)
shapiro.test(MActual)
Como el valor p=0,0099 es menor que 0,05 la prueba es significativa al 5%, es
decir, los datos no provienen de una población normalmente distribuida.
MNuevo=rbind(1.87,1.90,1.85,1.88,2.18,1.87,2.23,1.97,2.00,1.98,1.99,1.89,1.78,1.
92,2.02,2.00,1.95,2.05)
hist(MNuevo,col="4")
summary(MNuevo)
var(MNuevo)
sd(MNuevo)
boxplot(MNuevo)
qqnorm(MNuevo)
qqline(MNuevo)
shapiro.test(MNuevo)
wilcox.test(MActual,MNuevo,paired=TRUE,conf.level=0.95)
Como el valor p es mayor a 0,05 no se rechaza la hipótesis nula, es decir, se tiene
una confianza del 95% que la densidad mínima promedio no es diferente en los dos
métodos.
El criterio de apareamiento es que a los mismos discos se les aplica los dos
métodos.
wilcox.test(MActual,MNuevo,
alternative = c("two.sided"),
mu = 0, paired = FALSE,var.equal = TRUE,
conf.level = 0.95)
data=data.frame(MActual,MNuevo)
data
attach(data)
MActual=as.numeric(MActual)
is.numeric(MActual)
MNuevo=as.numeric(MNuevo)
is.numeric(MNuevo)
boxplot(MActual,MNuevo)
Aunque los resultados de los dos análisis es el mismo no es correcto tomar los
métodos como muestras independientes ya que la prueba se está haciendo sobre
el mismo disco y allí se pierde el criterio de independencia.
d) INTERVALO DE CONFIANZA
La diferencia entre los dos intervalos es que por muestras independientes es mayor,
es decir tiene menos precisión.
SUPUESTOS
NORMALIDAD
BolaX=rbind(75,46,57,43,58,32,61,56,34,65)
class(BolaX)
hist(BolaX,col="10")
summary(BolaX)
var(BolaX)
sd(BolaX)
boxplot(BolaX)
qqnorm(BolaX)
qqline(BolaX)
shapiro.test(BolaX)
class(BolaY)
hist(BolaY,col="10")
summary(BolaY)
var(BolaY)
sd(BolaY)
boxplot(BolaY)
qqnorm(BolaY)
qqline(BolaY)
shapiro.test(BolaY)
.Como el valor p=0,9597 es mayor que 0,05 la prueba no es significativa al 5%, es
decir, los datos provienen de una población normalmente distribuida.
var.test(BolaX,BolaY)
t.test(BolaX,BolaY,
alternative = c("two.sided"),
conf.level = 0.95)
t.test(BolaX,BolaY,
alternative = c("two.sided"),
conf.level = 0.95)
Como el valor p=0,3353 es mayor a 0,05 no se rechaza la Ho, es decir, se puede
estar 95% que los promedios de las mediciones de dureza es igual en las dos bolas.
𝐻𝑜: 𝜇𝑑 ≤ 0
𝐻1 : 𝜇𝑑 ˃ 0
SUPUESTOS
NORMALIDAD
SinAditivo=rbind(20,31,16,22,19,32,25,18,20,19)
class(SinAditivo)
hist(SinAditivo,col="10")
summary(SinAditivo)
var(SinAditivo)
sd(SinAditivo)
boxplot(SinAditivo)
qqnorm(SinAditivo)
qqline(SinAditivo)
shapiro.test(SinAditivo)
.Como el valor p=0,063 es mayor que 0,05 la prueba no es significativa al 5%, es
decir, los datos provienen de una población normalmente distribuida.
ConAditivo=rbind(23,34,15,21,22,31,29,20,24,23)
class(ConAditivo)
hist(ConAditivo,col="10")
summary(ConAditivo)
var(ConAditivo)
sd(ConAditivo)
boxplot(ConAditivo)
qqnorm(ConAditivo)
qqline(ConAditivo)
shapiro.test(ConAditivo)
t.test(ConAditivo,SinAditivo,
alternative = c("greater"),
mu = 0, paired = TRUE, var.equal = TRUE,
conf.level = 0.95)
b) INTERVALOS DE CONFIANZA