You are on page 1of 23

INGENIERÍA INDUSTRIAL

FÍSICA

ACTIVIDAD 1: PROBLEMARIO

Profesor: VERÓNICA DEL ROCIO SILVA OLVERA


Alumno: JOSÉ ARMANDO ÁVILA RODRÍGUEZ
Fecha: 17/FEBRERO/2019
1.1 Un estadístico que trabaja para un fabricante estadounidense de automóviles
desearía desarrollar un modelo estadístico para predecir el tiempo de entrega (la
cantidad de días transcurridos entre el pedido de un automóvil y la entrega real del
mismo) de los pedidos de automóviles nuevos. El estadístico piensa que existe una
relación lineal entre el número de opciones pedidas y el tiempo de entrega. Se
seleccionó una muestra aleatoria de 16 automóviles y se obtuvieron los resultados
que se presentan a continuación:

Relación del tiempo de entrega con las opciones


Número deordenadas
opciones Tiempo de entrega,
Automóvil pedidas, X Y (en días)
1 3 25
2 4 32
3 4 26
4 7 38
5 7 34
6 8 41
7 9 39
8 11 46
9 12 44
10 12 51
11 14 53
12 16 58
13 17 61
14 20 64
15 23 66
16 25 70

a) Construya un diagrama de dispersión.


b) Utilice el método de mínimos cuadrados para encontrar los coeficientes de
regresión b0 y b1.

c) Interprete el significado de la intersección con el eje Y, b 0, y la pendiente, b1, de


este problema

d) Si se tiene un pedido de un automóvil con 16 opciones, ¿cuántos días predecirá


usted que tardará la entrega?
e) Calcule el error estándar de la estimación.

f) Calcule el coeficiente de determinación, r2, e interprete su significado en el


problema.

g) Calcule el coeficiente r2 ajustado y compárelo con el coeficiente de


determinación r2.

h) Calcule el coeficiente de correlación, r.


i) Establezca una estimación de intervalo de confianza de 95% del tiempo
promedio de entrega para todos los automóviles pedidos con 16 opciones.

j) Establezca una estimación de intervalo de predicción del tiempo de entrega para


un automóvil individual que fue pedido con 16 opciones.

k) Al nivel de significación de 0.05, ¿existe evidencia de que haya una relación


lineal entre el número de opciones y el tiempo de entrega?
l) Establezca una estimación de intervalo de confianza de 95% de la pendiente
verdadera,

m) Lleve a efecto un análisis de residuos de los resultados obtenidos y determine lo


adecuado del ajuste del modelo,
n) Lleve a efecto un análisis de influencia y determine si se debe eliminar del
modelo alguna observación. Si es necesario hacerlo, vuelva a analizar el modelo
de regresión después de haber eliminado la o las observaciones y compare los
resultados con los del modelo original,

o) ¿Qué suposiciones con respecto a la relación entre el número de opciones y el


tiempo de entrega necesitaría hacer el estadístico con el propósito de utilizar
este modelo de regresión para fines de predicción en el futuro?
 Los datos deben estar normalizados.
 La ecuación de regresión lineal debe representar de manera adecuada el
Comportamiento de los datos.
 El análisis residual debe ser homogéneo y no presentar algún patrón.
 El análisis de influencia no debe presentar una observación atípica.
1.3 Al dueño de una gran cadena de expendios de helados le gustaría estudiar el
efecto de la temperatura ambiente sobre las ventas de sus productos durante la
temporada de verano. Se seleccionó una muestra aleatoria de 21 días y se
obtuvieron los resultados que se presentan a continuación:

Temperatura Venta por


alta diaria Tienda
Día (°F) (en $000)
1 63 1.52
2 70 1.68
3 73 1.80
4 75 2.05
5 80 2.36
6 82 2.25
7 85 2.68
8 88 2.90
9 90 3.14
10 91 3.06
11 92 3.24
12 75 1.92
13 98 3.40
14 100 3.28
15 92 3.17
16 87 2.83
17 84 2.58
18 88 2.86
19 80 2.26
20 82 2.14
21 76 1.98

a) Construya un diagrama de dispersión.


b) Suponiendo que haya una relación lineal, utilice el método de mínimos
cuadrados para encontrar los coeficientes de regresión b0 y b1.

c) Interprete el significado de la pendiente b1 de este problema.

d) Prediga las ventas por tienda para un día en el que la temperatura es de 83° F.

e) Calcule el error estándar de la estimación.


f) Calcule el coeficiente de determinación, r2 e intérprete su significado en este
problema.

g) Calcule el coeficiente de correlación, r.

h) Calcule el coeficiente ajustado r2 y compárelo con el coeficiente de


determinación r2.

i) Calcule la estadística de Durbin-Watson y, al nivel de significación de 0.05,


determine si existe alguna autocorrelación en los residuos.
j) Basándose en los resultados del inciso (i), ¿a qué conclusiones puede usted
llegar con respecto a la validez del modelo ajustado en el inciso (b)?
 El modelo ajustado es correcto ya que la temperatura si afecta las ventas.
k) Establezca una estimación de intervalo de confianza de 95% de las ventas
promedio por tienda para todos los días en los que la temperatura es de 83°F.

l) Establezca un intervalo de predicción para las ventas por tienda en un día en el


cual la temperatura es de 83° F.

m) Al nivel de significación de 0.05, ¿existe evidencia de que haya una relación


lineal entre la temperatura ambiental y las ventas?
n) Establezca una estimación de intervalo de confianza de 95% de la pendiente
verdadera.

o) Explique qué tan diferentes podrían ser los resultados obtenidos si el modelo
estuviera basado en una medida de la temperatura en la escala Celcius (°C).
p) Efectúe un análisis de residuos de los resultados obtenidos y determine lo
adecuado del ajuste del modelo.

q) Lleve a efecto un análisis de influencia y determine si debería eliminarse del


modelo alguna observación. Si esto es necesario, vuelva a analizar el modelo de
regresión después de eliminar la o las observaciones y compare los resultados
con los obtenidos con el modelo original.
1.5 Suponga que una compañía grande de productos de consumo desea medir la
efectividad de los diferentes medios de propaganda en la promoción de sus
productos. En especial, se van a estudiar dos tipos de medios de promoción:
propaganda en radio y televisión y propaganda en periódicos (incluyendo el costo
de los cupones de descuento). Se seleccionó una muestra de 22 ciudades cuya
población es aproximadamente igual para realizar un estudio durante un periodo de
prueba de un mes. A cada ciudad se le asignó un nivel de gastos específico para
publicidad en radio y televisión y para publicidad en periódicos. Se registraron las
ventas del producto (en miles de dólares) durante el mes de prueba, junto con los
niveles de gastos de los medios, y se tuvieron los siguientes resultados:
Problema sobre medios de publicidad

Ventas Publicidad en
Publicidad en
Ciudad (miles de radio y televisión Periódicos
(miles de dólares)
dólares) (miles de dólares)

1 973 0 40
2 1,119 0 40
3 875 25 25
4 625 25 25
5 910 30 30
6 971 30 30
7 931 35 35
8 1,177 35 35
9 882 40 25
10 982 40 25
11 1,628 45 45
12 1,577 45 45
13 1,044 50 0
14 914 50 0
15 1,329 55 25
16 1,330 55 25
17 1,405 60 30
18 1,436 60 30
19 1,521 65 35
20 1,741 65 35
21 1,866 70 40
22 1,717 70 40

Utilice un paquete de computación y lleve a cabo un análisis de regresión lineal


múltiple. Basándose en los resultados obtenidos:
a) Establezca la ecuación de regresión múltiple.

b) Interprete el significado de las pendientes en este problema.

c) Prediga las ventas para una ciudad en la cual el costo de la publicidad en radio y
televisión es de $20,000, y el de la publicidad en periódicos es también de
$20,000.

d) Calcule el coeficiente de regresión múltiple r2 e interprete su significado.

 El estadístico r2 indica que el modelo así ajustado explica 80.87% de la


variabilidad en ventas.
e) Lleve a cabo un análisis de residuos y determine lo adecuado del ajuste del
modelo.

Los puntos tienden a ajustarse razonablemente bien a la línea recta.

Los puntos no siguen ningún patrón (están distribuidos más o menos aleatoriamente
a lo largo y ancho de la gráfica).
Se concluye que el modelo se ajusta de igual manera a lo largo de los valores de Y.

f) Determine si existe una relación significativa entre las ventas y las dos variables
explicativas (publicidad en radio y televisión y publicidad en periódicos), al nivel
significación de 0.05.
g) Obtenga el valor P e interprete su significado.

La publicidad en radio y televisión y la publicidad en periódicos si afecta a las


ventas.
h) Determine si cada una de las variables explicativas hace una contribución
significativa al modelo de regresión. Basándose en estos resultados, indique el
modelo de regresión que debería utilizarse en el problema.
H0: B1 = 12.08 Hipótesis nula
H1: B1 = 12.08 Hipótesis alternativa

Significancia 10% t = 1.729


Se acepta hipótesis nula, no existe una diferencia significativa.
Debe utilizarse la regresión múltiple ya que se expresan varias variables.
i) Establezca una estimación de intervalo de confianza del 95% para la pendiente
poblacional entre las ventas y la publicidad en radio y televisión.
tα= 2.093
b2 =13.08
b2 =1.76
b2±tαSb2= 13.08±2.093 (1.76)
9.39 ≤Bi≥ 16.76
1.7 El director de operaciones de transmisión de una estación de televisión desea
estudiar la cuestión de las "horas de reserva", tiempo que se les paga a los artistas
gráficos sindicalizados que trabajan en la estación, pero durante el cual realmente
no existe ninguna actividad. Las variables que se van a tomar en cuenta son:
Horas de reserva (Y): número total de horas de reserva por semana.
Personal total presente (X1): total por semana de los días-persona trabajados
durante una semana de siete días.
Horas remotas (X2): número total de horas trabajadas por los empleados en
locaciones fuera de la planta central.
Los resultados para un periodo de 26 semanas son los siguientes:
Problema sobre horas de reserva

Horas de Personal Horas


Semana total remotas
reserva presente
1 245 338 414
2 177 333 598
3 271 358 656
4 211 372 631
5 196 339 528
6 135 289 409
7 195 334 382
8 118 293 399
9 116 325 343
0 147 311 338
1 154 304 353
2 146 312 289
3 115 283 388
14 161 307 402
15 274 322 151
16 245 335 228
17 201 350 273
18 183 339 440
19 237 327 475
20 175 328 347
21 152 319 449
22 188 325 336
23 188 322 267
24 197 317 235
25 261 315 164
26 232 331 270
Utilice un paquete de computación y lleve a cabo un análisis de regresión lineal
múltiple. Basándose en los resultados obtenidos:
a) Establezca la ecuación de regresión múltiple.

b) Interprete el significado de las pendientes en este problema.

c) Prediga las horas de reserva para una semana en la que el personal total
presente es de 310 días-persona y las horas remotas son 400.

d) Calcule el coeficiente de regresión múltiple r2 e interprete su significado.

El estadístico r2 indica que el modelo así ajustado explica 49.04% de la variabilidad


en las horas de reserva.
e) Lleve a cabo un análisis de residuos y determine lo adecuado del ajuste del
modelo.

Los puntos tienden a ajustarse razonablemente bien a la línea recta.

Los puntos no siguen ningún patrón (están distribuidos más o menos aleatoriamente
a lo largo y ancho de la gráfica).
Se concluye que el modelo se ajusta de igual manera a lo largo de los valores de Y.
f) Grafique los residuos en función del tiempo (en semanas). ¿Existe alguna
evidencia de que haya un patrón en los resultados? Explique su respuesta.

No se muestra evidencia de algún patrón en los resultados.


g) Calcule la estadística de Durbin-Watson.

h) Al nivel de significancia del 5%, ¿existe evidencia de autocorrelación positiva en


los residuos?

i) Obtenga el valor P e interprete su significado.

Las horas de reserva, afectan al personal total presente y a las horas remotas.
j) Determine si existe una relación significativa entre las horas de reserva y las dos
variables explicativas (personal total presente y horas remotas), al nivel significación
de 0.05.

k) Obtenga el valor P e interprete su significado.

Las horas de reserva, afectan al personal total presente y a las horas remotas.

l) Determine si cada una de las variables explicativas hace una contribución


significativa al modelo de regresión. Basándose en estos resultados, indique el
modelo de regresión que debería utilizarse en el problema.
H0: B1 = 0.124 Hipótesis nula
H1: B1 = 0.124 Hipótesis alternativa
Significancia 10% t = 1.714
Se acepta hipótesis nula, no existe una diferencia significativa.
Debe utilizarse la regresión múltiple ya que se expresan varias variables.

m) Establezca una estimación de intervalo de confianza del 95% para la pendiente


poblacional entre las horas de reserva semanales y el personal total presente.
tα= 2.069
b=1.767
Sb =0.379
b ± tαSb= 1.767±2.069 (0.379)
0.9828 ≤Bi≥ 2.5511

You might also like