You are on page 1of 23

Actividad 2

Biometría y Diseño Experimental

Nelson A Cediel Martínez

Universidad Nacional Abierta y a Distancia UNAD


Mayo de 2019

Notas de Autor:

Biometría y Diseño Experimental

Nelson A Cediel Martínez

Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente ECAPMA


Universidad Abierta y a Distancia
Tarea 2 – Actividad Intermedia
Conocer las medidas de tendencia central, distribución de
frecuencias, gráficas, principios de probabilidad y muestreo

Presentador por:
Nelson A Cediel Martínez

Presentado a:
Jessica Almeida Braga

Biometría y Diseño Experimental

Universidad Nacional Abierta y a Distancia UNAD

Especialización en Biotecnología agrícola

Biometría y Diseño experimental

Bucaramanga, Mayo de 2019


Introducción

El registro de observaciones es una práctica común en el marco de la investigación.

Estas observaciones surgen como resultado de un proceso de observación bajo

condiciones dadas o de un proceso experimental. Generalmente la información

registrada en un proceso de observación es tratada, en un primer momento, con el

objetivo de describir y resumir sus características más sobresalientes. Una de las

características fundamentales de la época actual es la necesidad de poseer sólidos

conocimientos en el uso de las herramientas estadísticas, por el papel que esta ocupa en

la solución eficiente en las investigaciones científicas, sin embargo, en el ámbito

internacional se reportan dificultades en su aprendizaje en todos los niveles, así como

problemas de preparación estadística que en general poseen los profesionales de otras

ramas. Paralelamente está la necesidad de actualizarse en modelos y otras herramientas

estadísticas de avanzada cuyo uso favorecen las investigaciones y sistemas productivos.


Cuestionario:

El estudiante participará a través de sus aportes personales sobre el siguiente

cuestionario de preguntas. Debe analizar y responder:

a. ¿Qué es estadística? Informe dos utilizaciones de la estadística en su vida

diaria.

Se designa con el nombre de estadística a aquella ciencia que ostenta en sus bases una

fuerte presencia y acción de las matemáticas y que principalmente se ocupa de la

recolección, análisis e interpretación de datos que buscan explicar las condiciones en

aquellos fenómenos de tipo aleatorio.

En el campo laboral

En la empresa avícola donde laboro la estadística suele ser empleada en distintas áreas

como la planeación estratégica se apoya fundamentalmente en estudios de pronósticos

y de presupuestos. Los mecanismos de control, a cargo de los diferentes departamentos,

se aplican en función de los resultados históricos obtenidos a partir de estudios

estadísticos.

En las finanzas personales

La planificación financiera de una persona es el vívido ejemplo de la aplicación de la

estadística en la vida diaria. La relación entre los ingresos y los egresos determinan la

situación actual de la persona. Estos datos sirven de fundamento histórico para la


planificación de compromisos sucesivos (proyecciones) que requieren el trazado de

ciertas estrategias para ser logrados

b. ¿Qué es la estadística descriptiva? Y ¿cuáles pueden ser los usos potenciales de está

en su profesión?

La estadística descriptiva describe los atributos principales de un conjunto de datos de

manera cuantitativa. Estadísticas descriptivas se distingue de estadística inferencial (o

estadística inductiva), en que la estadística descriptiva busca resumir un conjunto de

datos, en lugar de utilizar los datos para aprender sobre la población estadística que los

datos deben representar. Esto generalmente significa que la estadística descriptiva, a

diferencia de la estadística inferencial, no están desarrollados basándose en la teoría de

la probabilidad. En mi profesión se usa en análisis de datos de producción en cultivos,

establecimiento y proyecciones de cosechas

c. ¿Cuáles son las medidas de tendencia central más importantes y por qué?

Son la media, la mediana y la moda. Estas medidas son importantes porque permiten

distribuir los datos de forma organizada, y con ello construir gráficas para presentar la

información de manera simple.

d. Ejemplifique media, mediana y moda.


Son la media, la mediana y la moda. Estas medidas son importantes porque permiten

distribuir los datos de forma organizada, y con ello construir gráficas para presentar la

información de manera simple.

La media de un conjunto de datos

La media de un conjunto de números, algunas ocasiones simplemente llamada el

promedio, es la suma de los datos dividida entre el número total de datos.

La mediana de un conjunto de datos

La mediana de un conjunto de números es el número medio en el conjunto (después que

los números han sido arreglados del menor al mayor) o, si hay un número par de datos,

la mediana es el promedio de los dos números medios.

La moda de un conjunto de datos

La moda de un conjunto de números es el número que aparece más a menudo.

e. ¿Cuáles son las medidas de dispersión más importantes y por qué son útiles en

profesiones pertenecientes a las ciencias agrarias, pecuarias y del medio ambiente?

Desviación estándar, varianza y coeficiente de variación, son útiles para nosotros como

profesionales, porque permiten verificar en términos cuantificables de probabilidad

medir si alguna variable manipulada por nosotros dentro de un experimento, muestra

los resultados que se esperan o no.


f. ¿Qué es una variable estadística y que tipos de variables existen?

Una variable estadística es un valor o característica que puede manifestar diferentes

comportamientos, los cuales son susceptibles de cuantificación (variables

cuantitativas), o detallar de manera órgano sensitiva (variables cualitativas) siendo

comparables entre sí, lo que permite deducir hipótesis.

g. ¿Cuáles son las medidas de posición y para qué sirven?

Son percentiles, deciles y cuartiles; estas medidas permiten dividir los datos en partes

iguales dentro de los gráficos, también identificar la posición de un dato con respecto al

resto da datos.

h. ¿Qué se entiende por población y muestra? Describa dos ejemplos de cada

uno.

Las estadísticas de por sí no tienen sentido si no se consideran o se relacionan dentro del

contexto con que se trabajan. Por lo tanto es necesario entender los conceptos de

población y de muestra para lograr comprender mejor su significado en la investigación

educativa o social que se lleva a cabo.

Muestra: es un subconjunto de datos perteneciente a una población de datos.

Estadísticamente hablando, debe estar constituido por un cierto número de

observaciones que representen adecuadamente el total de los datos.


Ejemplos:

Población de niños en primer grado de primaria.

Densidad de estrellas en la vía láctea.

Población: Es el conjunto total de individuos, objetos o medidas que poseen algunas

características comunes observables en un lugar y en un momento determinado. Cuando

se vaya a llevar a cabo alguna investigación debe de tenerse en cuenta algunas

características esenciales al seleccionarse la población bajo estudio.

Ejemplos:

Población de niños en edad escolar

Población densidad de estrellas en el universo

i. Explique qué es una hipótesis de investigación y una hipótesis estadística.

Describa dos ejemplos de cada uno.

Las hipótesis estadísticas son la transformación de las hipótesis de investigación, nulas

y alternativas en símbolos estadísticos. Se pueden formular solamente cuando los datos

del estudio que se van a recolectar y analizar para aprobar o desaprobar las hipótesis son

cuantitativos (números, porcentajes, promedios). Es decir, el investigador traduce su

hipótesis de investigación y su hipótesis nula (y cuando se formulan hipótesis

alternativas, también éstas) en términos estadísticos.


Una hipótesis de investigación es la presunción o especulación por parte del

investigador de los resultados posibles, ante un evento; cuando las hipótesis, que es

una proposición verdadera o falsa, se poya en la probabilidad, se denomina hipótesis

estadística; consta de una hipótesis nula (Ho), lo que se refiere a cualquier hipótesis

que se quiera probar, que niega cualquier relación entre las variables, la hipótesis

alternativa (Ha), son las posibilidades diferentes ante la hipótesis nula.

Ejemplo:

Hipótesis de investigación (Hi): El rango de crecimiento de una planta de tomate es de

0,5 cm por día con 12 horas de luz, si se limita las horas de luz a 10 horas el rango de

crecimiento será menor a 0,5 cc por día.

Hipótesis nula (HO): el rango de crecimiento del tomate con 10 horas de luz no es

inferior a 0,5 cc por día

Hipótesis alternativa (Ha): el rango de crecimiento del tomate con 10 horas de luz oscila

entre 0,5cm y 1 cm por día.

Hipótesis de investigación (Hi) : en un lote de 100 novillos los cuales pastan todo los

días, y tienen un promedio de conversión pasto-carne 600 gramos promedio diarios;

se seleccionan 50 novillos y se les suministra concentrado 1 día a la semana y no

pastan ese día; se estima que el porcentaje de conversión sea de 750 gramos promedio

diarios.

Hipótesis nula (Ho): los 50 novillos que se les suministra concentrado, tienen un

promedio de conversión igual a 600 gramos de carne diarios

Hipótesis Alternativa (Ha): la ganancia de carne de los 50 novillos a los que se le

sumista concentrado es mayor al menos para el 50% de los individuos de 600 gramos

diarios.
j. ¿Qué son los errores tipo I y tipo II en las pruebas de hipótesis?

Error tipo I: se rechaza la hipótesis nula cuando es verdadera, se denomina α a la

probabilidad de cometer el error tipo I, donde se asume que existe un 5% de

probabilidad de equivocarse al rechazar la hipótesis nula, este valor de significancia es

determinado por el investigador aunque en términos generales es del 0.05 para α.

Erro tipo II: cuando la hipótesis nula es falsa y no se rechaza, la probabilidad de

cometer el error tipo II es β. La probabilidad de rechazar la hipótesis nula cuando es

falsa es igual a 1–β. Este valor es la potencia de la prueba. Para minimizar la posibilidad

de cometer este error se debe asegurar que la muestra sea lo suficientemente grande para

detectar una diferencia.

k. ¿Qué es una curva de distribución normal?

Es la representación gráfica de una probabilidad continua y simétrica; cuyo valor más

alto coincide con la media; tiene dos puntos de inflexión a cada lado de la media siendo

la distancia máxima a cada lado la desviación estándar.

La distribución normal o curva gaussiana, es la distribución continua más usada en

estadística, ya que se puede calcular la probabilidad de que varios valores ocurran

dentro de ciertos rangos.

l. ¿En qué consiste el teorema del límite central?


Si se tienen un número grande de variables, de varianza no nula pero finita, y

todas ellas siguen el mismo patrón de distribución, la suma de ellas se distribuye según

la distribución normal; para variables discretas o variables continuas. Entre más grande

la muestra la media se aproxima a la distribución normal.

m. ¿Cuáles son los tipos de curvas de distribución normal?

Distribución asimétrica: indica la simetría en la distribución de la variable, respecto a la

media, es decir la forma y cantidad de datos es igual a ambos lados de la media.

Distribución binomial: indica la probabilidad de número de éxitos en una cantidad de

ensayos determinada, con una probabilidad fija de éxito en cada ensayo

Distribución de veneno: determina la probabilidad de que un evento ocurra en un

intervalo de tiempo, a mayor lapso de tiempo mayor es la probabilidad de que ocurra

este evento.

Distribución uniforme: relaciona varios eventos posibles que tienen probabilidad de

ocurrir, donde no es posible determinar cuál de ellos puede suceder.

n. ¿Qué es una curva normal estándar? Y ¿cuál es su uso?

La curva de distribución de frecuencias, o curva de probabilidades describe la forma

posible de variación de los valores, la distribución normal estándar, o tipificada, tiene

por media el valor, μ = 0, y por desviación típica el valor, σ =1.


Se usa para comparar datos de poblaciones muy diferentes dentro del mismo contexto,

partiendo de la media y la desviación estándar de cada una, para tipificar y luego

comparar.
Ejercicios (Estudios de caso)

Se deben desarrollar de forma individual, y se deben de presentar en el foro

colaborativo

1- Para responder a la pregunta de cuál grafico es el más adecuado se debe tener en

cuenta el objetivo que se quiere cumplir, el cual es comparar el beneficio

porcino por departamentos a través de los años 2013 y 2014, para tal

comparación se hace un diagrama de barras para comparar el beneficio de un

año y del otro respectivamente en una sola gráfica.

Beneficio porcino por departamentos años 2013 - 2014

1800000
1600000
Cabezas (Porcinoas)

1400000
1200000
1000000
800000
600000
400000 Series2
200000
0 Series4
Antioquia

Nariño

Huila
Meta
Risaralda

Quindio

Santander

Otros
Departamento

Atlantico

Choco
Valle del cauca

Caldas

Boyaca
Bogota, D.C

Departamento

- Color rojo ( Año 2013)

- Color morado ( Año 2014)

Tabla 1 – Fuente: Autor


En el año 2013 el beneficio porcino a nivel departamental tuvo un promedio de

217.610 lo que quiere decir que todos los departamentos se encuentran cerca de este

beneficio a excepción de algunos que tienen un beneficio mayor y otros con un

beneficio menor. Por otra parte para el año 2014 se tuvo el beneficio porcino a nivel

departamental tuvo un promedio de 229.139, esto quiere decir que sufrió una variación

del 5,29 % de un año al otro.

Se puede decir con respecto a los datos proporcionados por el sistema nacional

de recaudo, Asoporsicultores – FNP, que en el año 2013 el 50% de los departamentos se

encontraban con un beneficio por debajo de 43.855 cabezas de ganado porcino y para el

año 2014 el 50% estuvo por debajo de 43.808 lo cual quiere decir que hubo una

variación en reducción del 0,10 % de un año al otro.

En este caso no se evidencia que un departamento tenga el mismo beneficio de otro, por

tal motivo no existe una moda en los datos.


2-

intervalos
peso en
fi FI hi (%) Hi(%) Xi XI.fi
(Kg) ovejas (Xi - media)^2 (fi)
21,24 24,886 6 6 12,245 12,245 23,063 138,378 293,527
24,886 28,532 12 18 24,490 36,735 26,709 320,508 134,539
28,532 32,178 16 34 32,653 69,388 30,355 485,68 1,417
32,178 35,824 10 44 20,408 89,796 34,001 340,01 155,522
35,824 39,47 5 49 10,204 100 37,647 188,235 288,013
total 49 100 1472,811 873,018

Tabla 1 – Fuente: Autor

En esta tabla se ordenaron los datos correspondientes a los pesos de 49 ovejas

después de haberle proporcionado determinado tratamiento, en la tabla se evidencian las

siguientes columnas

fi – Frecuencia

Fi – Frecuencia acumulada

hi – Frecuencia potencial

Hi – Frecuencia potencial acumulada

Xi – Marca de clase

Para esta esta tabla se utilizaron 5 intervalos de clase


Histograma
18
16
14
12
# Ovejas

10
8
6 fi
4
2
0
23.063 26.709 30.355 34.001 37.647
Peso (Kg)

Promedio peso de ovejas


20

15
# OVEJAS

10

0
0 5 10 15 20 25 30 35 40
Peso (Kg)
Fórmulas utilizadas para realizar el análisis
𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 =
𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
∑𝑛𝑖=1 𝑋𝑖. 𝑓𝑖
𝑚𝑒𝑑𝑖𝑎 =
𝑛−1
𝑑𝑎𝑡𝑜𝑠
( ) − 𝐹𝑖 𝑎𝑛𝑡
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿𝑖 + 𝐴 ( 2 )
𝑓𝑖(𝑚𝑒𝑑𝑖𝑎𝑛𝑎)
∆1
𝑚𝑜𝑑𝑎 = 𝐿𝑖 + 𝐴 ( )
∆1 + ∆2
∆1 = 𝑓𝑖(𝑚𝑜𝑑𝑎) − 𝑓𝑖 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
∆2 = 𝑓𝑖(𝑚𝑜𝑑𝑎) − 𝑓𝑖 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
∑𝑛𝑖=1(𝑋𝑖 − 𝑚𝑒𝑑𝑖𝑎)2 (𝑓𝑖)
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 =
𝑛−1
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑖𝑝𝑖𝑐𝑎 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑖𝑝𝑖𝑐𝑎
𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 = . 100
𝑚𝑒𝑑𝑖𝑎

Análisis de resultados
media 30,057 varianza 17,817
mediana 30,013 desviación típica 4,221
moda 29,99 coeficiente de dispersión 0,140

Teniendo en cuenta los datos obtenidos para el análisis estadístico de los valores

se pueden dar las siguientes conclusiones:

Se puede decir que la mayoría de las ovejas después de haberse efectuado el

tratamiento tienen un peso de 30,057 Kg

Después de realizado el tratamiento a las 49 ovejas se puede afirmar que el 50%

de las ovejas tiene un peso por encima de los 30,013 kg


Analizando los datos podemos decir que el peso que más se repitió en las ovejas

es de 29,99 kg ya habiendo realizado el tratamiento a cada una de ellas

3-
Calcular la probabilidad de que cada tipo (A y B) genere reposición por garantía

tipo A

B=10 meses

S= 2 meses

𝑥−𝜇 6 − 10
𝑃(𝐴) = 𝑃[𝑧 = =𝑃 [ ] = 𝑃[𝑍] = −2
𝛿 2

𝑒𝑠 = 0,0228; 𝑃[𝑥 = 6] = 2,28

La probabilidad de que el tipo A genere garantía es de 2,28

Tipo B

B =11 meses

S = 3 meses

𝑥−𝜇 6 − 11
𝑃(𝐵) = 𝑃[𝑍 = =𝑃 [ ] = 𝑃[𝑍] = −1,66
𝛿 3

𝑃(𝑋 = 6 = 0,0485; 𝑃(𝑋 = 6) = 4,85

La probabilidad de que el tipo B genere garantía es de 4,85


Calcular el lucro promedio que se genera por venta de las semillas del tipo A y para las

semillas del tipo B.

Para tipo A

1200 u.m

La semilla de tipo A posee una probabilidad de restitución 0,0228 la

probabilidad de ganancia estaría dada por:

100% − 2,28% = 97,72%

0,9772(1200) = (1 − 0,0228)(1200) = 1.172,54 𝑢. 𝑚

Para la semilla tipo A el promedio de ganancias por venta es de 1.172,54 u.m

Para tipo B

2100 u.m

La semilla de tipo B posee una probabilidad de restitución de 0,0485 la

probabilidad de ganancias por ventas estaría dada por:

100% − 4,85% = 95,15%

0,9515(2100) = 1.998,15

Para la semilla tipo B el promedio de ganancias por ventas es de 1.998,15


Con base en los lucros medios. ¿La empresa debería incentivar las ventas de las semillas

del tipo A o del tipo B?

Respuesta: Realizando los cálculos correspondientes a la generación por garantía y

ganancia por ventas se pudo concluir que la semilla de tipo B genera una ganancia

mayor con respecto a la semilla de tipo A, por tal motivo se debería incentivar la

venta del tipo de semilla B


Conclusiones

La introducción de métodos estadísticos de avanzada en la formación del profesional de

pre y postgrado, y en proyectos de investigación en esta área, permite saltos cualitativos

en la Educación Superior y eleva la calidad de las investigaciones científicas. De esta

manera la estadística nos ayuda en el proceso de sistematización en las proyecciones de

producción en las diferentes áreas del sector agroepcuario.


Bibliografía

ANDERSON, D. SWEENEY D. y Williams, T. (1982, 2005).

Estadística para administración y economía. México: Thompson editores.

CHISTENSEN, H. (1990). Estadística pasó a paso. México:

trillas 3era edición.

DE LA HORRA, J. (2003). Estadística aplicada. Ediciones Díaz

de santos.

Martin R. Guillermina., (2016). La función de probabilidad normal: características y


aplicaciones. Recuperado: http://www.extoikos.es/n6/pdf/16.pdf

Universidad de Atacama., (2011). Clase 2: Estadística. Recuperado de:


http://www.mat.uda.cl/hsalinas/cursos/2011/2do/clase2.pdf

You might also like