You are on page 1of 153

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente


Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
ESCUELA DE CIENCIAS AGRICOLAS PECUARIAS Y DEL MEDIO
AMBIENTE




203018 BIOMETRIA Y DISEO DE EXPERIMENTOS
JOHN ALEXANDER MORENO SANDOVAL
LILIANA VALENCIA TRUJILLO
(Director Nacional)
Retomado por:
ALBERTO CASTELLANOS RIVEROS
MVZ.Esp.Msc.





Bucaramanga
2014


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS




INDICE DE CONTENIDO

INTRODUCCIN ..................................................................................................... 5
UNIDAD 1. BIOMETRIA ......................................................................................... 9
CAPITULO 1: LA BIOESTADSTICA EN LA INVESTIGACIN PECUARIA ......... 9
LECCIN 1: HISTORIA DE LA BIOESTADSTICA ............................................................ 9
LECCIN 2: USOS E IMPORTANCIA DE LA BIOMETRA EN EL SECTOR AGROPECUARIO ... 10
LECCIN 3: MTODO CIENTFICO ........................................................................... 11
LECCIN 4: CONCEPTOS ....................................................................................... 12
LECCIN 5: INVESTIGACIN CIENTFICA................................................................... 16
CAPITULO 2: ESTADSTICA DESCRIPTIVA ...................................................... 17
LECCIN 6: MEDIDAS DE TENDENCIA CENTRAL ........................................................ 17
LECCIN 7: DISTRIBUCIN DE FRECUENCIAS .......................................................... 33
LECCIN 8: GRFICAS .......................................................................................... 46
LECCIN 9: PRINCIPIOS DE PROBABILIDAD .............................................................. 51
LECCIN 10: MUESTREO ....................................................................................... 55
CAPITULO 3: INFERENCIA ESTADSTICA ........................................................ 67
LECCIN 11: INFERENCIA PUNTUAL ........................................................................ 67
LECCIN 12: PRUEBAS DE HIPTESIS ..................................................................... 82
LECCIN 13: COMPARACIN DE DOS MEDIAS MUESTRALES ...................................... 91
LECCIN 14: ANLISIS DE VARIANZA....................................................................... 98
LECCIN 15: ANLISIS DE COVARIANZA ................................................................ 100
UNIDAD 2. DISEO DE EXPERIMENTOS ........................................................ 102
CAPITULO 4: DISEO DE EXPERIMENTOS .................................................... 102
LECCIN 16: EL EXPERIMENTO Y SUS ELEMENTOS ................................................. 102
LECCIN 17: ORIENTACIONES GENERALES EN LA EXPERIMENTACION
AGRICOLA ...................................................................................................... 105
LECCIN 18: DISEO EXPERIMENTAL. .................................................................. 107


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

LECCIN 19: MODELO ESTADSTICO ..................................................................... 114
LECCIN 20: TRANSFORMACIN DE DATOS ........................................................... 116
CAPITULO 5: CLASES DE DISEOS EXPERIMENTALES .............................. 117
LECCIN 21: DISEO COMPLETAMENTE AL AZAR ................................................... 117
LECCIN 22: DISEO EN BLOQUES COMPLETOS AL AZAR ....................................... 122
LECCIN 23: EXPERIMENTOS FACTORIALES .......................................................... 126
LECCIN 24: OTRAS CLASES DE DISEOS EXPERIMENTALES ................................. 128
LECCIN 25: BSQUEDA DE UNIDADES PERDIDAS (MTODO YATES) ....................... 130
CAPITULO 6: ANLISIS ESTADSTICO ........................................................... 132
LECCIN 26: USOS DE LAS COMPARACIONES MLTIPLES DE MEDIAS ........................ 132
LECCIN 27: PRUEBA DE TUKEY .......................................................................... 133
LECCIN 28: PRUEBA DE RANGO MLTIPLE DE DUNCAN ......................................... 140
LECCIN 29: ANLISIS DE REGRESIN Y CORRELACIN ......................................... 144
LECCIN 30: ANLISIS DE VARIANZA PARA LA REGRESIN ...................................... 147
FUENTES BIBLIOGRAFICAS ............................................................................ 151
















UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS





ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO

El contenido didctico del curso acadmico: BIOMETRIA Y DISEO DE
EXPERIMENTOS fue diseado inicialmente en el ao 2008 por el zootecnista
John Alexander Moreno Sandoval. Tutor de la UNAD, ubicado en el CEAD de
Bogot. Es Zootecnista especialista en estadstica aplicada.
La siguiente correccin la realiza Liliana Valencia, Zootecnista magister en
produccin animal, quien est a cargo actualmente como directora del curso.
Posteriormente en el ao 2010 el curso es retomado por el docente Alberto
Castellanos Riveros MVZ. Especialista en docencia universitaria y magister en
microbiologa.














UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


INTRODUCCIN

En el mundo se est tomando conciencia que todas las producciones, sin importar
su naturaleza y en especial las de principios biolgicos o ambientales deben ser
analizadas numricamente, no solo para determinar el estado de desarrollo, sino
las proyecciones o correcciones que se puedan hacer tanto para lograr beneficios
econmicos como sociales o ambientales. La bioestadstica como rama de la
estadstica, es una herramienta que se puede usar de manera sencilla sin
necesidad de profundizar en ella, ni de dedicar toda una carrera profesional al
estudio de esta, no queriendo decir que no se deben conocer algunos principios y
procedimientos bsicos.
Por lo anterior, las profesiones relacionadas con el campo como Zootecnistas,
Mdicos Veterinarios, Ingenieros Agrnomos, Ingenieros Agrcolas, Forestales,
Ambientales y muchas otras, para cumplir satisfactoriamente con las tareas
profesionales, implica el uso de mtodos estadsticos que adems de hacerlo ms
eficiente, le facilitan el trabajo. La mayor ventaja que puede tener un profesional
del campo que estudie y maneje la estadstica como herramienta para el anlisis
de variables biolgicas es que lo hace nico en el entendimiento de la relacin que
tiene estas dos ciencias y de la forma de explicarse una con la otra.
Este modulo, pretende de forma resumida y con algunos ejemplos aplicados
presentar a los profesionales del campo la informacin que ensea y facilita el uso
de la bioestadstica como herramienta til. Es preciso aclarar que el modulo trata
de dejar el componente matemtico complicado de un lado y nicamente
presenta los modelos listos para reemplazar y hacer el clculo que interesa al
profesional del campo; sin profundizar en el origen de estos modelos. La
estructura del mdulo se divide en dos unidades; la primera se titula Bioestadstica
y la segunda Diseo Experimental.
La unidad de Bioestadstica comprende desde los conceptos fundamentales, el
manejo y presentacin de datos, principios de probabilidades, muestreo e
inferencia estadstica. Todos los captulos anteriormente mencionados son de gran
relevancia y su importancia aumenta cuando se empieza a entender su uso, tal es
el caso de las probabilidades que son de gran ayuda para los procesos de
mejoramiento gentico.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

La segunda unidad de Diseo Experimental, muestra en sus captulos los diseos
ms usados en los procesos de investigacin biolgica y da las pautas para el
anlisis de datos. Conocimiento destacado en las personas que se dedican a los
procesos investigativos, tanto as, que para entender la mayora de la literatura
cientfica es imprescindible haberlo estudiado. Es preciso resaltar que la
importancia de la Bioestadstica o Biometra depende del uso y buena aplicacin
que se le de a los conceptos matemticos que implican, es as como, cuando se
cometen equivocaciones en la aplicacin, se pretende justificar que el error de los
resultados dependen de la ciencia como tal y no por la persona que la aplica;
diciendo que la estadstica es mentirosa.
UNIDAD 1
Nombre de la Unidad BIOMETRIA
Introduccin La unidad de Bioestadstica comprende
desde los conceptos fundamentales, el
manejo y presentacin de datos, principios
de probabilidades, muestreo e inferencia
estadstica. Todos los captulos
anteriormente mencionados son de gran
relevancia y su importancia aumenta cuando
se empieza a entender su uso, tal es el caso
de las probabilidades que son de gran
ayuda para los procesos de mejoramiento
gentico..
Intencionalidades Formativas 1. Dar a conocer la historia, usos y
conceptos de la bioestadstica.
2. Ensear las principales formas de tomar,
resumir y presentar un conjunto de datos en
forma numrica o grfica.
3. Estudiar los principios bsicos de
probabilidades y la aplicabilidad de en reas
relacionados con variables biolgicas o
ambientales.
4. Estudiar las principales distribuciones de
probabilidades y el uso dentro de la
inferencia.
Denominacin de captulo 1 La Bioestadstica en la investigacin
pecuaria
Denominacin de Leccin 1 Historia de la bioestadstica
Denominacin de Leccin 2 usos e importancia de la biometra en el


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

sector agropecuario
Denominacin de Leccin 3 Mtodo Cientfico
Denominacin de Leccin 4 Conceptos
Denominacin de Leccin 5 Investigacin cientfica
Denominacin de captulo 2 Estadstica Descriptiva
Denominacin de Leccin 6 Medidas de tendencia central
Denominacin de Leccin 7 Distribucin de Frecuencias
Denominacin de Leccin 8 Grficas
Denominacin de Leccin 9 Distribucin estndar
Denominacin de Leccin 10 Muestreo
Denominacin de captulo 3 Inferencia estadstica
Denominacin de Leccin 11 Interferencia puntual
Denominacin de Leccin 12 Pruebas de hiptesis
Denominacin de Leccin 13 Comparacin de dos medias muestrales
denominacin de leccin 14 Anlisis de varianza
denominacin de leccin 15 Anlisis de Covarianza

UNIDAD 2

Nombre de la Unidad DISEO DE EXPERIMENTOS
Introduccin Esta unidad muestra en sus captulos los diseos
ms usados en los procesos de investigacin
biolgica y da las pautas para el anlisis de datos.
Conocimiento destacado en las personas que se
dedican a los procesos investigativos, tanto as,
que para entender la mayora de la literatura
cientfica es imprescindible haberlo estudiado. Es
preciso resaltar que la importancia de la
Bioestadstica o Biometra depende del uso y
buena aplicacin que se le d a los conceptos
matemticos que implican, es as como, cuando
se cometen equivocaciones en la aplicacin, se
pretende justificar que el error de los resultados


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

dependen de la ciencia como tal y no por la
persona que la aplica; diciendo que la estadstica
es mentirosa.
Intencionalidades Formativas 1. Formarse en la aplicacin de diseos
experimentales como una herramienta en para los
procesos de investigacin.
2. Conocer algunos mtodos de comparacin
mltiple de medias que permitan analizar,
recomendar y tomar decisiones en procesos
productivos o investigativos.
3. Estudiar el uso y clculo de las regresiones, en
especial la regresin lineal.
Denominacin de captulo 4 Diseo de experimentos
Denominacin de Leccin 16 El experimento y sus elementos
Denominacin de Leccin 17 La replicacin
Denominacin de Leccin 18 La aleatorizacin
Denominacin de Leccin 19 Modelo estadstico
Denominacin de Leccin 20 Transformacin de datos
Denominacin de captulo 5 Clases de Diseos experimentales
Denominacin de Leccin 21 Diseo Completamente al azar
Denominacin de Leccin 22 Diseo en Bloques Completos al azar
Denominacin de Leccin 23 Experimentos factoriales
Denominacin de Leccin 24 Otras Clases de diseos experimentales
Denominacin de Leccin 25 Bsqueda de unidades perdidas (Mtodo Yates)
Denominacin de captulo 6 Anlisis estadstico
Denominacin de Leccin 26 Usos de las comparaciones mltiples de medias
Denominacin de Leccin 27 Prueba de Tukey
Denominacin de Leccin 28 Prueba de rango mltiple de Duncan
Denominacin de Leccin 29 Anlisis de regresin y Correlacin
Denominacin de Leccin 30 Anlisis de varianza para la regresin



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


UNIDAD 1. BIOMETRIA

CAPITULO 1: La Bioestadstica en la investigacin pecuaria

Leccin 1: Historia de la bioestadstica

La estadstica que muchos creen como algo nuevo, es tan antigua como la misma
humanidad, ya que hay vestigios de su inicio antes de Cristo, como en China
donde el emperador Yao (2.238 a.c) dispuso la realizacin de un censo en su
imperio. Algo similar ocurri en la poca del Rey Herodes, relacionado con un
empadronamiento cuando naci Cristo.
La Estadstica como disciplina tuvo su inicio en Alemania a mediados del siglo
XVII, en el reinado de Godofredo de Achenwall (1719-1772), cuando utiliz la
palabra Estadstica y la separ de la Sociologa.
En Amrica precolombina se haba desarrollado notablemente la estadstica,
especialmente en Mxico y Per. La estadstica del imperio de los incas era tan
completa como la actual, aunque ese pueblo no usaba la escritura, empleaba para
sus cmputos un sistema de cordones de variados colores, armados y
combinados para conservar en ellos las cuentas extensas y complicadas;
conocan as la poblacin distribuida por localidades, sexos y condicin civil,
averiguaban el nmero de nacimientos y muertes, conocan el nmero de hombre
aptos para la guerra y la cantidad de provisiones con que contaban. En general
conocan muchos aspectos sobre su Imperio (Surez 1999).
La palabra Estadstica para algunos proviene de la palabra Status, cuyo
significado es Estado. Para otros se deriva del vocablo Griego Statera que
significa balanza, o quiz la ms confiable, proviene de la palabra Alemana Stara
que significa Estado, encargado de hacer Estadstica. (Martnez 2005).
En los tiempos modernos, donde la Estadstica tiene funciones importantes dentro
de otras ramas, no slo en lo social, en los censos o en la organizacin de
cualquier Estado, si no que hace parte fundamental de los procesos de
investigacin, se ha denominado la BIOESTADISTICA como la ciencia encargada
de analizar datos relacionados directamente con variables biolgicas, su


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

importancia, influencia, relacin o diferencia, etc y que permiten conocer o tomar
decisiones acerca del comportamiento de los seres vivos bajo condiciones
estipuladas.

Charles Darwin (1809-1882), siendo un bilogo, dio gran importancia a la
estadstica dentro de la formulacin de sus teoras. Kart Pearson (1857-1936)
dedic gran parte de su vida al estudio de la estadstica y fund la biometra,
impulsando as el uso de esta herramienta. Fisher (1980-1962) inici la relacin
entre los mtodos estadsticos y la agricultura, gentica y biologa.
De esta forma la BIOESTADSTICA o BIOMETRA (medicin de variables
biolgicas) se ha vuelto una herramienta indispensable para ramas tan
importantes como la gentica, nutricin, alimentacin y muchas otras que son
componentes de profesiones que trabajan con seres vivos y factores que los
afecten. Es as como en todos los procesos de educacin donde se tenga como
prioridad el estudio de variables biolgicas, se hace indiscutible el uso de mtodos
estadsticos que aportan al conocimiento de los organismos vivos.

Leccin 2: usos e importancia de la biometra en el sector agropecuario

La bioestadstica es una herramienta que le sirve a todo profesional que tenga
relacin con los seres vivos, no solo en el campo investigativo, sino tambin de
produccin animal, anlisis ambientales, poblaciones humanas, producciones
agrcolas, etc. Con el fin ampliar el conocimiento sobre aspectos que permitan de
una u otra forma tomar decisiones sobre los que interesa al desarrollo de la
humanidad y del planeta.
Es frecuente escuchar el argumento que la estadstica es un sofisma de
distraccin o que es mentirosa. En realidad, como se vio desde el principio de la
humanidad, se ha utilizado la estadstica y hoy en da una de sus denominaciones
la bioestadstica, la cual no es el proceso o el mtodo el que dice mentiras, si no
el mismo analista el que cambia los conceptos y hace mal uso de la herramienta,
acomodndola y argumentndola a su beneficio. En pocas palabras, estos
argumentos no se deben a la ciencia como tal, sino al hombre que no sabe aplicar
el mtodo preciso y mucho menos interpretarlo para dar suficiente importancia y
concordancia con los que suceden en la naturaleza.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Es as como se debe tener mucho cuidado en el uso de esta herramienta, la cual
es base para el entendimiento de procesos biolgicos y que si es usada
correctamente se vuelve indispensable para formular y comprobar hiptesis,
teoras, modelos e incluso leyes, que conlleven a ampliar otras ciencias como la
nutricin, alimentacin, gentica, fisiologa, ecologa, geologa, botnica, y muchas

otras ms relacionadas con la naturaleza del hombre, los animales, las plantas,
microorganismos y en general con el medio ambiente.

Leccin 3: Mtodo Cientfico

Permite recolectar las observaciones mediante registros que se ordenan,
clasifican, cuantifican y se interpretan mediante cuadros y/o grficas, permitiendo
la depuracin de datos en dos aspectos, en su presentacin clara y en su
simplificacin, ya que facilita manejar grandes cantidades de informacin
presentadas de manera resumida, tarea que realizamos a travs de la estadstica
descriptiva, luego con la inferencia estadstica y adems permite el anlisis y la
bsqueda de relaciones que puedan existir entre ellas.
El proceso de elaboracin estadstica se puede dividir en seis fases: (Martnez,
2005)
1. Planeamiento o preparacin.
2. Recoleccin.
3. Crtica y codificacin.
4. Procesamiento.
5. Anlisis e interpretacin.
6. Publicacin.
En cuanto al planeamiento o preparacin, un proyecto o plan estadstico debe
contemplar los siguientes aspectos:
a. El objeto de la investigacin
b. La finalidad


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

c. La fuente de informacin
d. Los procedimientos
e. El material
f. El costo y financiacin.

Es importante tener en cuenta que todo procedimiento de investigacin debe
acogerse a los siguientes criterios:

Claridad. Toda investigacin en todos sus pormenores, debe ser clara y conocida
por todos los que en ella vayan a intervenir. La claridad est ligada directamente
con la comprensin. La estadstica en el periodo de investigacin, en el de
elaboracin en la presentacin y anlisis, debe ser entendida por todo el mundo:
investigador(es), lectores, quienes vayan a utilizar los resultados, etc.
Sencillez. En el proyecto en las instrucciones, en la finalidad, en los objetivos, en
la toma de datos, en los cuadros de exposicin, en los comentarios literarios de
anlisis, en las operaciones de clculo, en los grficos, en todo. La sencillez es un
mtodo para brindar claridad.
Utilidad. Toda estadstica que se inicie debe tener alguna aplicacin prctica de
inters. De otro modo nos hallaremos ante una acumulacin molesta de datos que
perjudicarn por muchos motivos, a la informacin realmente aprovechable.

Leccin 4: Conceptos

ESTADSTICA. Es un campo del estudio relacionado con 1) el sistema o mtodo
utilizado para la recoleccin, organizacin, anlisis, descripcin y resumen de
datos y 2) la obtencin de inferencia acerca de un conjunto de datos cuando solo
se observa una parte de ellos.(Daniel, 1990 & Martnez, 2005.)
BIOESTADSTICA. Cuando los datos que se recopilan y analizan corresponden a
disciplinas que forman parte de las ciencias biolgicas, como la Veterinaria,
Zootecnia, Agronoma, Ecologa, etc. Se utiliza el trmino Bioestadstica para
diferenciar a esta aplicacin particular de herramientas y conceptos estadsticos.
(Surez, 1999).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

VARIABLE. Cuando se observa una caracterstica medible y esta toma valores
distintos entre individuos, lugares, condiciones de produccin o a travs del
tiempo, se dice que sta caracterstica es una variable. Esto explica que la
caracterstica vara por algn efecto y por tanto es lgico llamarla variable. Son
ejemplos de esto, la altura de plantas de maz en un cultivo (presentan diferentes
alturas entre ellas por efectos diferentes), la ganancia de peso de algunos

animales (varan por raza, sexo, edad, lugar, alimentacin), la cantidad de
aportes nutricionales del suelo de una granja (vara por efectos edficos,
estructuras fsicas y composiciones qumicas del mismo).
Si analizamos o describimos una variable, caracterstica o atributo en forma
independiente, nos referimos a distribuciones univariantes, si relacionamos dos
Caractersticas entre s sera bivariante y si es el caso de relacionar ms de dos
caractersticas se dira que la distribucin es multivariante.
Las variables, dependiendo de los tipos de datos que la componen se puede
clasificar en variables cuantitativas y cualitativas, y a su vez las cuantitativas
pueden ser discretas o continuas.
Variables cuantitativas. Son las caractersticas mensurables y se describen
numricamente, tales como altura, peso, valor, produccin, ventas, pluviosidad,
etc.
Variables cualitativas. Son las que se expresan mediante palabras por no ser
mensurables, pero si cuantificables, tales como raza, marca, posicin
socioeconmica, clima, etc.
Variable Discreta. Se refiere a aquellas que solo pueden tomar unos determinados
valores, siendo imposible que lleguen a tomar valores intermedios entre dos
consecutivos, es decir toma nicamente valores enteros: 1, 2, 3,, tal es el caso
del nmero de lechones por camada, cantidad de colonias de bacterias en un
cultivos de agar, nmero de peces muertos por contaminacin del agua, nmero
de huevos viables para incubar, etc.
Variable Continua. Se toman todos los valores infinitos posibles de un intervalo, es
decir, se admiten valores fraccionarios. Por ejemplo el peso de terneros al
nacimiento, altura alcanzada por plantas de sorgo, velocidad del viento, etc.
Variable aleatoria. Cada vez que se determina un dato en un individuo, planta,
lote, zona, etc., se dice que son el resultado de factores fortuitos y por tanto se ha


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

tomado de forma aleatoria. Los valores que resultan de los procesos de medicin
suelen conocerse como observaciones o simplemente como medidas. Todos los
procesos investigativos en variables biolgicas deben garantizar que las
observaciones o mediciones que se hayan tomado en individuos, zonas, lotes,
plantas, etc., sean el producto de una seleccin aleatoria.
Variable nominal. Se obtiene cuando se definen las categoras y se cuenta el
nmero de observaciones que quedan en cada una. Las variables nominales
comprenden las categoras como sexo (macho, hembra), color, raza, tamao
(grande, mediano, pequeo). Ninguna de las caractersticas anteriores es
numrica por naturaleza, sin embargo cuando se aplican ya sea en una poblacin
o en una muestra, es posible asignar a cada individuo una categora.
Variables jerrquicas. Constan de valores relativos asignados para denotar orden:
primero, segundo, tercero y as sucesivamente.
POBLACIN. Llamada tambin universo, se define como el mayor grupo de
elementos por los cuales se tiene un cierto inters en un momento dado. Las
caractersticas primordiales de una poblacin son: su naturaleza, su magnitud, el
espacio y el tiempo.
Si se lleva a cabo una medicin de alguna variable sobre cada uno de los
elementos de una poblacin, se obtiene una poblacin de valores definida como el
mayor grupo de valores de una variable aleatoria, por los cuales se tiene un cierto
inters en un momento dado. (Daniel, 1990).
Las poblaciones pueden ser finitas o infinitas. Si una poblacin de valores consta
de un nmero fijo de estos valores, se dice que la poblacin es finita. Por otra
parte si una poblacin consta de una sucesin sin fin de valores, dicha poblacin
es infinita. Por ejemplo: si se desea hacer un estudio sobre la poblacin bovina de
un pas, se sabe por censo o registros, un nmero determinado de la poblacin y
se convierte en una poblacin finita. Por el contrario, si se desea estudiar la
presencia de un hongo en las mazorcas que se producen en un cultivo de maz,
no se sabe el nmero determinado de mazorcas producidas y por tanto es una
poblacin infinita, o mejor an, si el estudio pretende determinar la presencia de
hongo en una bodega de granos, no se sabe cuntos granos estn almacenados
en la bodega.
MUESTRA. Una muestra puede definirse como una parte de una poblacin. La
muestra es un subconjunto de la poblacin. Cuando la poblacin es relativamente
pequea, es posible estudiar a todos los individuos que la integran, pero cuando la
muestra corresponde o representa a una poblacin grande o infinita, normalmente


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

en estadstica, esta se debe tomar al azar, ya que todos los individuos de la
poblacin tienen la misma oportunidad de conformar la muestra de estudio y el
resultado de esta muestra en el correspondiente estudio, representa el
comportamiento de toda la poblacin. De no cumplirse esto se tomara como una
muestra sesgada y se denomina muestra no probabilstica.
La muestra no probabilstica corresponde a la seleccin de unidades o elementos,
segn el criterio o conveniencia del investigador. En estos casos algunas unidades
Tienen mayor posibilidad que otras de ser seleccionadas; por tal razn no se
puede determinar la validez, ni la confiabilidad que merecen dichos resultados.
Casi por lo general, las unidades se seleccionan de forma caprichosa.
Al proceso de determinar el tamao y seleccin de una muestra, se le llama
muestreo y depende directamente de la naturaleza de la poblacin. Existen varios
mtodos de muestreo que permiten dar confiabilidad en los resultados de un
estudio.
UNIDAD EXPERIMENTAL. Una unidad experimental es un individuo de los que
conforman una muestra o una poblacin, es decir, las muestras o las poblaciones
se componen de unidades experimentales. El conjunto de unidades
experimentales es lo que se simboliza estadsticamente como (N) si es una
poblacin o (n) si es una muestra. En la presentacin de muchas investigaciones,
una de las preguntas comunes por los auditores corresponde a cuntas unidades
experimentales estudi?
Una unidad experimental puede estar compuesta por un individuo o por un grupo
de individuos, es decir; individuales o grupales. Las unidades experimentales
individuales, como su nombre los indica son aquellas que estn compuestas por
cada uno de los individuos de la muestra o de la poblacin. Las unidades
experimentales grupales son las que por facilidad de trabajo o conveniencia del
estudio se trabajan en grupo. Por ejemplo: en un estudio de incidencia y
prevalencia de Influenza Equina, se toma como unidad experimental cada uno de
los equinos a los que se estn haciendo las pruebas, entonces se estara
hablando de unidades experimentales individuales. Mientras que en un estudio
para determinar la ganancia de peso de caracoles bajo ciertas dietas, para facilitar
el trabajo se pesan los caracoles en grupos de 10, lo cual cada grupo corresponde
a una unidad experimental grupal y los resultados se presentan para grupos de 10
caracoles.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Esta ltima forma de definir las unidades experimentales puede provocar un error
si los individuos que la conforman no son lo suficientemente homogneos y
causan diferencia con otras unidades experimentales grupales.
HIPTESIS. Es un supuesto que se asume tentativamente para representar un
resultado que se pretende probar.

Leccin 5: Investigacin cientfica

No existe investigacin, proceso o trabajo encaminado a obtener informacin
cuantitativa en general, en la que la estadstica no tenga una aplicacin. La
estadstica no puede ser ignorada por ningn investigador, an cuando no tenga
ocasin de emplear la Estadstica Aplicada en todos sus detalles y ramificaciones.
Los resultados de una investigacin agrcola reflejan los efectos de tratamiento, de
diseo, e incluso de factores biolgicos, ambientales y de manejo que los afectan.
Es una caracterstica comn en los experimentos, en muy diversos campos de la
investigacin, que los efectos de los tratamientos experimentales varan de un
ensayo a otro, cuando se repiten. Esta variacin introduce ciertos grados de
incertidumbres en cualquiera de las conclusiones que se obtienen de los
resultados.
La estadstica ha ayudado al investigador en proyectos muy variados en el campo
de la agricultura, tales como el ensayo de maquinarias para escardar, ciertos
aspectos econmicos en la electrificacin de granjas, comparacin de varios
mtodos para secado de semillas, determinacin de los efectos de las diferentes
diferentes velocidades de secado del maz para "palomitas", investigaciones en
regado, estudio del techado de fincas rurales, y en mtodos de cultivo. La
Estadstica cuando se usa adecuadamente, hace ms eficientes las
investigaciones, es aconsejable que todos los investigadores se familiaricen con
las tcnicas y conceptos bsicos de esta ciencia tan til. El papel de la estadstica
en la investigacin es, entonces, funcionar como una herramienta en el diseo de
investigaciones, en el anlisis de datos, y en la extraccin de conclusiones a partir
de ellos. Escasamente podr preverse un papel mayor y ms importante. De
utilidad en las investigaciones, la Estadstica nicamente va precedida por las
Matemticas y el sentido comn, de los cuales se deriva.




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


CAPITULO 2: Estadstica descriptiva

Leccin 6: Medidas de tendencia central

En muchas ocasiones, si no son todas, no vemos obligados a representar un
conjunto o (poblacin) o un subconjunto de datos (muestra) con pocos valores que
permitan dar a conocer en forma resumida la descripcin de los mismos. Es as
como se puede hacer uso de las medidas descriptivas.
Las medidas descriptivas, son el resultado de clculos matemticos sencillos
que tienen como objetivo representar o describir en forma muy resumida un grupo
de datos que componen una variable. Dependiendo de los datos que se quieren
representar; estos toman el nombre de Parmetros si proviene de una poblacin
o de Estimadores si son originados por una muestra.



Caractersticas de las medidas descriptivas.
Las caractersticas de las medidas descriptivas estn en funcin de que le valor
obtenido cumpla con la funcin para lo cual fue calculado (Martnez, 2005).
Debe estar representada por un solo valor.
Debe ser objetiva y definida por una frmula algebraica, de tal manera que
cualquiera que sea la persona que trabaje con los datos, obtenga siempre el
mismo valor.
Medias
descriptivas
Poblacin Muestra
Parmetros Estimadores


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Debe ser descriptiva de los datos en forma que su significancia sea fcil de
entender.
No debe ser una abstraccin matemtica, que nicamente pueda ser
entendida por personas muy versadas en esta ciencia, ya que una de las
funciones de la estadstica es simplificar los datos y no hacerlos ms
complejos.
Debe ser fcil de calcular.
Debe ser calculada con todos los elementos del grupo de datos.
Debe depender de todo el grupo de datos, de tal manera que si se altera uno
de estos, consecuentemente se altera el valor obtenido.
A pesar de que cada uno de los valores del grupo de datos, debe tener
influencia sobre la medida obtenida, sta debe ser de tal calidad que no vea
influenciada en gran medida por el cambio de algunos pocos datos.
Debe ser de uso fcil para clculos matemticos posteriores.
De otra forma, dependiendo su naturaleza y funcin, las medidas descriptivas se
pueden clasificar en:
Medidas de tendencia central
Medidas de dispersin
Medidas de forma
Medidas de posicin

Notacin Sigma.
Antes de iniciar la presentacin de las medidas descriptivas, se debe estar en
capacidad de de entender el uso del smbolo matemtico (sigma); el cual es uno
de los smbolos ms frecuentes en las frmulas estadsticas.
(sigma); significa sumatoria, es decir; que se debe sumar el grupo de datos con
el que se cuenta.
Si se tiene la notacin:
n
n
i
y y y yi + + + =

=
...
2 1
1
; donde:
Es el operador de la suma.
yi Es la variable que se va a sumar.
i Es el ndice de la suma


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

1 Designa el nmero lmite inferior de donde se debe iniciar la suma de los
datos.
n Designa el nmero lmite superior de donde se debe iniciar la suma de los
datos

=
n
i
yi
1
Indica; smese todos los valores observados de una variable cuyos
subndices estn comprendidos entre 1 y n
Ejemplo: dado el conjunto de datos 1, 2, 3, 4, 5; los cuales quieren decir y
1
=1, y
2

=2, y
3
=3, y
4
=4 y
5
=5.

5 4 3 2 1
5
1
y y y y y yi
i
+ + + + =

=
15 5 4 3 2 1
1
= + + + + =

= i
yi

5 4 3 2
5
2
y y y y yi
i
+ + + =

=
9 5 4 3 2
5
2
= + + + =

= i
yi

2 2
4
2 2 2
5
1
2
5 3 2 1
y y y y y y
i
i
+ + + + =

=
55 5 4 3 2 1
2 2 2 2 2
5
1
2
= + + + + =

= i
i
y
( )
2
5 4 3 2 1
2
5
1
y y y y y yi
i
+ + + + = |

\
|

=
( ) 225 ) 15 ( 5 4 3 2 1
2 2
2
5
1
= = + + + + = |

\
|

= i
yi
) 3 5 ( ) 3 4 ( ) 3 3 ( ) 3 2 ( ) 3 1 ( ) 3 (
5
1
+ + + + =

= i
yi

2 2 2 2 2 2
5
1
) 3 5 ( ) 3 4 ( ) 3 3 ( ) 3 2 ( ) 3 1 ( ) 3 ( + + + + =

= i
yi
) 5 ( 3 ) 4 ( 3 ) 3 ( 3 ) 2 ( 3 ) 1 ( 3 3
5
1
+ + + + =

= i
yi

Medidas de tendencia central.
Es una forma til de describir mediante un solo dato, la totalidad de un grupo de
datos. Como su nombre lo indica es un dato hallado en el centro de la distribucin;
es el punto central o medio entre el conjunto de datos. En Bioestadstica se usan
varios tipo de datos como medida de tendencia central; cada una de ellas con sus
ventajas y desventajas si de compararlas se trata, las cuales marcan la
confiabilidad o no del dato obtenido.
Las principales medidas de tendencia central son:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Media Aritmtica.
Media Ponderada.
Media Geomtrica.
Mediana.
Moda.
Media Aritmtica: es la medida de tendencia centrada ms utilizada, la ms
conocida y sencilla de calcular. Generalmente se le denomina media , promedio
media para datos no agrupados y se define como la suma de un conjunto de
datos u observaciones, dividido entre el nmero total de observaciones que
conforman el grupo sumado. Si corresponde a la media de una poblacin se
denomina con el smbolo , mientras que para una muestra se simboliza x ; por
lo que la frmula sera:
Para una poblacin:
n
x
n
i
i
=
=
1
Para una muestra:
n
x
x
n
i
i
=
=
1

En forma aplicable
n
x x x x
n
+ + + +
=
...
3 2 1

Ejemplo: la media aritmtica del conjunto de observaciones 2, 5, 7, 6, 4, 8, sera:
33 . 5
6
32
6
8 4 6 7 5 2
= =
+ + + + +
=
Propiedades de la media aritmtica:
Se expresa en las mismas unidades de medida en que fueron tomados los
datos originales.
La media aritmtica de una constante es igual a la constante. Ejemplo. Si se
pesan un grupo de 4 conejos y todos pesan 300 gramos; la media aritmtica
es 300 gramos
300
4
1200
4
300 300 300 300
= =
+ + +
= x gramos
La suma algebraica de las diferencias de los valores con respecto a la media
aritmtica, debe ser igual a cero*.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

La suma de los cuadrados de las diferencias con respecto a la media
aritmtica es menor que la suma de de los cuadrados de las diferencias con
respecto a cualquier otro valor**.

Ejemplo de las propiedades. Si se tiene el siguiente conjunto de datos. 3, 5, 7, 8,
4, 5, 6, 3, 8, 7, 5; entonces:
CONJUNTO DE DATOS

Datos
Diferencias
con el
promedio
Diferencias
al
cuadrado
diferencias
con otro
valor
Diferencias
ala
cuadrado
X
i
X
i
- x D
2
X
i
3 D
2

x1 3 -2,55 6,48 0 0
x2 5 -0,55 0,30 2 4
x3 7 1,45 2,12 4 16
x4 8 2,45 6,02 5 25
x5 4 -1,55 2,39 1 1
x6 5 -0,55 0,30 2 4
x7 6 0,45 0,21 3 9
x8 3 -2,55 6,48 0 0
x9 8 2,45 6,02 5 25
x10 7 1,45 2,12 4 16
x11 5 -0,55 0,30 2 4
5,55 0,00 32,73 28,00 104,00

Promedio
x
*Suma
algebraica
de las
diferencias
debe ser 0,
0
**suma
algebraica
de las
diferencias
ala
cuadrado
suma de
las
diferencia
con el
valor 3
**suma de
las
diferencias
(con el
valor 3) al
cuadrado

Ventajas de la media aritmtica:
Es la medida ms fcil de calcular y ms comnmente usada.
Esta medida se define mediante una ecuacin matemtica muy fcil de
entender y aplicar. Esto implica que su resultado es fcil de analizar y explicar.
Es una herramienta para cualquier otro tipo de clculo.
Es susceptible de graficar o representar con ilustraciones.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Desventajas de la media aritmtica:
Es sensible a valores extremos (muy altos o muy bajos) en los cuales un solo
valor puede causar una media aritmtica no representativa para un grupo de
datos. Ejemplo. Si se tienen los valores 5, 4, 7, 5, 18. la media aritmtica sera
7,8; lo cual indica un valor muy alto para el grupo de datos y que est
influencias por el dato extremo 18.
Por la forma como se distribuyen los datos de una variable, no es
representativa para resumirlos y se puede concluir mal sobre dicho dato. En
este caso, depende de la habilidad del investigador para dar la validez al valor
de la media.
Cuando las observaciones se han presentado en una tabla de frecuencias, el valor
aproximado de la media aritmtica, que se llamara media aritmtica de datos
agrupados, se puede obtener mediante la siguiente ecuacin:
n
n n
i i
n n n
n x n x n x
n
n x
x
...
...
2 1
2 2 1 1
+ +
+ + +
= =
)

Donde;
i
x corresponde a las marcas de clase y
i
n corresponde a las frecuencias
absolutas que se han determinado para cada clase. Para los valores de la tabla de
frecuencia se podra determinar como aproximacin de la media aritmtica el
siguiente valor.
12 16 19 22 27 20 14 11 9
12 5 . 127 16 5 . 122
19 5 . 117 22 5 . 112 27 5 . 107 20 5 . 102 14 5 . 97 11 5 . 95 9 5 . 87
+ + + + + + + +
+ +
+ + + + + +
= =

x x
x x x x x x x
n
n x
x
i i
)

02 . 109
150
16353
= = x
)

Media Ponderada: A veces diferentes valores que se promedian, tiene
importancia desigual dentro del conjunto de datos, por lo cual es recomendable
tener en cuenta la importancia relativa dentro de todo el conjunto de datos.
Si W es la importancia relativa del valor de n
i
, entonces la media ponderada est
dada por:
i
i i
w
n
n w
x

=
)



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Ejemplo: En un produccin de mango Tommy, los frutos se distribuyen segn su
calidad en tres clasificaciones, A, B, C, D. Cada una de estas clasificaciones
permite un precio en el mercado y se desea saber cul es el precio promedio de
toda la produccin de un lote.


PRECIO PROMEDIO DE TODA LA PRODUCCIN DE UN LOTE
Clasificacin
Precio
(Kg)
Produccin
(Kg) w
i
x n
i

W
I
n
i
A 3.000 1.200 3.600.000
B 2.800 2.500 7.000.000
C 2.500 3.450 8.625.000
D 1.800 6.420 11.556.000
13.570 30.781.000

i
n

i i
w n

i
i i
w
n
n w
x

=
)
31 , 268 . 2
570 . 13
000 . 781 . 30
= =
w
x
)
Kg de mango.
Esto indica que en promedio, el kilogramo de mango a esos precios (de acuerdo a
las clasificaciones) se vender a 2.268,31 pesos.
La mediana: es el valor que se ubica en el centro de un conjunto de datos,
cuando las observaciones est organizadas de forma ascendente o descendente
(por magnitud). De otra forma, se podra definir como el valor de la variable que
supera a no ms de la mitad de las observaciones y al mismo tiempo es superada
por no ms de la mitad de las observaciones.
Propiedades de la mediana:
Es el punto central de los datos cuando son ordenados por magnitud.
Se dan en las mismas unidades en que fue medida la variable.
No est influencia por valores repetidos.
Ventajas de la mediana:
Es un concepto claro y fcil de entender por su simple empleo matemtico.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Es un valor insesgado cuando se refiere a la influencia de datos extremos; es
decir, no es afectada por la presencia de datos extremos, como le sucede a la
media aritmtica.
Desventajas de la media aritmtica:
Es necesario ordenar los datos por magnitud (ascendente o descendente).
No se adapta a clculos posteriores, por cuanto solo sirve como medida de
descripcin o resumen.
No es sensible a cambio de valores entre el grupo de datos.
Para hacer el clculo de la mediana, como primera media se debe conocer el
nmero de datos con que se compone la variable a analizar (conocer n) y
segundo, determinar la posicin del dato central en toda la variable. Para cumplir
con el primer requisito, es indispensable contar los datos. Para el segundo
requisito se puede hacer uso de la siguiente frmula:
(

\
|
+ |

\
|
=
2
1
2
n
Y Me
Para un conjunto de elementos donde se tienen 8 datos, 4, 5, 7, 9, 10, 11, 12, 14;
la mediana estara ubicada en:
5 , 4
2
9
2
1
2
8
= =
(

\
|
+ |

\
|
= Y Me Indicando que la mediana se ubicara entre el 4 y 5
dato.
Otro punto a saber para poder determinar la mediana, es diferenciar si el conjunto
de datos tiene como n un nmero par o un nmero impar. Para calcular la
mediana de un conjunto de datos impar, se ordenan los datos por magnitud y se
busca el nmero central en la distribucin.
Ejemplo. Si se tiene los datos 2, 14, 4, 11, 7. Al ordenarlos por magnitud de
menor a mayor, quedaran: 2, 4, 7, 11, 14. Cuando se busca el dato central se
dira que 3
2
6
2
1
2
5
2
1
2
= =
(

+
(

=
(

+
(

n
; por lo tanto la mediana sera el dato que se
ha ubicado en el tercer lugar por magnitud, es decir la mediana corresponde a 7
(M
e
=7)
2, 4, 7, 11, 14
(M
e
=7)


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Cuando el nmero de observaciones es par, la mediana es igual al promedio
aritmtico de las dos observaciones centrales, es decir, el valor resultante de la
suma de los dos valores centrales, est dividida por dos.
La moda: cuando la frecuencia de un valor en una distribucin de frecuencias es
mayor que la de otros valores; dicho valor constituye la moda. En general, la moda
(M
o
) de un conjunto de datos, es el valor (si existe) que ms se repite. Cuando en
un conjunto de datos se encuentra que solo un dato tiene un mximo de
repeticiones dentro del conjunto, se llamara una distribucin unimodal, si se
presentan dos datos con la misma cantidad de veces que se repiten se denomina
bimodal, y si es el caso de tres datos que se repiten la misma cantidad de veces
sera trimodal y as sucesivamente para clasificarse como multimodal.
Ejemplo. En el caso de los datos (1, 4, 3, 1, 2, 5,), la moda sera 1; es el dato que
ms se repite en el conjunto y en este caso es una distribucin unimodal. Para el
conjunto (2, 4, 2, 3, 1, 5, 1), los nmeros 1 y 2 ocurren con la misma frecuencia y
por tanto la distribucin es bimodal.
Se debe tener en cuenta y como sucede en los ejemplos anteriores, la moda no
siempre es una medida de tendencia central y puede incluso, ubicarse en unos de
los extremos de la distribucin de datos. Es una medida fcil de hallar por qu no
necesita de clculos matemticos, pero si requiere de una persona que conozca la
distribucin de los datos y ms cuando el n es grande.
Medidas de dispersin
Las medidas que se han visto anteriormente carecen de validez para indicar si son
representativas para un conjunto de dato o no. Tal es el siguiente ejemplo, donde
se tiene el conjunto de datos (3, 6, 3, 45, 32, 80, 20, 5,), donde el promedio es
24,5, el cual no es representativo por la variabilidad de los datos por esta razn se
han diseando los clculos de las medidas de dispersin. Estas medidas indican
el grado de variabilidad entre las observaciones, las ms comunes son:
Amplitud.
Varianza
Desviacin estndar.
Coeficiente de varianza.
Al calcular un promedio, por ejemplo la media aritmtica, no sabemos su
representatividad para ese conjunto de datos. Por esto se hace necesario
determinar si hay concentracin de datos alrededor del promedio, lo cual nos
indicara una buena aplicacin en su uso, por el contrario una gran dispersin
estara indicando poca representatividad, reduciendo la confiabilidad. El estudio de


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

la dispersin o separacin de los datos de la serie se conoce con el nombre de
teora de la dispersin.
Amplitud: es la medida de dispersin ms simple de calcular y se obtiene con la
diferencia entre el mayor y el menor de los valores del conjunto de las
observaciones. Tambin es llamado rango o recorrido. Se usa ocasionalmente,
pero en la mayora de los casos est influenciada por datos extremos.
Si se denota la amplitud, rango o recorrido como R, el mayor valor como X
L
y el
menor como X
S
, entonces:
S L
X X R =
Utilizando los datos de la tabla 10, la amplitud, rango o recorrido es:
Dato mayor = 129 Dato menor = 85
R = 129 85
R = 44
La utilidad del recorrido es limitada. El hecho de que slo tome en cuenta dos
valores, hace que sea una medida pobre en cuanto a dispersin. La ventaja
principal de utilizarla es su sencillez de clculo.
Varianza. Cuando los valores de un conjunto de observaciones estn muy
prximas a su media, la dispersin es menor que cuando estn distribuidos sobre
un amplio recorrido. La varianza se define como la media aritmtica de los
cuadrados de las diferencias (desviaciones) entre los valores que toman la
variable y su media aritmtica. De otra forma es la suma de cuadrados de las
desviaciones de las observaciones con respecto a su media, dividida por el
nmero de observaciones.
Si se observan las dos definiciones anteriores, aunque indican lo mismo, en la
primera lectura, no son muy claras; por lo que es preciso saber como se calcula
para facilitar su comprensin.
Su smbolo es S
2
en una muestra y
2
(sigma al cuadrado) para una poblacin.
Para calcularla, se resta la media a cada uno de los valores, se elevan al cuadrado
las diferencias. Estas diferencias se suman para dividirla entre el tamao de la
muestras (menos 1) o de la poblacin. De esta forma la ecuacin es:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Para una muestra
1
) (
2
2

n
X x
S
I

Para una poblacin
N
X x
i

2
2

Procedimiento de clculo.
Se calcula la media aritmtica.
Se establece la diferencia entre los valores de la variable y la media
aritmtica.
Se elevan al cuadrado los valores obtenidos como diferencia.
Se suman las diferencias elevadas al cuadrado.
La suma obtenida se divide en n-1 para una muestra o N en para una
poblacin.
Ejemplo. Se desea conocer la varianza de los siguientes elementos: 3, 6, 7, 8, 2,
5, 6. de acuerdo a los pasos anteriores, se puede construir una tabla.
DATOS DE VARIANZA
Valores

X
i
Diferencias

d
Diferencias
al
cuadrado
d
2
3 -2,3 5,4
6 6,0 36,0
7 7,0 49,0
8 8,0 64,0
2 2,0 4,0
6 6,0 36,0

=
n
i
i
x
1
32

194,4
Suma de
d
2
2
) ( X x
I


5,3
Promedio


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Entonces;
1
) (
2
2

n
X x
S
I

1 6
4 , 194
2

= S 46 , 5
2
= S
La razn de que en un muestra se divida entre n-1, en lugar de n, es por la
consideracin terica conocida como grados de libertad y a un ajuste para que el
resultado sea representativo para la poblacin. Cuando el nmero de
observaciones es muy grande, puede resultar tedioso el uso de las ecuaciones
anteriores y por tanto se puede facilitar el trabajo de la siguiente forma.
Para una muestra
) 1 (
2
1 1
2
2

\
|

=

= =
n n
x x n
S
n
i
i
n
i
i

.
Propiedades de la varianza.
La varianza debe ser siempre un valor positivo.
La varianza de una constante es igual a cero.
La varianza de un conjunto de datos no tiene interpretacin sobre las
unidades de medida en que fueron tomados los datos ya que corresponde a
un potencializacin (elevados al cuadrado) de las diferencias entre los
datos con el promedio; simplemente es una medida que sirve como ndice
de variabilidad y su valor matemtico aumenta cuando es utilizada para
otros clculos.

Desviacin tpica o estndar. La desviacin tpica es la raz cuadrada de la
varianza, considerada siempre con signo positivo. Es la medida de dispersin ms
extensamente aplicada. En el caso de una muestra se denota con la letra s y para
una poblacin .
Para una muestra
1
) (
2

n
X x
s
I
en forma resumida
2
S s =
Para una poblacin
N
X x
I
2
) (
=

en forma resumida
2
=


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

De esta forma, la desviacin estndar para el ejemplo anterior, corresponde a:
2
S s = 46 , 5 = s 33 , 2 = s
Lo cual indica que el promedio del conjunto de datos es de 5,33 2,33.
Propiedades de la desviacin tpica o estndar.
Es un clculo real de las unidades en que fue medida la variable.
Se expresa en las mismas unidades en que fue medida la variable.
Para mencionarse en documentos cinticos o de carcter investigativos
debe colocar el promedio desviacin estndar ( s X )
Puede decirse que para cualquier distribucin normal, la media aritmtica
oscila entre
Coeficiente de variacin. Ms conocido como Coeficiente de Varianza (CV) o
Variacin relativa. La desviacin estndar es til como una medida de variacin
dentro de un determinado conjunto de datos. Sin embargo, cuando se desea
comparar la dispersin de dos conjuntos de datos, el comparar las dos
desviaciones puede conducir a resultados ilgicos y ms an cuando estas han
sido medidas en diferentes unidades. Por ejemplo. Se desea saber si la ganancia
de peso de terneras de leche con determinado alimento es menos o ms variable
que la produccin de leche en vacas alimentadas con la misma racin.
An cuando se utilice la misma unidad de medicin, las dos medias pueden ser
distintas. Si se compara la desviacin estndar de la ganancia de peso de terneros
destetos (kg) con la desviacin estndar de la ganancia de peso de terneros al
ao, puede encontrarse en stos ltimos, un valor de desviacin numricamente
mayor que la de los primeros debido a que lo propios pesos son mayores y no
porque la dispersin sea mayor.
El coeficiente de variacin se expresa en porcentaje y por tanto es un ndice de
fluctuacin de la media aritmtica que da un valor entre 0,0% y 100%. Para esto la
ecuacin es:
) 100 (
X
s
CV =
Para el ejemplo que se ha venido trabajando, el coeficiente de varianza
corresponde a:
) 100 (
X
s
CV = ) 100 (
33 , 5
46 , 5
= CV 025 , 1 = CV


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Esto indica que el grupo de datos tiene un CV de 1,025%. Se puede determinar
que el conjunto de datos es homogneo ya que tiente como coeficiente de
varianza un valor inferior al 12%. En el caso de ser mayor al 12%, se califica como
una distribucin heterognea.
Ejemplo. Un granjero produce hortalizas en dos lotes diferentes. En el lote A se
tiene una produccin promedio de 14.450 kg y en el lote B de 18.750 kg. Ambos
lotes tienen como tamao 1 hectrea. En el primer lote se tiene una desviacin
estndar de 2.950 kg y en el segundo 3.120 kg. El granjero tiene como prioridad
establecer solo la produccin en el lote que tenga menor variabilidad entre los
ciclos de produccin y as poder sacar al mercado hortalizas ms homogneas.
De esta forma se puede determinar la variabilidad as:
) 100 (
X
s
CV = Lote A: ) 100 (
450 . 14
2950
= CV % 41 , 20 = CV
Lote B: ) 100 (
750 . 18
120 . 3
= CV % 64 , 16 = CV
El resultado determina que el lote B es el que menor variabilidad presenta entre
los ciclos de cultivo y por tanto, para el inters del productor es el mejor lote.

Medidas de posicin

Deciles, Cuartiles y Percentiles. Cuanto la distribucin contiene un nmero alto
de intervalos o marcas de clase y se quiere obtener un promedio de una parte de
ella, se puede dividir la distribucin en cuatro, diez o cien partes. En el primer caso
se denominan Cuartiles, en el segundo se denomina Deciles y en el tercero
Percentiles.
Cuartil. Se denomina a la medida central que divide la distribucin en cuatro
partes iguales, mostrando el comportamiento promedio de la cuarta parte de la
poblacin o muestra analizada; medida que es anloga a la mediana, variando
simplemente los puntos de referencia. El cuartil se simboliza con la letra Q i el
subndice i que determina el orden, a que pertenece.
Q1. Representa el primer cuartil o el promedio del 25% de la poblacin
analizada y su punto de referencia es n/4.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Para datos no agrupados
n
n
Q
) 1 ( 1
1
+
=
Para datos agrupados C
n
N
n
L Q
k
k

(
(
(

+ =
1
1 1
4

Donde: n/4; es el punto de referencia del cuartil.
L
1
; corresponde en la tabla de frecuencias al lmite inferior donde
se ubica el punto de referencia.
1 k
N ; es la frecuencia absoluta acumulada en el intervalo anterior
donde est ubicado el punto de referencia.
k
n ; es la frecuencia absoluta en el intervalo donde se ubica el
punto de referencia.
Q2. Representa el segundo cuartil o el promedio del 50% de la poblacin
analizada y su punto de referencia es 2n/4.
Para datos no agrupados
n
n
Q
) 1 ( 2
1
+
=
Para datos agrupados C
n
N
n
L Q
k
k

(
(
(

+ =
1
1 2
4
2

Q3. Representa el tercer cuartil, mostrando el comportamiento promedio del
75% de la poblacin y su punto de referencia es 3n/4.
Para datos no agrupados
n
n
Q
) 1 ( 3
1
+
=
Para datos agrupados C
n
N
n
L Q
k
k

(
(
(

+ =
1
1 3
4
3

Ejemplo para datos no agrupados. Si se tiene los siguientes valores 16, 10, 4, 8,
12, 10, 8, 20, 4, 13, 12, 22, 16, 26, 20, calcular el primero, segundo y tercer cuartil.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Para entender el conceptos se ordenan los datos de menor a mayor 4, 4, 8, 8, 10,
10, 12, 12, 13, 16, 16, 20, 20, 22, 26.
n
n
Q
) 1 ( 1
1
+
=
4
) 1 15 ( 1
1
+
= Q
4
16
1
= Q 4
1
= Q
El primer cuartil est ubicado en el cuarto lugar y por tanto corresponde al valor 8.
n
n
Q
) 1 ( 1
2
+
=
4
) 1 15 ( 2
2
+
= Q
4
32
2
= Q 8
2
= Q
El segundo cuartil est ubicado en el octavo lugar y por tanto corresponde al valor
12
n
n
Q
) 1 ( 1
3
+
=
4
) 1 15 ( 3
3
+
= Q
4
48
3
= Q
12
3
= Q
El tercer cuartil est ubicado en el decimosegundo lugar y por tanto corresponde al
valor 20.

Estadgrafo de forma
Con estos estadgrafos se pretende determinar si una distribucin es simtrica o
asimtrica. Si la distribucin es simtrica se dice que corresponde a una
distribucin normal cuya curva representativa es la campana de Gauss.
Cuando una distribucin es normal, la media aritmtica, la mediana y la moda son
iguales. Cuando la media aritmtica es menor que la mediana y sta, a su vez,
menor que la moda, la distribucin es sesgada a la izquierda o asimtrica
negativa. Si la media aritmtica es mayor que la mediana y sta es mayor que la
moda, decimos que la distribucin es sesgada a la derecha o asimtrica positiva.
Para calcular el grado de asimetra denominado sesgo, se utiliza el coeficiente de
Pearson (S) con cualquiera de las siguientes ecuaciones:
tpica desviacin
a media mod
S

=
s
Mo X
= S
tpica desviacin
mediana) - 3(media
S=
s
Me X
= S
Para su interpretacin se debe tener en cuenta la siguiente clasificacin:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Si el sesgo (S) es igual a cero, la distribucin es simtrica o normal (S= 0).
Si el sesgo (S) es menor a cero, la distribucin es sesgada a la izquierda o
asimtrica negativa (S< 0).
Si el sesgo (S) es mayor que cero, la distribucin es sesgada la derecha o
asimtrica positiva (S> 0).
Grafica 7. Representaciones de simetra







Leccin 7: Distribucin de Frecuencias

La primera etapa del anlisis y la interpretacin de un conjunto de datos es la
reduccin del nmero de observaciones en un conjunto de estadsticas
descriptivas que presenten las caractersticas importantes de los datos, ya sea de
una muestra o de una poblacin. Dicho resumen se hace con un cuadro llamado
cuadro de distribucin de frecuencias y posteriormente con grficas como los
histogramas, polgonos, pictogramas, diagramas circulares, etc.
La distribucin de frecuencias es un mtodo utilizado para organizar y resumir
datos. Bajo este mtodo los datos que componen una serie se clasifican y
ordenan, indicndose el nmero de veces que se repite. La distribucin nos
permite manejar gran cantidad informacin en espacios pequeos.
Pasos para elaborar una tabla de frecuencias:
1. Estimar el rango (R)
2. Determinar el nmero de clases (m)
3. Estimar el ancho de cada clase (amplitud de intervalo, C)
4. Estimar lmite inferior y superior de cada clase (x
i-1
x
i
)
5. Estimar las marcas de clase (X
i
).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

6. Determinar la frecuencia absoluta (n
i
)
7. Determinar la frecuencia absoluta acumulada (N
i
)
8. Determinar la frecuencia relativa (h
i
)
9. Determinar la frecuencia relativa acumulada (H
i
)
1. Estimacin del rango (R). El rango o recorrido es el valor que se obtiene de la
distancia entre el menor y el mayor valor de las observaciones.
Ejemplo: si se tiene el siguiente conjunto de datos. 74, 71, 65, 72, 67, 79, 88, 66,
99, 40, 52.
El rango o recorrido se obtendra:
Dato mayor = 94 Dato menor = 40
R = 94 40
R = 50
2. Estimacin del nmero de clases (m). Para elaborar una tabla de frecuencias,
se establece cierto nmero de clases (denotada con la letra m) en los valores
observados. Dicho nmero por lo general vara entre 5 y 15 a mayor nmero de
datos, debe disponerse de mayor nmero de clases. Se debe tener en cuenta que
si el nmero de clases es muy pequeo, se podra estar encubriendo
caractersticas importantes de los datos debidos al agrupamiento; si se tienen
demasiadas clases, pueden aparecer clases vacas y la informacin no se resume
de forma clara.
Existen dos formas de obtener el nmero de clases a utilizar en un cuadro de
frecuencias; partiendo ambos de la cantidad de datos con que se cuenta (en el
caso de ser una muestra n o en el caso de ser una poblacin N).
a. Sabiendo que se recomienda tener un nmero de clases entre 5 y 15, el
investigador puede definir de acuerdo al nmero de datos que tenga,
cuantas clases puede manejar.
b. Si se quiere ser ms preciso, se puede utilizar la formula Sturges, la cual
dice que m=1+3,322(log n); donde m es el nmero de intervalos de clase.
En la mayora de los casos, la aplicacin de esta frmula da nmero
decimales, por lo que es necesario aproximar para tomar un nmero entero
de clases. Por ejemplo, si la frmula da que debe tomar 7,8 clases se
aproximara a 8 clases.
Por ejemplo. Si se ha tomado el dimetro en la base de 758 rboles de un
bosque que se compona de 14.250 rboles, el nmero de clases quedara
as:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

m=1+3,322(log n)
m=1+3,322(log 758)
m=1+3,322(2,8796)
m=1+9,5662
m=10,5662
m=11 clases.
Para justificar cualquiera de los dos mtodos siendo ms usado el primero, es
preciso que la decisin sea tomada por una persona que conozca muy bien los
datos y el uso que se les va a dar.
3. Estimacin del ancho de cada clase (amplitud de intervalo, C). Es el valor que
va a tener como amplitud en cada una de las clases que se han establecido. Es
recomendable estimar un solo valor de amplitud para todas las clases que se
pretendan manejar en la tabla de frecuencias, esto le da ms confiabilidad y
presentacin al resumen de datos que se pretende hacer. El ancho de la clase se
obtiene dividiendo el rango entre el nmero de clases.
Ejemplo. Si el rango de un conjunto de datos es 176, y se pretende que en la
tabla de frecuencias se presenten 8 clases, entonces, el ancho de cada clase
corresponde a:
m
R
C = ;
8
176
= C ; C = 22
Esto implica que cada una de las 8 clases tendr un ancho o amplitud de 12
unidades.
En muchos casos al efectuar la divisin anterior, se obtienen nmero decimales,
por lo que se aconsejan dos decisiones:
a. Cambiar nmero de clases por uno que permita obtener valores enteros.
b. Aproximar el ancho de clase a un valor por encima del valor que se obtiene
para evitar que en momento de agrupar los datos se queden datos sin
representar.
Ejemplo: si se tiene un rango de 425 y se pretende dividir en 6 clases, el
ancho de las clases quedara as:
m
R
C = ;
6
425
= C ; C = 70,8


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Esto equivaldra, para facilitar los clculos y organizacin de la tabla a 71.
c. En algunos casos se hace necesario ajustar tanto el nmero de clases
como aproximar el ancho de estas para evitar que la ltima clase quede con
muy pocos nmeros que lo representan. Esto recordando que la divisin de
los intervalos est dada en funcin del rango y este a su vez por el dato
mayor y el dato menor del conjunto.
Ejemplo: si se tiene un rango de 254 y se pretende dividir en 9 clases, la
amplitud de cada clase sera:
m
R
C = ;
9
254
= C ; C = 28,22
Si se toma como amplitud de cada clase 28, se perderan 0,22 unidades en
cada clase, los que indica que en las 9 clases se perdera (0,22 x 9)= 1,98
unidades. Esto implica que al hacer la tabla de frecuencias se queden datos
por fuera, incluido el dato mximo que permiti sacar el rango.
Por otro lado, si se aproxima el 28,22 a 29, se estara aumentando por cada
clase (29-28,22) = 0,78 unidades, que en las 9 clases sera (0,78 x 9)=7,02
unidades. Esto implica que en la ltima clase del cuadro se tenga un
espacio perdido que est por encima del dato mayor con el que se sac el
rango.
En este caso la mejor solucin es, hacer un cambio en la cantidad de clases
a trabajar y a este nuevo ancho de clase aproximar para evitar lo expuesto
anteriormente.
4. Estimar lmite inferior y lmite superior de cada clase (x
i-1
x
i
). Una vez
determinado el ancho de cada clase, se puede estimar el lmite inferior y el lmite
superior en cada una de las clases. Este se obtiene tomando el dato menor del
conjunto de datos (que sera el lmite inferior de la primera clase) y sumndole el
ancho de clase, este resultado sera el lmite superior de dicha clase.
Este ltimo valor obtenido sera el punto de partida (lmite inferior) de la siguiente
clase, el cual, al sumarle el ancho de clase marcara el lmite superior de la clase
correspondiente. En forma sucesiva se sigue haciendo esta operacin hasta
calcular los lmites para todas las clases propuestas, teniendo en cuenta que la
ltima clase debe contener el valor mximo del conjunto de datos.
Ejemplo. Si se tienen las siguientes condiciones:
Dato menor 25


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Dato mayor 125
Rango 100
Nmero de clases 5
Ancho de clase 20
Los lmites serian:
Clase limites
(C) (x
i-1
x
i
)
1 25 - 45
2 45 - 65
3 65 - 85
4 85 - 105
5 105 - 125
Como se puede ver, existe un problema en los lmites sealados anteriormente. El
problema es que si en el conjunto de datos aparece 45, dnde ubico este valor?
En la clase 1 o en la clase 2. Para solucionar esto se tiene dos propuestas:
a. Que los intervalos a partir de la segunda clase, se manejen con nmeros
decimales en su lmite inferior.
Los lmites serian:
Clase limites
(C) (x
i-1
x
i
)
1 25 - 45
2 45.1 - 65
3 65.1 - 85
4 85.1 - 105
5 105.1 - 125



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

b. Que los lmites en cada una de las clases se clasifique como intervalos cerrados
[ ] o intervalo abierto ( ), o sus combinaciones [ ) ( ] , esto implica que cada en
cada intervalo se coloque el signo respectivo. En el caso de ser un intervalo
cerrado en el lmite inferior [ indica que si se tiene el nmero igual al lmite inferior,
este se ubica en dicho intervalo; pero si el intervalo es abierto ( , no se tiene en
cuenta.
Los lmites serian:
Clase limites
(C) (x
i-1
x
i
)
1 [25 - 45)
2 [45 - 65)
3 [65 - 85)
4 [85 - 105)
5 [105 - 125]

Se puede observar que en la ltima clase, el lmite superior estn como intervalos
cerrado, ya que se est seguro que no existen datos por encima de este dato.
5. Marcas de clase. Corresponden al punto central en cada una de las clases que
se han tomado. Se obtiene sumando en cada clase el lmite inferior y el superior
para luego dividirlo en dos.
Con los datos anteriores se tenda como ejemplo:
EJEMPLO DE MARCAS DE CLASE.
Clase limites marcas de clase
(C) (x
i-1
x
i
) X
i

1 25 - 45 35 = ((25+45)/2)
2 45 - 65 55
3 65 - 85 75
4 85 - 105 95


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

5 105 - 125 115

6. Frecuencias absolutas (n
i
). Se define como el nmero de veces que se repite
un fenmeno. Corresponde al nmero de unidades experimentales que estn en
cada uno de los intervalos.
Tal vez la tarea ms difcil de hacer es la distribucin de frecuencia, ya que
implica hacer una clasificacin de todos los datos en cada una de las clases en las
que se estn resumiendo. Como se trata de estimar frecuencias, se tienen las
siguientes propiedades:
Las frecuencias absolutas son siempre nmeros enteros.
La suma de las frecuencias absolutas es igual a n si es una muestra, o N si es
una poblacin.
n n n n n n
m
n
i
i
= + + + + =

=
...
3 2 1
1

7. Frecuencias absolutas acumuladas (N
i
). A menudo es importante tener las
frecuencias acumuladas entre algunas clases, esto facilita la interpretacin y toma
de decisiones. Por ejemplo. Si las clases corresponden a edades de un grupo de
terneros para engorde y se quiere hace una clasificacin de los que son aptos
para la etapa de levante, es importante tener definido hasta cierta edad (lmite de
clase) cuantos animales corresponden o se pueden clasificar en levante.
m i
n n n n N + + + + = ...
3 2 1

Esto implica que el valor acumulado en el ltimo intervalo de clase corresponde al
total de observaciones o datos que se estn trabajando.
8. Frecuencias relativas (h
i
). Corresponde a la proporcin o porcentaje de los
valores que se incluyen en los distintos intervalos de clase. Se puede obtener
dividiendo la frecuencia absoluta de cada intervalo (n
i
) sobre el nmero total de
observaciones (n). La multiplicacin, de una de estas divisiones, por cien la
convierte en un porcentaje sobre el total de casos.
Las frecuencias relativas sin haberse multiplicado por cien, siempre dan un valor
decimal y la suma de todas estas debe dar 1.
n
n
h
i
i
=


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

1 ...
3 2 1
1
= + + + + =

=
m
n
i
i
h h h h h
9. Frecuencias relativas acumuladas (H
i
). Es la suma sucesiva de las
frecuencias relativas obtenidas en cada intervalo de clase.
m i
h h h h H + + + + = ...
3 2 1

Para ilustrar todo el proceso completo se presenta el siguiente ejemplo adaptado
de Surez, 1999: Suponiendo los pesos en kilos de los cerdos inscritos en la feria
de exposicin porcina en un municipio, en determinado ao. Con estos puntajes,
los directivos de la feria quieren preparar una distribucin de frecuencias. Los
datos obtenidos fueron:
PESO EN KILOS DE CERDOS INSCRITOS EN LA FERIA
88 91 104 113 125 101 114 105 101 88 126 118
100 111 125 119 91 106 120 129 120 109 104 112
101 113 100 106 105 121 93 89 124 96 105 95
91 106 93 88 89 100 115 98 108 99 120 101
108 118 118 113 114 109 91 104 109 110 113 119
106 106 97 104 105 122 112 124 108 121 96 97
99 101 116 102 127 121 116 100 95 89 103 115
113 129 91 85 108 103 108 98 108 114 102 96
99 108 114 121 107 122 100 116 111 109 104 113
118 110 129 124 105 93 115 120 97 112 94 113
114 106 105 115 98 112 103 92 125 107 115 118
128 92 85 108 114 125 121 122 117 109 128 88
119 119 116 113 122 126

1. Estimar el rango (R).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

El examen de los datos revela que los puntajes, ms bajos y ms altos son 85 y
129 kilos, respectivamente. Entonces, el intervalo inferior de clase debe empezar
desde 85 y el intervalo mayor debe tener un lmite no menor a 129.
ato mayor = 129 Dato menor = 85
R = 129 85
R = 44
2. Determinar el nmero de clases (m)
m=1+3,322(log n)
m=1+3,322(log 150)
m=1+3,322(2,17609)
m=1+7,2289
m=8,22
m=9. Clases.
3. Estimar el ancho de cada clase (amplitud de intervalo, C)
m
R
C = ; 88 , 4
9
44
= = C ; C = 5
4. Estimar lmite inferior y superior de cada clase (x
i-1
x
i
)
Los lmites serian:
LMITES DE CONFIANZA
Clase limites
(C) (x
i-1
x
i
)
1 [85 - 90)
2 [90 - 95)
3 [95 - 100)
4 [100 - 105)
5 [105 - 110)


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

6 [110 - 115)
7 [115 - 120)
8 [120 - 125)
9 [125 - 130]

5. Estimar las marcas de clase (X
i
).
Marcas de clase.
Clase limites marcas de clase
(C) (x
i-1
x
i
) X
i

1 [85 - 90) 87,5
2 [90 - 95) 92,5
3 [95 - 100) 97,5
4 [100 - 105) 102,5
5 [105 - 110) 107,5
6 [110 - 115) 112,5
7 [115 - 120) 117,5
8 [120 - 125) 122,5
9 [125 - 130] 127,5

6. Determinar la frecuencia absoluta (n
i
)
Frecuencias absolutas.
Clase limites marcas de clase frecuencias absolutas
(C) (x
i-1
x
i
) X
i
n
i
1 [85 - 90) 87,5 9
2 [90 - 95) 92,5 11


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

3 [95 - 100) 97,5 14
4 [100 - 105) 102,5 20
5 [105 - 110) 107,5 27
6 [110 - 115) 112,5 22
7 [115 - 120) 117,5 19
8 [120 - 125) 122,5 16
9 [125 - 130] 127,5 12
n n n n n n
m
n
i
i
= + + + + =

=
...
3 2 1
1

n = 150
7. Determinar la frecuencia absoluta acumulada (N
i
).
Frecuencias absolutas acumuladas.
Clase limites marcas de clase Frecuencias absolutas
Frecuencias abs. Acumuladas
(C) (x
i-1
x
i
) X
i
n
i
N
i
1 [85 - 90) 87,5 9 9
2 [90 - 95) 92,5 11 20
3 [95 - 100) 97,5 14 34
4 [100 - 105) 102,5 20 54
5 [105 - 110) 107,5 27 81
6 [110 - 115) 112,5 22 103
7 [115 - 120) 117,5 19 122
8 [120 - 125) 122,5 16 138
9 [125 - 130] 127,5 12 150



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

8. Determinar la frecuencia relativa (h
i
)
FRECUENCIAS RELATIVAS
Clase limites marcas Frecuencias Frecuencias
Frecuencias
de clase absolutas abs. Acumuladas
Relativas
(C) (x
i-1
x
i
) X
i
n
i
N
i
h
i
1 [85 - 90) 87,5 9 9 0,06
2 [90 - 95) 92,5 11 20 0,0733
3 [95 - 100) 97,5 14 34 0,0933
4 [100 - 105) 102,5 20 54 0,1333
5 [105 - 110) 107,5 27 81 0,18
6 [110 - 115) 112,5 22 103 0,1466
7 [115 - 120) 117,5 19 122 0,1266
8 [120 - 125) 122,5 16 138 0,1066
9 [125 - 130] 127,5 12 150 0,08
1 ...
3 2 1
1
= + + + + =

=
m
n
i
i
h h h h h

9. Determinar la frecuencia relativa acumulada (H
i
)
FRECUENCIAS RELATIVAS ACUMULADAS.
Clase limites marcas Frecuencias Frecuencias Frecuencias
Frecuencias
de clase absolutas abs. acum.. Relativas
Relat. acum.
(C) (x
i-1
x
i
) X
i
n
i
N
i
h
i
H
i


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

1 [85-90) 875 9 9 0,06
0,06
2 [90-95) 92,5 11 20 0,0733
0,1333
3 [95 -100) 97,5 14 34 0,0933
0,2266
4 [100-105) 102,5 20 54 0,1333
0,3599
5 [105-110) 107,5 27 81 0,18 0,5399
6 [110-115) 112,5 22 103 0,1466
0,6865
7 [115-120) 117,5 19 122 0,1266
0,8131
8 [120-125) 122,5 16 138 0,1066
0,9197
9 [125-130] 127,5 12 150 0,08 1

Con esta ltima tabla se puede iniciar un anlisis que permita determinar lo
siguiente:
El peso en el que mayor nmero de cerdos se presentaron a la feria esta
entre [105 y 110) kilos (en valores reales sera entre 105 y 109,99.
El peso en el que menor cantidad de cerdos se present est entre 85 y
89,9 kilos; con solo 9 animales que corresponden al 6% de todos los cerdos de la
feria. Esto permite saber que es muy poca la cantidad e cerdos con pesos entre
este intervalo y que por ejemplo, la junta de ferias no tomara consideraciones
sobre este pesaje.
Se podra decir que el 22,66% de lo cerdo (34) estn con un peso inferior a
99,9 kilos.
De esta forma se pueden sacar varias conclusiones de un grupo de datos y se
pueden presentar de forma resumida, resaltando la importancia desde el punto de
vista productivo, econmico, de impacto ambiental, etc., sin olvidar que estos
resultados o comportamientos de los datos tiene una explicacin y/o justificacin,
la cual solo el profesional correspondiente al rea de trabajo estara en capacidad


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

de argumentar. Desde este punto de vista, la bioestadstica deja de ser el uso de
simples mtodos de clculo para convertirse en una herramienta de
argumentacin en el comportamiento o resultado de variables biolgicas.
Leccin 8: Grficas

Con frecuencia, el significado de los datos se puede comunicar ms efectivamente
por medio de grficos que por medio de tablas. Existe una gran variedad de
formas para presentar los datos de una distribucin de frecuencias; entre los ms
conocidos se encuadran:
Histogramas
Polgonos de frecuencias
Ojivas
Diagrama circular o pastel
Pictogramas
Martnez 2005, presenta como recomendaciones para la elaboracin de grficas
lo siguiente:
La mejor grfica es la ms simple
Las grficas deben ser tan sencillas y claras, de tal manera que sean
comprensibles sin la ayuda de las descripciones del texto.
Las grficas nunca sustituyen al cuadro, al contrario, deben complementarse.
La finalidad de la grfica es visualizar mejor la informacin.
La grfica es considerada como el medio de expresin de la estadstica, ms
llamativa, sugestiva a la vez que presenta la ventaja de dejar en la memoria
una expresin ms duradera que los cuadros o el texto, en un menor tiempo
de lectura.

El histograma.
Es un tipo especial de grfica de barras para representar distribuciones de
frecuencias absolutas o relativas. Tiene las siguientes caractersticas:
Los valores de la variable que se est considerando se representan en el eje
horizontal (eje x o independiente). Las frecuencias absolutas o relativas se
representan en el eje vertical (eje y o dependiente).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Cada intervalo de clase tomado en la distribucin de frecuencias implica una
seccin sobre el eje horizontal.
Por encima de cada intervalo de clase sobre el eje horizontal se levanta una
barra rectangular, de modo que su altura corresponde con la frecuencia
correspondiente.
Ejemplo. Se presenta el histograma para la distribucin de frecuencias realizada
con el peso de cerdos y se tendra en valores absolutos:
GRFICA 1. HISTOGRAMA DE FRECUENCIAS ABSOLUTAS PARA EL
PESO (KG) DE CERDOS INSCRITOS EN LA FERIA












Grafica 2. Histograma de frecuencias relativas para el peso (kg) de cerdos
inscritos en la feria
0
5
10
15
20
25
30
c
a
n
t
i
d
a
d

d
e

c
e
r
d
o
s

Peso de los cerdos (kg)
85 90 95 100 105 110 115 120 125 130
0
5
10
15
20
25
30
c
a
n
t
i
d
a
d

d
e

c
e
r
d
o
s

Peso de los cerdos (kg)
85 90 95 100 105 110 115 120 125 130


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
85 90 95 100 105 110 115 120 125 130
p
o
r
c
e
n
t
a
j
e

d
e

c
e
r
d
o
s

Serie1


De los histogramas que se realicen a partir de una tabla de frecuencias, sin
importar si son con frecuencias absolutas o con frecuencias relativas, deben tener
una interpretacin que cumpla con los objetivos del trabajo que se haya planteado
como investigacin.
Polgono de frecuencias.
Se construye localizando el punto medio de cada intervalo de clase (marcas de
clase) en el eje X y marcando un punto al a altura de la frecuencia correspondiente
en el eje Y. Uniendo los puntos medios de las alturas se obtiene un polgono. Es
decisin del investigador si inicia o cierra la lnea trazada sobre el eje X; esto
mostrara hipotticamente que la frecuencia de un intervalo inferior y uno superior
a los que se tomaron, sera cero.
Ejemplo.
Grfica 3. Polgono de frecuencias absolutas para el peso de cerdos inscritos en
una feria.
Peso de los cerdos (kg)
85 90 95 100 105 110 115 120 125 130


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

0
5
10
15
20
25
30
87,5 92,5 97,5 102,5 107,5 112,5 117,5 122,5 127,5
peso de los ceredos (kg)
c
a
n
t
i
d
a
d

d
e

c
e
r
d
o
s



En el ejemplo anterior se puede ver que la lnea graficada se ha cerrado al inicio y
al final como si los intervalos anteriores y posteriores a los considerados en el
estudio tuvieran una frecuencia de cero. De la misma forma como se presenta
este polgono de frecuencias absolutas, se puede hacer con frecuencias relativas.
Otra forma de resumir los datos en una grfica, es la combinacin de un
histograma y un polgono de frecuencias. Para el ejemplo que se ha venido
trabajando, se tendra la siguiente grfica.
Grfica 4. Histograma y polgono de frecuencia para el peso de cerdos inscritos en
una feria.











UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Ojiva:
Es una representacin grfica para las frecuencias absolutas o relativas
acumuladas de una variable continua. Para ello se determinan los puntos de
interseccin entre cada valor de la variable y su respectiva frecuencia; luego se
unen los trazos rectilneos. Prcticamente es un polgono de frecuencias, con la
diferencia de ser aplicado a una tabla de frecuencias acumuladas.
Ejemplo.
Grfica 5. Ojiva de frecuencias absolutas acumuladas para el peso de cerdos
inscritos en una feria.








Diagrama circular, de pastel o torta: en este tipo de grficas los datos viene
sustituidos por superficies de reas proporcionales al nmero a representar. Las
grficas son particularmente tiles para visualizar las diferencias en frecuencias
entre algunas teoras del nivel nominal. Como ejemplo se puede tomar la siguiente
tabla donde se catalogan los cerdos segn el peso.

CATALOGO DE LOS CERDOS SEGN EL PESO
Clase limites frecuencias absolutas
(C) (x
i-1
x
i
)

n
i
Livianos [110 - 115) 22
Semi-livianos [115 - 120) 19


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Pesados [120 - 125) 16
Muy pesado [125 - 130] 12

Diagrama circular de clasificacin de cerdos segn el peso (kg).

Grfica 9. Clasificacin de cerdos segn el peso (kg).







Leccin 9: Principios de probabilidad

Generalmente en la cotidianidad se maneja el concepto de probabilidad, no solo
en lo relacionado con los juegos de azar sino en muchos otros aspectos. Por
ejemplo. Cuando se afirma el consumo excesivo de fibra causa timpanismo en
rumiantes, es probable que hoy d cra la yegua que est preada, es probable
que hoy llueva, caen rayos cuando llueve. Lo cual indica que el conocimiento
que tiene el hombre sobre los fenmenos es generalmente impreciso o incierto.
Esta falta de certeza sobre el resultado de un proceso es lo que ha generado el
concepto de fenmeno aleatorio, el cual puede decirse que es aquel cuyo
resultado no se pude conocer ni predecir con certeza. Los fenmenos aleatorios
no son del todo explicable debido, a que generalmente no se conocen en forma
exacta los factores que lo determinan y las leyes que los rigen.
La estadstica asigna a este grado de incertidumbre un valor entre 0 y 1, de tal
modo que resulta posible cuantificar aunque sea en forma relativa, que tan
probable o improbable es una determinada afirmacin.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

El estudio clsico de la probabilidad nace aproximadamente en el siglo XVII, en
especial del trabajo de dos matemticos, Pascal y Fermat. Gran parte de la teora
se desarroll a travs de los dados.
Para entender los principios de las probabilidades, es necesario conocer con
anterioridad algunos conceptos relacionados con la teora de conjuntos.
Experimento. Es un proceso por medio del cual se obtiene una observacin o
medicin. Un experimento aleatorio es aquel cuyos resultados no pueden
predecirse y por lo tanto estn sujetos al azar.
Espacio muestral. Es el conjunto formado por todos los resultados posibles de un
experimento, generalmente se indica con la letra S.
Ejemplo: se toma una semilla al azar y se le hace prueba de viabilidad. El
resultado puede ser: viable (V) o no viable (N); entonces el espacio muestral es:
{ } N V S , =
Si en el caso anterior se toman tres semillas, el espacio muestral ser:
{ } NNN NNV NVN VNN VVN VNV NVV VVV S , , , , , , , =
Se pretende determinar el nmero de conejos enfermos en un conjunto de 8
animales. El espacio muestral sera:
{ } 8 , 7 , 6 , 5 , 4 , 3 , 2 , 1 = S
Si con el caso anterior de los conejos, se pretende estimar el porcentaje de
conejos enfermos:
{ } 100 0 / = X X S
Si se pretende estimar el peso de uno de los conejos enfermos
{ } 0 / > = X X S
Eventos o sucesos. Es un conjunto de un espacio muestral. Ejemplo. El hecho
de que se encuentren tres o ms conejos enfermos en el espacio muestral donde
se determinan el nmero de conejos enfermos de los ocho que tiene el conjunto.
{ } 8 , 7 , 6 , 5 , 4 , 3 , 2 , 1 = S
{ } 8 , 7 , 6 , 5 , 4 , 3 = A Obsrvese que S contiene a A


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Si se divide el espacio muestral en un serie de eventos A
1
, A
2
, A
3
, A
n
y adems
A
1
A
2
A
3
A
n
= S, entonces esta divisin se denomina particin del
espacio muestral.
Un suceso que no puede ser descompuesto se denomina suceso simple; por
ejemplo al tomar una semilla, esta puede ser viable o no viable. Se indican con E
i

los sucesos simples:
E
1
Semilla viable
E
2
Semilla no viable
Para el espacio muestral de la viabilidad de tres semillas, los sucesos simples
seran
E
1
VVV E
5
VNN
E
2
NVV E
6
NVN
E
3
VNV E
7
NNV
E
4
VVN E
8
NNN
De este modo, el espacio muestral es el conjunto de todos los puntos muestrales
de un experimento y un suceso es un coleccin especfica de puntos muestrales.
Se pueden considerar como sucesos compuestos a la unin o interseccin de
otros sucesos.
Unin de sucesos. Sean A y B dos sucesos de un espacio muestral S. la unin
de A y B (AB) se define como el suceso que contiene todos los puntos
muestrales que estn en A, en B o en ambos.
Interseccin de sucesos. La interseccin de A y B es el suceso formado por
todos los puntos muestrales que estn en A y en B, (AB) o simplemente AB.
Complemento de un suceso. El complemento de un suceso A ( A ) es la
coleccin de todos los puntos muestrales en S que no estn en A.
Sucesos mutuamente excluyentes. Se dice que dos sucesos son mutuamente
excluyentes si el suceso de AB (AB) no contiene ningn punto muestral, lo cual
equivale a que no se pueden dar los dos eventos simultneamente. As como un
animal est enfermo o no.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Definicin de probabilidad clsica. Si un evento puede ocurrir en N maneras
mutuamente exclusivas e igualmente probables y si m de stas posee una
caracterstica E, la probabilidad de ocurrencia de E es:
N
m
E P = ) (
Esta definicin clsica o a priori, tiene serias limitaciones pues implcitamente
contiene el concepto de igualmente probable; queriendo decir que de un conjunto
de elementos donde se pretende seleccionar uno, todos tiene la misma
probabilidad de ser seleccionados. De la misma forma considera a priori que
todos los eventos tienen la misma probabilidad de ocurrir. Es as como muchos
otros problemas quedaran sin respuesta. Como por ejemplo: cul es la
probabilidad de que un ro aumente su caudal a ms de 1000 litros por segundo?,
cul es la probabilidad de que bovino aumente ms de 850 gramos por da?,
cul es la probabilidad de que un cultivo de arroz de una variedad especfica, en
cierto tipo de suelo, condiciones de manejo y fertilizacin produzca ms de 40
bultos por hectrea?
La aproximacin de la frecuencia relativa a la probabilidad depende de la
repeticin de algn proceso y de la capacidad de contar el nmero de
repeticiones, as como del nmero de veces que ocurre algn evento de inters.
En este contexto la probabilidad de observar alguna caracterstica E, de un
evento, puede definirse como probabilidad frecuentista textualmente quedando:
Si un evento se repite n veces y hay m resultados a favor de un evento E,
entonces una estimacin de la probabilidad frecuentista de ese evento es
n
m
E P = ) ( .
Ejemplo. Si se hace un muestreo en ardillas de cola roja y se encuentra que de
las 80 capturadas, 55 estn contaminadas con Salmonella. Cul es la
probabilidad de que al capturar otra ardilla, esta est contaminada con
Salmonella?
De la informacin se tiene que el evento se repite 80 veces (n=80), de los cuales
el resultado favorable para Salmonella es de 55 veces (m=55); entonces, la
probabilidad de capturar una ardilla con Salmonella P(E) es de:
= =
80
55
) (E P 0,68.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Este punto de vista sostiene que la probabilidad mide la confianza que tiene un
determinado individuo en la veracidad de una proposicin particular.
Probabilidad bajo un concepto axiomtico. Este concepto fue formalizado por el
ruso A.N. Kolmogorov. La base de este concepto de probabilidad, se considera
desde el cumplimiento de tres axiomas relacionados con la teora de conjuntos:
1. Todos los eventos deben tener una probabilidad mayor o igual a cero, lo
cual es un argumento razonable en vista de la dificultad de obtener una
probabilidad negativa. Dicha probabilidad del evento tampoco puede ser
mayor a 1.
O E P = ) ( 1 ) ( 0 E P
2. la suma de todas las probabilidades de todos los eventos mutuamente
excluyentes es igual a 1.
1 ) ( = S P
Esta es la probabilidad de exhaustividad y se refiere al hecho de que el
observador de un proceso probabilstico debe tomar en cuenta todos los
eventos posibles y cuando se toman en su totalidad, la suma es 1.

1. Si se tiene dos eventos mutuamente excluyentes, Ei y Ej. La probabilidad
de que ocurran, es igual a la suma de sus probabilidades individuales.
) ( ) ( ) ( ) (
j i j i
E P E P E P E P + =
Las probabilidades se expresan en proporciones de 0 a 1 o en porcentajes
equivalentes de 0 a 100%.

Leccin 10: Muestreo

En muchos casos, si no es en la mayora, el investigador de cualquier campo se
encuentra con la imposibilidad de estudiar toda una poblacin (todos y cada uno
de los elementos que la componen); razn por la cual se han formulado una serie
de mtodos que permitan determinar el tamao de una porcin de la poblacin,
llamada muestra y con la cual es representativo analizar e inferir sobre la
poblacin. Una poblacin debe estudiarse bien sea a travs de un censo (estudio
de toda la poblacin) o en base a una muestra (parte de una poblacin).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

El muestreo, tcnica para seleccionar el tamao de la muestra representativa de
una poblacin y forma como se selecciona cada uno de los integrantes de la
muestra, es una herramienta til para cualquier estudio de aspecto social, de
salud, educacin, ambiental, agrcola, pecuario, financiero e incluso de mercadeo
entre otros. sta es la tcnica base para que se utilice la inferencia estadstica y
con la cual se pueden analizar, concluir y argumentar aspectos relevantes de la
poblacin en estudio.
Es preciso determinar el tamao y forma de seleccionar las unidades que
componen la muestra, cuando:
1. La poblacin es grande y su estudio completo excede los recursos asignados.
2. Existe suficiente homogeneidad en las unidades de la poblacin con respecto a
lo que se quiere medir, locuaz permite que una muestra adecuada contenga la
informacin suficiente para el inters del estudio.
3. El proceso de seleccin de la muestra es destructivo, lo cual obliga hacer el
estudio slo en una parte de la poblacin. Ejemplo. Cuando se pretende estudiar
la calidad de la carne en animales y por tanto es necesario sacrificarlos. O cuando
se pretende estudiar el desarrollo radicular de una especie de plantas y por
consiguiente es necesario arrancarlas para tomar las correspondientes medidas.
El muestreo, en general, tiene como objetivo agilizar los procesos de
investigacin, controlar los gastos excesivos de recursos financieros, humanos y
de tiempo, pero tambin en algunos casos evitar que se creen impactos negativos
sobre poblaciones vulnerables al estudio planteado; como sucede cuando se
estudian especies silvestres o se hacen muestreos destructivos.
Existe, adicionalmente, otra razn de peso para hacer uso del muestreo
estadstico y es el estricto control que se puede ejercer sobre la recoleccin de la
informacin, muy superior al que se lograra en el caso de un censo (toda la
poblacin). Los errores en el estudio, especialmente aquellos conocidos como
errores muestrales (no respuesta, inconsistencia, codificacin errada, etc.)
disminuyen considerablemente cuando se realiza un muestreo en vez de un
censo.
En las ciencias agropecuarias y ambientales, donde la mayora de los estudios de
investigacin se enfocan en la aplicacin de tratamientos, es preciso, por costos,
aplicacin de los mismos tratamientos y facilidad en la toma de datos, incluso de
control de algunos factores, tomar parte de la poblacin para la experimentacin y
luego inferir.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Las etapas principales en la planificacin y ejecucin de un muestreo son:
a. Planteamiento de los objetivos. Es necesario definir los objetivos. Por lo
general stos se relacionan con la estimacin de los parmetros de inters
(usualmente medias y varianzas) o prueba de hiptesis sobre ellos.
b. Definicin de la poblacin a ser muestreada. De acuerdo a los objetivos, debe
identificarse claramente la poblacin sobre la cual se desea hacer la inferencia.
c. Establecer el tipo de datos que deben recolectarse y los mtodos de medicin.
De esta manera se asegura la obtencin de la informacin que sea pertinente
de acuerdo a los objetivos planteados y se evita la tendencia a recolectar datos
innecesarios.
d. Seleccin de la muestra. La cual incluye la seleccin de la unidad de muestreo,
la definicin del tamao de la muestra y la forma como sera seleccionada esta.
e. Ejecucin del muestreo. En esta fase, una de las ms importantes y de la que
depende la confiabilidad de los resultados, se hace la localizacin de las
unidades que componen la muestra. Se hace necesario planear de forma
detallada el proceso a seguir para la ejecucin del muestreo. Para esto se
debe formalizar un cronograma a cumplir por personas idneas y con
conocimiento del estudio para que le brinden responsabilidad y criterio
profesional, cumpliendo con lo programado.
f. Anlisis de datos. Por lo general las estimaciones se dan por medio de
intervalos de3 confianza para los parmetros. El conocimiento de las varianzas
permite adems planear ajustes o mejores alternativas para los futuros
esquemas de muestreo. En el caso de investigaciones experimentales, el
anlisis debe estar encaminad a la aplicacin de modelos matemticos que
permitan cumplir con los objetivos planteados en la investigacin.
De cualquier poblacin de tamao N, pueden extraerse cierto nmero de muestras
distintas de tamao n. Haciendo esta afirmacin bajo la hiptesis que N es lo
suficientemente grande como para garantizar el muestreo. Por razones obvias, las
poblaciones pequeas no se muestrean, sino que se estudia la poblacin
completa.
De esta forma el muestreo se puede resumir en la siguiente grfica:
Forma de muestreo:






UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS



De esta forma, se definen las medidas de una poblacin como parmetros y las de
una muestra como estimadores, teniendo para cada una y de acuerdo al tipo de
medida una simbologa.
SMBOLOS DE PARMETROS ESTIMADORES
MEDIDA POBLACIN
(Parmetros)
MUESTRA
(Estimadores)
V. continua

V. Binomial V. continua

V. Binomial
TAMAO
PROMEDIO
DESVIACIN
VARIANZA
N

2

N
P

2

n
Y X
s
s
2

N
p
s
s
2


Muestreo probabilstico.
Existen condiciones que deben cumplirse para poder hablar de una muestra
probabilstica. Ellas son:
1. poder definir el conjunto total de muestras posibles que pueden seleccionarse
de una poblacin de acuerdo con el procedimiento muestral.
2. Conocer para cada una de las muestras posibles la probabilidad de que sea
seleccionada ((s)).
3. el procedimiento utilizado debe dar a cada elemento de la poblacin una
probabilidad de seleccin diferente de 0.
4. la seleccin, debe ser aleatoria, esto es, el mecanismo de probabilidad
diseado para la seleccin, de tal manera que cada multar posible tenga la
probabilidad de seleccin asignada previamente ((s)).
Muestreo no probabilistico.
Una muestras probabilstica es una muestra que es extrada de una poblacin, de
tal manera que todo miembro de esta ltima tenga una probabilidad conocida de
estar dentro de la muestra.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

En general todo muestreo que no cumpla con alguna de las condiciones
enumeradas anteriormente es un muestreo no probabilstico. Se cumplira lo
siguiente:
1. La muestra se restringe a una parte de la poblacin que es fcilmente
accesible.
2. La muestra es seleccionada teniendo en cuenta el azar, ms no la aleatoriedad
(se seleccionan los elementos que estn ms a la mano).
3. Con una poblacin heterognea y pequea, el muestrista inspecciona la
poblacin y selecciona una multar pequea de unidades tipo (cercanas a la
impresin que pueda tener de la media general o a un criterio justificado por la
profesin).
4. La muestra se compone esencialmente de unidades voluntarias o impuestas.
Bajo condiciones apropiadas, cualquiera de los casos anteriores, pueden
presentar resultados tiles. Sin embargo, en ellos no se puede aplicar
estrictamente la teora del muestreo ya que ella se basa en el supuesto de
seleccin aleatoria donde todas las unidades tienen una probabilidad de ser
seleccionadas.
Al muestrear poblaciones finitas hay tres maneras bien distintas de hacer la
seleccin:
1. Muestreo aleatorio. Puede introducirse en e procedimientote muestreo de varias
maneras que nos dan diversos diseos de muestra. Gracias a la aleatorizacin
pueden obtenerse estimaciones validas del error. Se puede aplicar la teora de
probabilidades u se pueden sacar conclusiones vlidas.
2. Muestreo sistemtico. Se usa cuando cada uno de los individuos de una
poblacin se incluye en la muestra, tal procedimiento es fcil pero insatisfactorio si
en la poblacin se presentan tendencias o ciclos no reconocidos aun. Dado que
las poblaciones se deben enumerar antes del muestreo, pueden introducirse en
forma inconsistente ciertas relaciones entre una o ms caractersticas investigadas
y orden de numeracin. En general, no es seguro suponer que no existe tal
relacin. El muestreo sistemtico puede efectuarse en forma tal, que puede
obtenerse una estimacin no sesgada de error de muestreo. Esto requiere de ms
de una muestra sistemtica.
3. Muestreo autoritario. Exige que una persona, bien familiarizada con el material
que va a muestrearse, extraiga la muestra sin tener en cuenta la aleatorizacin.
Tal procedimiento depende completamente del conocimiento y pericia de la
persona que hace el muestreo. Puede producir buenos resultados en algunos
casos, pero rara vez se recomienda.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Muestreo aleatorio simple.
Este esquema constituye la base de la mayora de todos los muestreos los
muestreos. Si se estudia una poblacin dividida en n unidades de muestreo
(rboles, parcelas, individuos, animales, etc.), el mtodo consiste en tomar a l azar
n unidades de las n, de tal manera que cada combinacin posible de las n
unidades tengan la misma probabilidad de ser escogida. Las unidades de
muestreo se extraen de forma independiente.
Una manera de seleccionar una muestra aleatoria simple es utilizar una tabla de
nmeros aleatorios simples.




















UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

NMEROS ALEATORIOS SIMPLES.

Supngase que la poblacin de inters consta de N cantidad de valores. Se
desea extraer de esta poblacin una muestra de tamao 15, utilizando los
nmeros aleatorios. Como primer paso, se debe localizar un punto de partida


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

aleatorio en la tabla. Esto puede hacerse de varias formas; una de las cuales es
quitar la vista de la pgina, mientras que se toca con la punta de un lpiz. El punto
de partida aleatorio es el dgito ms prximo al punto donde el lpiz toc la pgina.
Supngase que, siguiendo este procedimiento, se lleg a un punto de partida
aleatorio en la interseccin de rengln 15 con la columna 20. El dgito en este
punto es 3. Dado el nmero N de valores, slo se puede elegir este nmero en
aleatorios (de 1 a N); en ocasiones es necesario elegir nmero de dos, tres o ms
dgitos. Para el caso de tres dgitos se buscaran nmeros de 0001 a N que no
sera mayor a 999. El primer valor aleatorio inicia en el punto de partida,
seleccionndose para la muestra los que correspondan de 001 a N, recorriendo la
columna hacia abajo. Cuando se termia la columna de seleccin y no se ha
completado el tamao de la muestra, se puede continuar en la siguiente columna
de abajo hacia arriba o de arriba hacia abajo; hasta completar el n, en esta caso
15.
La varianza muestral de la media. Cuando el muestreo es con reemplazo o la
poblacin muestreada es muy grande, la varianza de promedios o error estndar
est dad por:
n
s
s
x
2
=
Si el muestreo es sin reemplazo es error estndar es:
|

\
|
=
N
n
n
s
s
x
1
2

En donde el trmino
|

\
|

N
n
1 constituye un factor de correccin por finitud. Cuando
N o la fraccin n/N es menor que 0,05, se ignora el factor por finitud.
Cuando se estudian proporciones, la varianza de la media est dada por:

|

\
|
=
N
n
n
Pq
s
p
1
2

Tamao de la muestra. Para estimar el tamao de la muestra es necesario
decidir que tan grande es el error que se est dispuesto a tolerar con el estimador,
de acuerdo a la precisin exigida por el investigador.
Considerando una poblacin normal o aproximadamente normal:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

x
s
X
~ N
Si se desea cierta precisin en la estimacin de , de tal modo que E X = sea
el mximo error de muestreo permisible, entonces utilizando un nivel de
confiabilidad de 1-, se plantea:
2 / 2 /
t
n
s
E
t
s
E
x
= = por lo cual:
2
2 /
2
E
t s
n

=
En donde n es el tamao mnimo de la muestra requerido para garantizar la
precisin deseada bajo la confiabilidad de 1-.
La ecuacin anterior supone que la poblacin finita; cuando se justifique utilizar el
factor de correccin por finitud se pude obtener un tamao de muestra ms
ajustado mediante la siguiente relacin:

N
n
n
n
0
0
1+
=
En donde n
0
es la primera estimacin de tamao de muestra utilizando la
expresin anterior.
Cuando la poblacin en estudio no se comporta de forma aproximada a la
distribucin normal, se puede justificar el muestreo por el teorema central de lmite
y de lamisca forma se puede analizar bajo cualquier modelo estadstico. Por otro
lado, teniendo en cuenta que para determinar el tamao de la muestra, es
necesario contar con un valor de varianza de la poblacin, que en la mayora de
los casos no se tiene, ste se puede obtener a partir de la informacin de estudios
previos o con un muestreo preliminar.
Cuando no se cuenta con la disponibilidad e un valor de varianza (estimador), se
puede utilizar la frmula de Freese, con la cual se puede aproximar al valor real.

2
2
4
(

=
R
s
Donde, R corresponde al rango (dato mayor dato menor) de la distribucin de
datos encontrados en una informacin previa.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Para obtener el tamao adecuado de la muestra, el valor de E es fijado por el
investigador, lo mismo que el nivel de confianza 1-. Pero para obtener el valor de
t
/2
se requiere contar con los grados de libertad (n-1), lo cual se conoce el valor
de n y esto no es posible. Para solucionar este impace, se sugiere utilizar el valor
de t aproximado y con base en este, se obtiene:
Cuando 1- = 0,95, el valor de aproximado es 2 t .
Cuando 1- = 0,99, el valor de aproximado es 3 t .
Ejemplo. Un Ingeniero Agrnomo se enfrenta a realizar un estudio de
productividad de tomate de rbol en un cultivo, por costo y facilidad en la toma de
datos, el Ingeniero necesita estimar una muestra confiable que le permita inferir
sobre la poblacin. La variable de estudio corresponde a la cantidad de produccin
(peso en Kg.) que puede tener cada uno de los rboles. Para ello estima un error
E de 0,5 kg. de produccin por rbol y una confiabilidad de 1- = 0,95. El
investigador ha realizado un estudio preliminar y ha determinando que la varianza
de produccin de rboles de de 5,32.
Datos obtenidos.
2
32 , 5
95 , 0 1
5 , 0
2 /
2
=
=
=
=

t
s
E

Y la ecuacin de tamao de muestras es:
2
2
2 /
2
1
) (
E
t s
n

=
2
2 2
1
5 , 0
) 2 ( 32 , 5
= n
25 , 0
) 4 ( 3024 , 28
1
= n
25 , 0
2096 , 113
1
= n
453 83 , 452
1
= n


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Si se quiere, como ya se tiene un n para los grados de libertad (n-1), se puede
ajustar el valor de t
/2
con el valor real de la distribucin teniendo en cuanta que
2 /
t
(4532)
= 2,24

2
2 2
5 , 0
) 24 , 2 ( 32 , 5
= n

25 , 0
) 01 , 5 ( 3024 , 28
= n
25 , 0
01 , 142
= n
568 04 , 568 = n
De la aplicacin de mtodo se puede determinar que para la confiabilidad de 1-
=0,95 y un error de 0,5 kg., el estudio necesita tomar una muestra de 568 rboles,
los cuales seran confiable para calcular estimadores e inferir sobre la poblacin.
Si el nmero total de la poblacin fuera de 10000 rboles, entonces se debe
corregir el valor de n con la ecuacin para muestras de poblaciones finitas. En
este caso sera:
N
n
n
n
0
0
1+
=
10000
568
1
568
+
= n
538 507 , 537 = n
De esta forma, para que la muestra sea confiable en una poblacin de 10000
rboles, es necesario tomar una muestra de 538 rboles.
Otra expresin para estimar el tamao del a muestra puede obtenerse cuando se
fija la precisin de P (probabilidad de xito) deseada como un proporcin de la
media y se utiliza el coeficiente de variacin en lugar de la varianza.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


X CV s
X
s
CV
X P E
X
E
P
= =
= =

Sustituyendo estos valores en la frmula para el tamao de la muestra se tiene:

( ) ( )
2
2 2
2 2
2 2 2
2
2 2
p
t CV
X p
t X CV
E
t s
n = = =
Ejemplo. Si se tiene una poblacin de cerdos en una regin, donde se pretende
estudiar la ganancia diaria de peso en esta produccin y hacer un estudio de
competitividad, la cual para dicha variable (ganancia de peso) tiene un coeficiente
de varianza estimado en 42,5% y se desea una precisin de P=0,2. Estimar el
tamao de la muestra necesaria para dar confiabilidad al estudio de 0,95.
Se tiene que:
CV = 42,5%
P = 0,2
T
0,05/2
= 2
Entonces:

( )
2
2 2
p
t CV
n =

( )
2
2 2
2 , 0
2 425 , 0
= n

( )
04 , 0
4 1806 , 0
= n
04 , 0
7225 , 0
= n
19 06 , 18 = n
Si la poblacin de cerdos en la regin de estudio es de 30000, el ajuste por finitud
corresponde a:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

N
n
n
n
0
0
1+
=

30000
06 , 18
1
06 , 18
+
= n
19 05 , 18 = n
Si la variable corresponde a una variable binomial, la estimacin del tamao de la
muestra de una poblacin por proporciones corresponde a:

2
2
2 /

E
q p Z
n

=
En donde p y q son estimadores obtenidos en muestras preliminares y E es la
precisin o mximo alejamiento deseado entre la proporcin estimada en la
muestra y la verdadera proporcin de la poblacin.

CAPITULO 3: Inferencia estadstica
Leccin 11: Inferencia puntual

El objeto de la inferencia estadstica es la de recoger informacin mediante la
realizacin de una muestra, con el fin de utilizarla en el clculo de estimaciones y
as obtener conclusiones respecto los valores estadsticos de la poblacin; en
otras palabras, es poder afirmar acerca de una poblacin basndose en la
informacin contenida en una muestra.
La inferencia puede ser de dos tipos: pruebas de hiptesis sobre los parmetros y
estimaciones sobre el valor de los mismos. La clase de inferencia depende de los
objetivos que tenga el investigador con respecto a las poblaciones de estudio.
Partiendo de esto, en inferencia se pueden considerar dos formas de estimacin:
puntual y por intervalos. La estimacin puntual utiliza la informacin contenida en
la muestra para llegar a un solo nmero o punto que estima el parmetro de
inters. La estimacin por intervalo determina el rango en el que se encuentra el
parmetro con cierta probabilidad.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Simbologa que se utilizar
MEDIDAS POBLACIN
Parmetros
MUESTRA
Estimadores
Media Aritmtica
X
Varianza
2
s
2
Desviacin Tpica s
Tamao N n

Inferencia por estimacin puntual.
La estimacin puntual se realiza con base en el valor de un estimador obtenido a
partir de una muestra. El estimador es estadstico, o sea una funcin de las
observaciones que se espera refleje las caractersticas del parmetro
desconocido. Por ejemplo, la media aritmtica X es un estimado de el
parmetro de la poblacin.
Es posible proponer varios estimadores para u parmetro dado y adems, como
variable aleatoria, los estimadores tienen distribuciones de probabilidades; por lo
cual el estimado de un parmetro puede estar muy cerca o muy lejos del valor
verdadero. Por esto es importante seleccionar un estimador que est cerca del
valor verdadero del parmetro. Para hacer una buena seleccin de un estimador,
se deben seguir por lo menos dos criterios.
a. Insesgamiento. Sea a. el estimador del parmetro A; se dice que a es un
estimador insesgado de A si la esperanza matemtica de la variable aleatoria a es
igual a A. Esto es:
E (a) = A
De lo contrario, se dice que el estimador es segado y est dado por:
Sesgo de a = E (a-A).
Cuando se manejan muestras muy grandes, los estimadores generalmente no son
insesgados y en el caso de presentarse un grado de sesgo, este es muy pequeo;
es decir, es ms confiable trabajar con muestras grandes. El concepto de sesgo
no es el nico, ni el ms importante para poder hacer estimacin puntual, para
esto se debe tener en cuenta tambin:
b. Eficiencia. Con este criterio se pretende estimar el grado de explicacin que
cubre un estimador sobre una poblacin. En muchas ocasiones cuando se tiene
dos estimadores y por lo general uno es ms eficiente que el otro.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

La varianza del estimador nos indica el grado de dispersin de los diferentes
valores que pueden tomar alrededor del parmetro. Es por esto que la varianza es
un indicador de la eficiencia, deduciendo que entre menor sea la varianza, mayor
es la eficiencia que se tiene con el estimador. Este es quiz el mejor indicador
para iniciar una estimacin puntual.
Estimacin puntual del promedio.
Como se ha visto hasta el momento, el promedio es la medida ms susceptible de
trabajar para representar un grupo de datos sin importar si son de una poblacin o
de una muestra. Por eso la estimacin puntual se hace para el promedio pero no
para la varianza.
Si se tiene una poblacin de tamao N y de esta se toma una primera muestra de
tamao n1, se obtendra un promedio 1 X , si se tomara una muestra de tamao n2
(que no puede ser del mismo tamao de n1), se obtendra un promedio 2 X y as
sucesivamente hasta tener n X promedios; el promedio de todos estos promedios
sera la estimacin del parmetro de la poblacin . En pocas palabras, el
promedio de los promedios es una representacin puntual del parmetro.

Esquemticamente sera:

N
X
X
X n
X n
X n
X n
N
n
n n
.
.
.
3 3
2 2
1 1

Ejemplo. Si se tiene una poblacin de 200 terneros de los cuales se requiere
estimar el promedio de peso al nacimiento, por facilidad de trabajo se toman
muestras que se promedian para luego calcular una estimacin puntual del
parmetro.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

De acuerdo a las muestras, los promedios obtenidos fueron:
DATOS OBTENIDOS.
Muestra Promedio (Kg/animal)
Muestra 1 (n=10)
Muestra 2 (n=15)
Muestra 3 (n=10)
Muestra 4 (n=20)
Muestra 5 (n=12)
44
40
42
44
43
Promedio de promedios 42,6
Esto quiere decir que el promedio para la poblacin es de 42,6 kilos/animal al
nacimiento. Se debe aclarar que para validar como apropiados los promedios
mustrales y poder sacar un promedio poblacional, se debe tener en cuenta la
variabilidad de cada uno de estos ya sea con la desviacin estndar o con la
varianza.
Estimacin puntual para varianza.
Lo contrario a lo que sucede con la media aritmtica, la varianza no se puede
calcular por promedio del resultado de algunas muestras. Para comprobar esta
teora, se presenta el siguiente ejemplo. Si se tienen 4 elementos en un espacio
muestral (a, b, c, d) de los cuales se quieren sacar muestras de a 2 elementos.
Todas las muestras posibles de tamao 2 sin importar el orden, corresponde a:
Muestras posibles = | | 6
2
12
! 2 ! 2
! 4
4
2
= =

=
Las 6 muestras seran:
a,b a,c a,d b,c b,d c,d
Si de cada una de estas muestras, en el caso de ser numricas, se calcular la
varianza, el promedio de estas varianzas no es representativo para la poblacin, o
sea que no se puede hacer inferencia con este para decidir sobre la poblacin. Es
por esto que si se trata de una muestra, y para que esta sirva para inferir en la
poblacin, se ajusta la frmula tradicional con n-1 en el dividendo.
1
2
2

n
X x
s
i




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Inferencia por estimacin de intervalos.
La inferencia estadstica est basada en el supuesto de tomar muchas muestras,
todas con igual probabilidad de ser seleccionadas y a travs de una de ellas
calcular datos que representen la poblacin para poder tomar decisiones,
interpretar o analizar segn el comportamiento de la variable. No se quiere decir
con esto, que siempre se obtengan los resultados esperados o los que mejor
representen a la poblacin, ya que desde el punto de vista terico y prctico, esto
tambin depende de una distribucin de probabilidades.
Cualquier inferencia que se haga sobre una poblacin siempre tiene un error, de lo
contrario, la varianza del dato que se obtiene debera ser 0 lo cual nunca sucede.
Por tal razn, y para asegurar la validez del estimador sobre el parmetro, en
muchas ocasiones si no son todas, es preciso hacer inferencia por intervalos, en
los cuales se calculen un lmite superior y un lmite inferior que enmarcan el
parmetro esperado que representa la poblacin. Sin embargo, esto lmites
siempre siguen guardando un error sin importar si son para promedio, varianza o
proporciones.
Para hacer ms preciso el clculo de intervalos para medias aritmticas y
proporciones, se han propuesto dos distribuciones de probabilidades que son
tiles para tal fin. En el caso de tener muestras grandes (n > 30) se dispone de la
distribucin normal o Gaussiana, mientras que para muestras pequeas (n30) se
cuenta con la distribucin t-student; la cual no se ha tratado hasta el momento y
que se explicar cuando corresponda. En el caso de hacer inferencia para
varianza, se utiliza la distribucin F (de Fisher) o ji-cuadrado.
Estimacin de intervalos para grandes muestras.
A pesar de que la X y la s
2
son estimadores de y
2
, sera sorprendente que
fueran realmente y
2
en cambio de encontrarse la aproximacin de stos. Esto
permite deducir que puede ser ms apropiado dar un intervalo en torno a la X y la
s
2
y decir que se est razonablemente confiado en que y
2
, se encuentran en
ese intervalo. Esto puede hacerse con la ayuda de la distribucin normal para
cuando se tienen muestras grandes (n > 30). Adems del tamao de la muestra,
en otro criterio para inclinarse por el uso de la distribucin norma, es cuando se
conoce la varianza de la muestra.
Se usa distribucin Z (normal o Gaussiana) cuando:
1. La varianza de la muestra (
2
) se conoce.
2. La varianza de la muestra se desconoce, pero n >30


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Se usa distribucin t cuando:
1. La varianza de la muestra se desconoce (
2
)
2. El tamao de la muestra es menor a 30 (n30)
Los intervalos, en la estadstica se denominan intervalos de confianza. Este
concepto permite que el investigador asocie el valor de una probabilidad con el
intervalo aleatorio de tal modo que la probabilidad de que un intervalo de
confianza incluya el parmetro sea relativamente alta; este valor se conoce como
coeficiente de confianza.
Si se tiene la muestra aleatoria procedente de una poblacin con parmetro A,
entonces un intervalo de confianza (L
1
y L
2
) para dicho parmetro es:
- 1 = ) L A (L P
2 1

Donde:
L
1
y L
2
Se conocen como lmites del intervalo y son estadsticos obtenidos
de la muestra aleatoria.
1- Es el coeficiente de confianza.
Es el error que se permite como probabilidad de que el valor del
parmetro no est entre el intervalo hallado.
El intervalo debe interpretarse como la probabilidad de que se contenga al
parmetro en 1- y no la probabilidad de que el parmetro caiga en el intervalo
porque A es un nmero fijo. Se puede considerar que si se toman muestras
repetidas de la misma poblacin y se obtienen los intervalos de confianza
respectivos para el parmetro A entonces se espera que (1 ) por ciento de
estos intervalos incluirn a A.
Intervalo de confianza para la media.
Considerando una poblacin normal en donde se ha tomado una muestra grande
para estimar los parmetros, los lmites de confianza para el coeficiente de
confianza 1-, tendra como base la distribucin normal.
N(0,1) ~
X
X
Z


=
Si se indica como z
/2
el valor de la tabla Z tal que el rea de la derecha z
/2
es
igual a /2, entonces P(Z< -z
/2
) = /2 por la simetra de la curva.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

P (-z
/
2< Z < z
/2
) = 1-
Grfica . Intervalo de confianza a dos colas

De acuerdo con lo anterior:
P (-z
/
2< Z < z
/2
) = 1-
P (
X
x z
/2
< X - <
X
z
/2
) = 1-
P ( X -
X
) x z
/2
< - < ( X +
X
) x z
/2
) = 1-
P (L
1
< < L
2
) = 1-
En donde:
2 / 2 / 2
2 / 2 / 1
z z
z z

+ = + =
= =
n
X X L
n
X X L
X
X

Con las ecuaciones L
1
y L
2
se han obtienido los intervalos con una confianza de 1-
para el parmetro. Los estadsticos L
1
y L
2
se denominan intervalos de
confianza inferior y superior.
Ejemplo. En un cultivo de sorgo (Sorgum bicolor) se quiere promediar la altura
alcanzada por las plantas cuando el fruto se encuentra en estado de leche. Del
cultivo, se ha tomado una muestra aleatoria de 250 plantas de la cuales se tiene
que el promedio de altura en centmetros fue de 135, con un desviacin estndar
de 15 centmetros. Como el tamao de la muestra se pude catalogar como
grande, se usa la distribucin Z para calcular los intervalos de confianza e inferir


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

entre cuanto est el promedio de altura de todo el cultivo con una confiabilidad del
95%, es decir 1- =. 1-0.95= 0.05.
2 / 2
2 / 1
z
z

+ =
=
n
X L
n
X L

Como es claro que la confiabilidad es del 95% y el error del 5%, para cumplir con
el /2, el error se debe dividir en dos colas, lo que quiere decir que el error en
cada punta o cola de la grfica de la distribucin estndar es de 0,025 o lo mismos
que 2,5%.
X = 135
= 15
= 0.05/2 =0.025
1- = 0,95
n = 250
2 / 2
2 / 1
z
z

+ =
=
n
X L
n
X L

96 , 1
250
15
135
96 , 1
250
15
135
2
1
+ =
=
L
L

85 , 136
14 , 133
2
1
=
=
L
L

Con este resultado, se estima que la altura promedio de todo el cultivo de sorgo
est entre 133,4 y 136,85 centmetros, con un coeficiente de confianza de 0.95.
Este coeficiente de confianza explica que al repetirse el muestreo se espera que el
95% de los intervalos obtenidos en esta forma contengan a .
De esta forma se pude resumir que la ecuacin para hallar lmites de confianza
cuando se tienen muestras grandes corresponde a:
2 /
z

=
n
X LC
Se debe notar que uno de los principales factores que afecta la amplitud de los
lmites es la variabilidad de los datos expresada en la desviacin estndar, la cual,


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

entre mayor sea la desviacin para un conjunto de datos, mayor es la amplitud de
los lmites. Otro factor que influye en la amplitud de los lmites es la confiabilidad
con la que se quiera trabajar; es decir, si 1- es la confiabilidad para z/2 a
medida que esta aumente mayor es la amplitud.
Por ejemplo. Si se quiere tener una confiabilidad del 95% (0,95) donde 1-
corresponde al 5% (0,05) y z
/2
sera 2,5% (0,025) no es lo mismo que si exige
una confiabilidad del 99% (0.99) donde 1- corresponde al 1% (0,01) y z
/2
sera
0,005% (0,005). En el primer caso se deja un mayor espacio o para el error que en
el segundo y por eso, en el segundo, por ser ms preciso implica que el intervalo
sea ms amplio.
Es posible que an se tenga duda sobre el valor de z
/2
utilizado para calcular los
lmites de confianza. Este valor se toma como una constante calculada con la
distribucin Z, y los cuales se expresan en la siguiente tabla.
VALORES DE ERROR Y CONFIABILIDAD
Coeficiente de
Confianza
(1-)
Error



z
/2
a una cola a dos colas
Porcentaj
e
Probabilida
d
Porcentaj
e
Probabilida
d
Porcentaj
e
Probabilida
d
90 0,90 10 0,10 5 0,05 1,6
4
95 0,95 5 0,05 2,5 0,025 1,9
6
99 0,99 1 0,01 0,5 0,005 2,5
8

Para aclarar de donde salen los valores de z
/2
; se estima que en la distribucin
normal, para que se incluyan el 90% de los datos de una muestra o poblacin, se
le debe restar o sumar 1,64 desviaciones estndar y crear un intervalo. Si el
requerimiento es tener el 95% de los datos, al promedio se le debe sumar y restar
1,96 desviaciones estndar y si se quiere tener el 99% de los datos dentro de un
intervalo, se debe sumar y restar 2,58 desviaciones estndar.
De forma resumida, para obtener intervalos estrechos o cortos se deben cumplir
uno ms de las siguientes condiciones.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

1. Si aumenta el tamao de la muestras n el valor del X debera estar ms
cercano al parmetro, por lo cual es de esperar un intervalo ms estrecho.
2. En poblaciones ms uniformes (con menor varianza) los intervalos de
confianza son ms cortos, lo que hace que la estimacin de la media
poblacional sea ms precisa.
3. La eleccin del valor 1- depende del grado de confiabilidad que desee el
investigador en su estimacin. Por fines prcticos, en la mayora de los
casos se estiman con 0.95; lo cual no indica que no es posible aplicar otro
valor. Esto implica que entre menos confiabilidad se desee, ms estrecho
es el intervalo.
Es posible que se tengan muestras, las cuales no se comportan de forma
aproximada a la distribucin normal, sin embargo, si son muestras grandes, se
puede aplicar el teorema central de lmite y desarrollar la metodologa propuesta

Intervalos de confianza para varianza.

Como se ha venido trabajando y demostrando, la varianza es una medida
importante para el clculo de otros valores y como no tiene interpretacin ni
unidades reales, se puede transformar en desviacin estndar y as determinar la
variabilidad de un conjunto de datos. Por esta razn, es importante en muchas
ocasiones encontrar lmites de confianza para la varianza y as poder inferir desde
una muestra en una poblacin. Tal es el caso de las empresas productoras de
farmacuticos, vacunas, alimentos, y muchos otros, que deben garantizar baja
variabilidad del resultado obtenido por usar el producto. Para esto, se hacen las
pruebas en una muestra y luego se infiere sobre el total de la poblacin que usara
el producto. En el caso de procedimientos de mejoramiento gentico, son
importantes ya que a pesar de la influencia de muchos factores incluidos lo
ambientales, los resultados a obtener en una poblacin dependen de la
variabilidad de los ensayos con las muestras.
En la parte inicial de este modulo se estudiaba que la varianza de una poblacin y
de una muestra cambiaban en su notacin para hacer el clculo y que
corresponda a:
Para una muestra
1
) (
2
2

n
X X
s
i

Para una poblacin
n
X X
i
2
2
) (

=


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

En donde n es el tamao de la muestra y s
2
es el valor de un estimador insesgado
de la varianza poblacional (parmetros)
2
.
Si se extraen muestras de tamao n de una poblacin con distribucin normal,
esta cantidad tiene un distribucin conocida como distribucin ji-cuadrada con n-1
grados de libertad, la cual sigue la cantidad (n-1)s
2
/
2
y es til para encontrar
intervalos de confianza para

2
cuando se cumple la hiptesis de que la poblacin
tiene una distribucin aproximadamente normal.
Es claro que para la obtencin de un intervalo de confianza para
2
se utiliza la
distribucin ji cuadrado o chi-cuadrado (
2
), la cual se es necesaria de describir
por lo menos en forma breve.

Distribucin chi cuadrado.
La distribucin
2
puede deducirse a partir de la distribucin normal. Supngase
que a partir de una variable aleatoria Y distribuida normalmente con media y
varianza
2
se seleccionan aleatoria e independientemente muestras de tamao n
= 1. Cada valor seleccionado pude transformase en la variable normal unitaria z a
travs de la frmula ya conocida:


=
x
z
Cada valor de z puede elevarse al cuadrado para obtener z
2
. Cuando se estudia la
distribucin muestral de z
2
, se encuentra que sigue una distribucin
2
con un
grado de libertad. Es decir:
2
2
2
) 1 (
z
x
=
|

\
|
=


Si se seleccionaran aleatoria e independientemente muestras de tamao n = 2 de
la poblacin de valores Y con distribucin normal. Dentro de cada muestra, puede
transformarse cada valor x en una variable normal unitaria z y elevarla al cuadrado
como antes. De esta forma quedara:
2
2
2
1
2
2
2
1 2
) 2 (
z z
x x
+ = |

\
|
+ |

\
|
=




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Puede repetirse el procedimiento para cualquier tamao de n de muestras. En
cada caso, la suma de los valores z
2
resultantes se distribuir como una
distribucin
2
, con n grados de libertad, para obtener en general:
) 2 / ( 1 ) 2 / (
2 /
2
1
! 1
2
1
) (
u k
k
e u
k
u f


|

\
|

=
Donde e es el nmero irracional 2,71828, k es el nmero de grados de libertad. La
variable u se designa por la letra griega ji () y en consecuencia la distribucin se
conoce como distribucin
2
.

Para evitar complicaciones con su clculo, esta
distribucin se ha tabulado.





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

PERCENTILES DE LA DISTRIBUCIN JI-CUADRADO

La media y la varianza de la distribucin
2
son, respectivamente k y 2k. el valor
modal de esta distribucin es k 2 para valores de k mayores o iguales a 2 y es
de 0 para k = 1. La forma de la distribucin para varios valores de k corresponde
a:
Grfica Distribucin ji-cuadrado para varios valores de grados de libertad k.




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS










En esta grfica se observa que las formas para k = 1 y k = 2 son bastante distintas
a la forma cuando k>2. Tambin se observa que la distribucin toma valores
desde cero hasta el infinito. No puede tomar valores negativos ya que es la suma
de los valores de z elevados al cuadrado.
INTERVALOS DE CONFIANZA si se ha obtenido una muestra aleatoria de
tamao n a partir de una poblacin normal, es posible determinar que:
) 1 (
2
2
~
) 1 (

n
s n


Teniendo en cuenta esta propiedad, es posible derivar un intervalo de confianza
para la varianza de la poblacin. Utilizando la tabla
2
(n-1)

se encuentran valores
2
1
y
2
2
tales que:
= 1 ) (
2
2
2 2
1
p
Los valores
2
1
y
2
2
corresponde en la tabla a:
) 1 )(
2
(
) 1 )(
2
1 (
1
2 2
2
2 2


=
=
n
n




Por lo cual


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

=
|
|

\
|

=
|
|

\
|

1
) 1 ( ) 1 (
1
) 1 (
2
1
2
2
2
2
2
2
2
2
2
2
1
s n s n
p
s n
p

De donde:
2
1
2
2
2
2
2
1
) 1 (
) 1 (

s n
L
s n
L

=

Ejemplo. (Adaptado de Gmez, 2007). Se desea evaluar un mtodo para la
determinacin de aflatoxinas en cereales almacenados. Para ello se efectu una
contaminacin previa de 100 ppm (partes por milln) en una porcin de material.
Despus de homogeneizar la sustancia se obtienen 10 determinaciones, cuyos
valores en partes por milln fueron: 104, 96, 102, 99, 103, 100, 98, 103, 97, 102.
Se desea obtener el intervalo de confianza para la varianza la 90% de
confiabilidad.
Se podra desarrollar por pasos.
1. Calcular el valor de varianza (s
2
) y determinar el n.
n = 10 s
2
= 7,82
2. Determinar la confiabilidad deseada (1-) y el error ().
1- = 0,90 = 0,10
3. Encontrar en la tabla
2
los valores de
2
1
y
2
2
.
) 1 )(
2
(
) 1 )(
2
1 (
1
2 2
2
2 2


=
=
n
n




) 9 ( 05 , 0
2 2
2
) 9 ( 95 , 0
2 2
1


=
=

92 , 16
32 , 3
2
2
2
1
=
=


Para encontrar los valores de la tabla, se debe buscar dependiendo si es
2
1

2
2
. Para el caso del primero se busca en la parte superior el valor de
1-/2 y en la primera columna los grados de libertad (n-1). Para el caso del
segundo valor de la distribucin, se busca en la parte superior el /2 y en la
primera columna los grados de libertad (n-1). En algunos textos, se
simbolizan los grados de libertad como v.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

4. Calcular los lmites de confianza para el parmetro
2.

2
1
2
2
2
2
2
1
) 1 (
) 1 (

s n
L
s n
L

=

20 , 21
32 , 3
82 , 7 9
15 , 4
92 , 16
82 , 7 9
2
1
=

=
=

=
L
L

5. Con los clculos, se ha estimado que al 90% de confiabilidad la varianza
del mtodo para estimar aflatoxinas en cereales almacenados (
2
) se
encuentra entre los valores de (4,15 y 21,20). En algunos casos,
recordando el paso de varianza a desviacin (sacar raz cuadrada), se
puede dar el resultado en desviaciones. De esta forma quedara: con un
90% de confiabilidad, el mtodo para determinar aflatoxinas, siempre y
cuando se aplique bajo las mismas condiciones tiene una desviacin
estndar de entre 2.04 y 4.6 ppm.

Leccin 12: Pruebas de hiptesis

Desde cuando se inici la inferencia estadstica se plante que la otra forma de
hacerla, es por medio de las pruebas de hiptesis. La inferencia est basada en el
supuesto de tomar muchas muestras, todas con igual probabilidad de ser
seleccionadas y a travs de una de ellas determinar aproximaciones de los
parmetros de la poblacin, permitiendo hacer aseveraciones, estableciendo un
error, incluso en algunos casos incorrectos. En esta parte del mdulo se prender
a identificar, si el valor del estimador obtenido en la muestra es representativo del
parmetro o valor estadstico poblacional de la cual se extrajo.
La prueba de hiptesis denominada tambin prueba de significancia, tiene como
objeto principal evaluar suposiciones o afirmaciones acerca de los valores
estadsticos de la poblacin, denominados parmetros.
Estas suposiciones se llaman hiptesis estadsticas, las cuales son supuestos
acerca de un parmetro o de algn valor estadstico de una poblacin. Esto quiere
decir que no todas las hiptesis son estadsticas. Se debe tomar un parmetro
como referencia, ya sea una media, una proporcin, una varianza, etc.
La hiptesis estadstica, tambin puede considerarse, como la afirmacin acerca
de una caracterstica ideal de una poblacin sobre la cual hay inseguridad en el
momento de formularla y que, a la vez, es expresada de forma que puede ser
rechazada.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

De esta forma, se puede aclarar que los investigadores tratan con dos tipos de
hiptesis: la hiptesis de investigacin y la hiptesis estadstica. La hiptesis de
investigacin es la conjetura o suposicin que motiva la investigacin. Puede ser
el resultado de aos de observacin por parte del investigador. Un Mdico
Veterinario por ejemplo, puede haber notado que ciertos equinos respondieron
ms rpidamente a un tratamiento para clico. Los proyectos de investigacin
suelen resultar del deseo de los profesionales para determinar si sus teoras o sus
sospechas pueden ser apoyadas o no cuando se someten a los rigores de la
investigacin cientfica.
Las hiptesis de investigacin conducen directamente a hiptesis estadsticas. Las
hiptesis estadsticas se establecen de tal forma que pueden ser evaluadas a
travs de tcnicas estadsticas apropiadas. En este mdulo las hiptesis que se
estudiarn sern de este tipo.
Es importante, sin decir que es camisa de fuerza, tener en cuenta algunos pasos o
aspectos para poder aplicar pruebas de hiptesis estadsticas.
1. Datos. Debe comprenderse la naturaleza de los datos que forman la base
de los procedimientos de prueba, ya que estos determinan la particularidad
que debe utilizarse.
2. Suposiciones. Un procedimiento general se modifica, dependiendo las
suposiciones. Se ha visto que stas incluyen, entre otras, suposiciones de
la normalidad de la distribucin de la poblacin, igualdad de varianzas e
independencia de las muestras.
3. Hiptesis. En la prueba de hiptesis se trabaja con dos supuestos o
hiptesis estadsticas que deben enunciarse explcitamente. La primera es
la hiptesis que debe probarse, por lo comn conocida como hiptesis
nula y que se designa con el smbolo Ho. Esta hiptesis se conoce por
algunos autores como hiptesis de no diferencia, ya que es una proposicin
de conformidad con (o no diferencia respecto de) condiciones verdaderas
en la poblacin de inters. En general, la hiptesis nula se establece con el
propsito expreso de ser rechazada. En consecuencia, el complemento de
la conclusin que el investigador desea alcanzar se convierte en el
enunciado de la hiptesis nula. En el proceso de la prueba, la hiptesis nula
se rechaza, o bien, no se rechaza. Si la hiptesis nula no se rechaza, se
dir que los datos sobre los cuales se basa la prueba no proporcionan
evidencia suficiente que provoque el rechazo. Si el procedimiento del
aprueba conduce al rechazo, se concluye que los datos disponibles no son
compatibles con la hiptesis nula, pero son apoyo de alguna otra hiptesis.
Esta otra hiptesis se conoce como hiptesis alternativa y puede
designarse con el smbolo Ha.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Debe sealarse que, en general, la prueba de hiptesis o la inferencia,
simplemente indican si esta es apoyada o no por los datos disponibles. Por lo
tanto cuando no es posible rechazar esta hiptesis nula, no se dice que es
verdadera, si no que puede ser verdadera.
4. Estadstica de prueba. Es alguna estadstica que puede calcularse a partir
de los datos de la muestra. Como regla, existen muchos valores posibles
que pueden tener la estadstica de prueba, dependiendo del valor particular
observado de la muestra particular extrada. La estadstica de prueba sirve
como un producto de decisin de rechazar o no la hiptesis nula. En forma
general, se puede representar bajo una frmula que resume cualquier tipo
de estadstica para aplicar en pruebas de hiptesis.
relevante a estadstic la de estndar error
uesto parmetro relevante a estadstic
prueba de a estadstic
sup
=
Un ejemplo de sta puede ser:
n
X
z


=
Donde: X Es la estadstica relevante.
Es el supuesto

n

Es el error estndar de la X
5. Distribucin de la estadstica de prueba. La clave de la inferencia
estadstica es la distribucin muestral. Esto hace necesario que se
especifique cul es la distribucin de probabilidad que se usar para
satisfacer las suposiciones. (distribucin N, t,
2
, etc).
6. Regla de decisin. Todos los valores posibles de la estadstica de prueba
puede tener puntos sobre el eje horizontal de la grfica de la distribucin y
se dividen en dos grupos; uno de los grupos constituye lo que se conoce
como regin de rechazo y el otro grupo forma la regin de aceptacin.






UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


Grfica Regiones de aceptacin y de rechazo.

La regla de decisin seala que se rechaza Ho si el valor calculado de la
estadstica de prueba cae en la regin de rechazo y se acepta Ho si cae en
la regin de aceptacin. Esta regla establece que se calcule un valor de
estadstica de prueba a partir de los datos de la muestra y que se rechace
Ho si se obtiene un valor igual o mayor 1,96 o, igual o menor a -1,96.
Entonces se aceptara Ho, si se obtiene cualquier otro valor.
El valor del error () y en consecuencia, la regla de decisin, debe
establecerse antes de reunir los datos. Esto evita que los resultados de la
muestra influyan sobre la decisin que se va a tomar. Esta condicin, por su
importancia e ingerencia, debe conservarse en todas las pruebas.
Otra forma de tener una regla de decisin, sin importar el estadstico de
prueba, es bajo los siguientes preceptos:
Si el valor calculado es menor que el valor de la tabla, se acepta Ho.
Si el Valor calculado es mayor que el valor de la tabla, se rechaza
Ho.
7. Conclusin. Se concluye dependiendo de la hiptesis aceptada. Es preciso
concluir si el estimador es igual al parmetro o no en el caso de rechazar
Ho. La conclusin debe tener coherencia con criterios, conceptos, teoras,
postulados, leyes, etc. que expliquen la respuesta; para esto se deben tener
en cuenta argumentos que se presentarn en el anlisis de resultados y
recomendaciones extradas de cualquier trabajo de investigacin.
8. Anlisis. Una vez aplicada alguna de las formas de tomar la decisin, sta
se debe ser analizada bajo los conceptos tericos o prcticos que existan y
que puedan fortalecer la hiptesis que se ha aceptado. Es de gran
importancia, para el profesional cumplir con este punto, ya que le permite
conocer de forma conceptual o prctica el resultado de la investigacin que


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

se est realizando y es as como se puede justificar la inferencia
estadstica.
9. Conclusiones. Todos los puntos planteados hasta el momento deben llevar
a que el investigador est en capacidad de organizar una conclusin,
basndose especialmente en la hiptesis que acepta y en el anlisis que se
haya hecho.

Prueba de hiptesis para la media de una poblacin.
Se desea estudiar la hiptesis de que la media de la poblacin es igual a un valor
dado (
0
) frente a una alternativa conveniente. Para esto, como se ha venido
estudiando, se plantean dos hiptesis:
H
o
: =
0
H
A
:
0
(prueba a dos colas)
o bien: H
o
: =
0

H
A
: >
0
(prueba a una cola)

H
A
: <
0

Debe notarse que, cuando la hiptesis alternativa se plantea como un
desconocido para el parmetro (), el cual tiene como resultado un dato mayor y/o
menor que el estimador (
0
) y se simboliza con diferente a (); en este caso, la
distribucin se trabaja a dos colas (bilateral). En el caso contrario, cuando se
tiene un punto de referencia para decir en la hiptesis alternativa que, el
parmetro es mayor que (>) el estimador o que el parmetro es menor que (<) el
estimador, se trabaja la distribucin a una cola (unilateral).
Ejemplo. Si se sabe que en unas condiciones especficas, el cultivo de maz para
ensilar da un rendimiento de 20 toneladas por hectrea y se pretende probar la
hiptesis alterna de obtener un resultado diferente con el aumento de la densidad
de plantas sembradas; El resultado obtenido no se estima si es mayor o menor a
las 20 toneladas que ya se sabe normalmente se obtiene, por tanto la hiptesis se
indica con el smbolo . Si el estudio consistiera en manejar el cultivo bajo las
mismas condiciones pero agregndole un fertilizante foliar, se sabe por efecto del
proceso fisiolgico que se obtendra un mayor rendimiento, por lo tanto la hiptesis
a probar sera que la nueva produccin es mayor que la tradicional y se simboliza
con (>)


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Una vez definido el nivel de significancia , la metodologa para adelantar la
prueba consiste en obtener la muestra, calcular el estadstico de prueba y verificar
si este se ubica dentro de la regin de rechazo o aceptacin, la cual definir a
aceptar o rechazar la H
0
. Los estadsticos usuales son:
X
S
X
t
0

= Para muestras pequeas,
X
X
z

= Para muestras grandes o con conocida.


PRUEBA DE UNA COLA. Tambin llamada prueba unilateral, es aquella en la
cual la zona de rechazo o zona crtica est completamente comprendida en uno
de los dos extremos de la distribucin. La prueba es unilateral a la derecha (de la
curva); cuando la hiptesis alternativa de los que se quiere probar, hace mencin
a que el parmetro es mayor que (>) el estimador. Si por lo contrario la hiptesis
alternativa se refiere a que el parmetro es menor que el estimador,
corresponder a una prueba unilateral izquierda.
Prueba unilateral a la derecha: H
o
: =
0

H
A
: >
0

Prueba unilateral a la izquierda: H
o
: =
0

H
A
: <
0

El estadstico a utilizar depende de la cantidad de datos que se tengan, tal como
se determin para los lmites de confianza o como se explic anteriormente;
dependiendo del tamao de la muestra o del conocimiento de la varianza. En este
caso se puede definir entre la distribucin t-student o la distribucin normal (Z).
Para hacer la demostracin se har con la distribucin t-student por dos razones:
a. El tamao de la muestra es pequea.
b. No se tiene una varianza conocida y se debe hallar de los valores
obtenidos.
X
S
X
t
0

=

El valor de t en las tablas que define la zona de aceptacin o rechazo es t, de
este modo la regin de rechazo es:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

( )
{ }
1
/

=
n
t t t R


Si t R entonces se rechaza Ho
Si t R entonces se acepta Ho
Ejemplo. El contenido de protena cruda (PC) del pasto estrella morado (Cynodon
nlefluencis) es de 8% en prefloracin. Por procesos de fertilizacin en el suelo de
acuerdo los requerimientos se supone que aumenta el nivel de protena
comparado con el cultivo tradicional. Se toman aleatoriamente 15 muestras y se
determina el contenido de PC para cada una. De los valores encontrados se tiene
que el promedio nuevo de protena es de 12%, con una varianza de 48.
48
% 12
2
=
=
s
X

Se desea saber si el contenido de protena cruda (PC) s ha cambiado o no; por
tanto las hiptesis a plantear son:
H
o
: =
0

H
A
: >
0

Se puede notar que se usa la prueba unilateral a la derecha por que se pretende
probar si el nuevo valor promedio encontrado de protena cruda (PC) es mayor
que el obtenido bajo condiciones normales o no.
Para calcular el valor estadstico t, primero se debe obtener el valor de error
estndar de la media
x
s
.
78 , 1
15
48
2
= = =
n
s
s
x

24 . 2
78 . 1
8 12
0
=

=
X
c
S
X
t


Si se toma un error de experimentacin al 5% (=0,05), se tiene el valor en la
tabla t con (n-1 grado de libertad) es de 1,7613
7613 . 1
) 14 ( 05 . 0
=
gl
t


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Es importante tener en cuenta que en la tabla se busca a una sola cola (unilateral);
para el ejemplo del 0.05 como , se busca al 95% de confiabilidad.
Para facilitar la interpretacin de la parte superior de la tabla t se puede tener en
cuenta el siguiente cuadro.
FORMAS DE SIMBOLIZAR LAS COLUMNAS EN LA TABLA T.
Confia
b*
Formas de simbolizar las columnas en la tabla t
Una cola (Unilateral) Dos colas (Bilateral)
%
err
or
P**
error
()
%
Confiabili
dad
P**

confiabili
dad
%
err
or
P**

error
()
%
confiabili
dad
P**
confiabili
dad
90 10 0,1 90 0,90 5,0 0,05 95 0,95
95 5 0,05 95 0,95 2,5 0,025 97,5 0,975
99 1 0,01 99 0,99 0,5 0,005 99,5 0,995
* Confiabilidad
** Probabilidad
En vista de que ,t
c
, > t
0.05(14)
, entonces se rechaza Ho con un nivel de significancia
del 0.05 y se puede afirmar que con un nivel de confiabilidad del 95%, el nivel de
protena de pasto estrella morado (Cynodon nlefluencis) fertilizado de acuerdo a
los requerimientos del suelo es mayor que cuando se tiene como un cultivo
convencional sin fertilizacin.
PRUEBA DE DOS COLAS. Tambin llamada bilateral, es aquella en la cual la
zona de rechazo se divide en los dos extremos de la distribucin (cola de la
derecha y cola de la izquierda). Se utiliza esta prueba de hiptesis cuando no se
tiene referencia de un dato mayor o menor del promedio obtenido en el estudio; es
decir, cuando en la hiptesis alterna se plantea que el promedio de la poblacin es
diferente al obtenido (sin saber si es mayor o menor).
H
o
: =
0

H
A
:
0
; no se podra plantear de la forma >
0
<
0

Los estadsticos de prueba siguen siendo t-Student o Z (normal) dependiendo de
las condiciones de tamao de muestra o de la disponibilidad de varianza.
X
S
X
t
0

= Para muestras pequeas,


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

X
X
z

= Para muestras grandes o con conocida.


Es importante tener en cuenta que, en este caso, como se tienen dos posibles
respuestas simbolizadas en la hiptesis al decir que es diferente sin saber si es
mayor o menor que el parmetro de comparacin, se debe trabajar la distribucin
de forma bilateral; donde el nivel de significancia es divido en dos partes (/2)
que indican la porcin de rechazo en la distribucin de los datos; tal como se
muestra en la siguiente grfica.
Grfica. Regin de aceptacin y rechazos en una prueba a dos colas

En este caso la regin crtica R est formada por dos partes: R
1
y R
2
,
donde;


Ejemplo. El historial de una finca ganadera muestra que los animales que se
encuentran en ceba tienen como promedio de ganancia de peso 930 g/da/animal.
Para evaluar un lote que est en esta etapa de produccin y saber si se encuentra
dentro de los parmetros de produccin de la finca, se hace un muestreo aleatorio
de 15 animales, obtenindose los siguiente valores como ganancia diaria de peso:
740, 890, 910, 915, 1000, 980, 960, 870, 856, 798, 979, 863, 982, 791, 916.
Las hiptesis a probar son:
H
o
: = 930

H
A
: 930 (prueba a dos colas)
} {
} {
2 / 1
2 / 1
/
/

t t t R
t t t R
=
=


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Para hacer los clculos con la distribucin t se deben hallar los valores de
promedio y error estndar de la media
x
s
.

67 , 896 = X
09 , 6112
2
= s
X
S
X
t
0

= donde; 18 , 20
15
09 , 16112
2
= = =
n
s
s
x
entonces;
65 , 1
18 , 20
930 67 , 896
0
=

=
X
c
S
X
t


Si se usa un de 0,05, se tiene que el valor de la distribucin t corresponde se
buscara con t
/2
, o sea 0,025 y con n-1 grados de libertad.
t
0,025 (14)
= 2,14
Teniendo en cuenta que ,t, < t
/2
entonces, se acepta la hiptesis nula (H
o
) con una
confiabilidad del 95% y se puede concluir que: Estadsticamente al 95% de
confiabilidad, la ganancia de peso del lote de ceba en la finca est acorde con el
promedio que se tiene como registro.

Leccin 13: Comparacin de dos medias muestrales

La prueba de hiptesis que comprende la diferencia entre la media de dos
poblaciones de utiliza con ms frecuencia para determinar si es razonable o no
concluir que las dos son distintas. En tales casos, se podran plantear una de las
siguientes hiptesis:
0 : , 0 :
0 : , 0 :
0 : , 0 :
2 1 2 1 0
2 1 2 1 0
2 1 2 1 0
>
<
=



A
A
A
H H
H H
H H

As como se muestra, es posible probar que la diferencia es igual a, mayor que, o
menor o igual que algn valor distinto a cero.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Comparacin cuando el muestreo es a partir de una poblacin normal y las
varianzas de las poblaciones son conocidas:
Ejemplo. Un investigador desea saber si los datos tomados en un lote de novillos
alimentados con ensilaje amonificado, proporcionan evidencia suficiente para
indicar una diferencia en las concentraciones de Nitrgeno Ureico en Sangre
(BUN) entre los individuos que no reciban la fuente de Nitrgeno No proteico
(NNP) y los que s. Para hacer la prueba correspondiente, se plantean 9 pasos a
seguir:
1. Arreglo de campo. Los datos corresponden a las lecturas de BUN hechas a
12 novillos suplementados con fuente de NNP y 15 novillos que no reciban
este tipo de suplementacin. Con los datos se obtiene que los grupos
suplementados con NNP tenan un promedio de 4,5 niveles de BUN (mg de
nitrgeno/ ml de sangre), mientras que los novillos sin suplementar tenan
en promedio 3,4 mg/ml sangre.
2. Supuestos. Los datos constituyen dos muestras aleatorias independientes,
cada una extrada de una poblacin con distribucin normal y varianza igual
a 1.
3. hiptesis.
0 : , 0 :
2 1 2 1 0
=
A
H H
Una forma alternativa de enunciar las hiptesis sera:
2 1 2 1 0
: , 0 : =
A
H H
4. Estadstico
( ) ( )
2
2
2
1
2
1
2 1 2 1
n n
x x
Z


+

=
En este caso, se supone que la diferencia entre los dos promedios de la
poblacin (
1
-
2
) es cero (0).
( ) ( )
82 , 2
39 , 0
1 , 1
15
1
15
1
0 4 , 3 5 , 4
= =
+

= Z
5. Regla de decisin. Decidiendo probar con = 0,05, los valores crticos de Z
son 1.96; por tanto:
Zcalculado = 2,82 Zcrtico = 1,96


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

2,82 > 1,96; por tanto se rechaza H
0

6. Conclusin. se puede concluir que, con un nivel de confianza del 95% el
nivel de urea en sangre de novillos suplementados con ensilaje amonificado
es diferente a cuando no se suplementan con esta fuente de NNP.
Comparacin cuando el muestreo es a partir de una poblacin normal y las
varianzas de las poblaciones son desconocidas:
Cuando se desconocen las varianzas de las poblaciones, pero se supone que son
iguales, stas se pueden hallar de la siguiente forma:
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
p

Una vez halladas las varianzas, se puede proceder como en el caso anterior,
utilizando el valor hallado para reemplazar en la ecuacin de la distribucin Z.
Comparacin cuando el muestreo es a partir de una poblacin que no se comporta
aproximadamente a la distribucin normal.
Cuando el muestreo se realiza a partir de una poblacin que no presenta
distribucin normal, pueden utilizarse los resultados del teorema central de lmite
si el tamao de la muestra es grande. Esto indica que, si la muestra es grande, se
puede utilizar el teorema normal.

( ) ( )
2
2
2
1
2
1
2 1 2 1
n n
x x
Z


+

=
Comparacin en parejas (comparacin de dos medias muestrales)
En los procesos prcticos o de investigaciones en el rea agropecuaria es comn
tener que efectuar comparaciones entre dos medias de muestras aleatorias de
una misma o diferente poblacin bajo algn parmetro de estudio. Por ejemplo, el
comportamiento bajo una dieta para machos y hembras de una especie; el criollo
de maz de una zona contra algn material mejorado o la comparacin entre razas
de animales. Esto implica la utilizacin de algn estadstico de prueba que nos
permita definir sobre una hiptesis planteada
Ho: i = j.
Lo primero y ms importante por hacer es identificar si la muestra corresponde a
muestras apareadas o a muestras no apareadas y para ello se deben seguir los
siguientes criterios.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Muestras apareadas.
Tienen igual nmero de elementos entre las dos muestras.
Una muestra depende de la otra, es decir, se analiza el mismo grupo con el
efecto de dos tratamientos. Cuando se habla de dependencia, no se refiere a
variables dependientes e independientes en modelos lineales; esto hace
referencia a que una muestra fue tomada despus de terminar de aplicar la
anterior y en los mismos ejemplares, terreno, etc.
Muestras no apareadas.
Puede contener igual o diferente nmero de datos entre las dos muestras.
Siempre se refiere a la aplicacin de tratamientos o medidas en dos grupos
diferentes.

Comparacin de medias para dos grupos con datos apareados
En este caso, trataremos con muestras del mismo tamao; adems, cada valor de
la primera muestra corresponde precisamente un valor de la segunda.
Comnmente, a este tipo de comparaciones se le denomina observaciones
apareadas, en virtud de que los elementos de una muestra son homogneos
respecto de la contrastante o son los mismos; slo que el estmulo o tratamiento
es diferente. En lugar de llevar al anlisis con observaciones individuales, se utiliza
como variable de inters la diferencia entre pares individuales de observaciones.
Sucede con frecuencia que no hay diferencias reales entre las poblaciones en lo
que respecta a la variable de inters, pero la presencia de fuentes extraas de
variacin provocan el rechazo de la hiptesis nula de no diferencia. Por otra parte,
las diferencias reales pueden tambin ser enmascaradas por la presencia de
factores extraos.
El objetivo en las pruebas de comparaciones apareadas es eliminar un nmero
mximo de fuentes de variacin extraa, haciendo a las parejas semejantes con
respecto a tantas variables como sea posible. Las observaciones apareadas
pueden obtenerse de varias formas. Los individuos pueden registrarse antes y
despus de recibir algn tratamiento. Camadas del mismo sexo pueden ser
asignadas al azar para que reciban algn tratamiento. Parejas de gemelos o
hermanos pueden ser asignados al azar para que reciban dos tratamientos. O
siendo ms explcitos; la respuesta de un cordero a una dieta antes y despus de
la aplicacin de un medicamento; o la produccin de un rbol antes y despus de
la poda. La hiptesis planteada lgicamente ser la misma:
Ho: i = j


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Ha: i j
Pasos Para Realizar Prueba De Medias Apareadas
1. Identificar los tipos de muestra.
2. Clculos estadsticos
Calcular la media para cada uno de los grupos j Y y i Y
Calcular diferencias
j i
y y d =
Calcular diferencias al cuadrado d
2

Hallar sumatoria de d y d
2

Hallar promedios para d ( ) d
3. Planteamiento de hiptesis para medias
Ho=i = j
Ha=i j
4. Comparacin de medias (t-student)
t
) 1 (
) (
2
2

n n
n
d
d
d
c
i
i
t= (n-1)gl
5. Comparacin y regla de decisin.
6. Anlisis y Conclusiones.
Ejemplo. Las curvas de crecimiento de plantas de sorgo forrajero (Sorgum bicolor)
arrojaron los siguientes datos como mximo de altura prefloracin (cm), para
identificar si existe diferencia en produccin de forraje entre plantas germinadas y
plantas rebrotadas despus del primer corte. Cabe anotar que para el estudio se
tuvieron en cuenta las mismas plantas.
1. Identificacin de la muestra. Teniendo claro que se utilizaron las mismas
plantas en el mismo cultivo y por tanto se guarda homogeneidad en las unidades
experimentales, se pude clasificar esta comparacin de dos muestras con
observaciones apareadas.
2. Clculos estadsticos.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

OBSERVACIONES DE DOS MUESTRAS APAREADAS.
Germinadas
(y
i
)
Rebrotadas
(y
j
)
Diferencias
(d) Y
i
Y
j

d
2

105 96 9 81
89 90 -1 1
78 92 -14 196
120 98 22 484
115 94 21 441
114 90 24 576
102 96 6 36
87 93 -6 36
95 97 -2 4
96 94 2 4
105 96 9 81
79 89 -10 100
88 91 -3 9
92 90 2 4
103 92 11 121
106 96 10 100
112 98 14 196
97 95 2 4
102 94 8 64
1885
1
=

=
n
n
i
y

=
=
n
n
yj
1
1781 104
1
=

=
n
n
i
d 2538
1
2
=

=
n
n
i
d
21 , 99 =
i
Y 74 , 93 =
j
Y 47 , 5 =
i
d 58 , 133
2
=
i
d

3. Planteamiento de hiptesis: a partir de este tema, es necesario iniciar el
proceso de formulacin y redaccin de hiptesis. Para el ejemplo, se presentan
dos formas de plantear las hiptesis.
Ho=i = j.
La altura mxima promedio de crecimiento (cm) de sorgo forrajero
germinado y rebrotado en el primer corte es igual estadsticamente.
Se estima que la altura (cm) de crecimiento mximo en prefloracin de
plantas sorgo forrajero germinado y los mismas rebrotadas despus del
primer corte no tienen diferencias estadsticamente significativas.
Ha: i j:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

La altura mxima promedio de crecimiento (cm) de sorgo forrajero
germinado y rebrotado en el primer corte es diferente.
Se estima que la altura (cm) de crecimiento mximo en prefloracin de
plantas de sorgo forrajero germinado y los mismas rebrotadas despus
del primer corte tienen diferencias estadsticamente significativas.
4. Comparacin de medias (t-student)
) 1 (
) (
2
2

n n
n
d
d
d
tc
i
i
t (n-1gl)
) 1 19 ( 19
19
104
2538
47 , 5
2

= tc t
0.05(18)
=2.10
) 1 19 ( 19
19
10816
2538
47 , 5

= tc
342
73 , 1968
47 , 5
= tc
756 , 5
47 , 5
= tc
39 , 2
47 , 5
= tc

27 , 2 = tc
5. Comparacin y regla de decisin.
tc =2,27 > t
0.05(18)
=2,10; por lo tanto se rechaza H
0

6. Anlisis y Conclusiones.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Estadsticamente al 95% de confiabilidad, se estima que la altura mxima
promedio (cm) alcanzada por el sorgo antes de cortar y en el rebrote del primer
corte es estadsticamente diferente. Esto indica que si se tiene en cuenta que el
sorgo antes de cortar tiene un promedio de 99,2111,85 cm, es mayor que en el
rebrote 93.742.86; lo cual significa que con la primera produccin se puede
obtener mayor cantidad de forraje, pero tambin con mayor variabilidad como lo
muestra la desviacin estndar.

Leccin 14: Anlisis de varianza

El anlisis de varianza fue ideado por Sir Ronald Fisher en 1925. Esta tcnica
estadstica ha resultado de gran aplicacin en aquellas investigaciones que tienen
como propsito analizar los efectos de uno o ms factores sobre el
comportamiento de una cierta caracterstica. En sus inicios se aplico bsicamente
en el campo de la experimentacin biolgica, y muy especialmente en la
agricultura; pero hoy en da es utilizada con xito en diferentes ramas del trabajo
experimental. Puede considerarse adems, que esta tcnica ha contribuido al
desarrollo de algunos mtodos estadsticos, entre ellos, en los llamados mtodos
de regresin, y que una de sus ms frecuentes aplicaciones se encuentra en el
propio diseo de experimentos.
Su aplicacin en el diseo de experimentos se debe a que el anlisis de varianza
es considerado como una de las tcnicas ms tiles para aumentar la sensibilidad
de dicho diseo, ya que a travs de l se puede suprimir las variables que
intervienen en un fenmeno dado y que no son de la importancia experimental.
El anlisis de varianza, es esencialmente un procedimiento aritmtico que
descompone una suma total de cuadrados en componentes asociados con
fuentes de variacin reconocida. Se ha usado con provecho en todos los
campos de la investigacin en los que los datos se miden cuantitativamente.

Supuestos del anlisis de Varianza

Aditividad.
La aditividad se refiere a que los efectos de las diferentes fuentes de variacin
pueden sumarse para explicar la variabilidad entre las observaciones. De este


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

modo, cualquier unidad experimental puede considerarse como una suma de
componentes a travs de un modelo lineal aditivo. Un caso comn de no
aditividad se presenta cuando los efectos son de tipo multiplicativo. La falta de
aditividad en los efectos conduce a cierto grado de heterogeneidad en el error,
no permitiendo estimar una varianza comn para todos los tratamientos, por lo
cual puede ocasionar niveles falsos de significancia para la comparacin de los
efectos de tratamiento. La falta de aditividad puede probarse mediante el
mtodo propuesto por Tukey (1949).
Normalidad. Los errores experimentales y por lo tanto las observaciones
deben presentar distribucin normal. Este supuesto se requiere para
sustentar las pruebas de hiptesis y los intervalos de confianza aunque no
es necesario para la estimacin de las varianzas. Afortunadamente en la
mayor parte de los casos prcticos este supuesto se cumple en
forma aproximada, lo cual se debe a que la distribucin normal es muy
comn en la naturaleza, especialmente cuando se estudian variables
continuas, adems, el teorema del lmite central permite aproximar a la
normal la mayor parte de los promedios.
Independencia. Se supone que los errores que afectan las unidades
experimentales son independientes. La distribucin al azar (aleatorizacin)
de los tratamientos sobre las unidades experimentales (teniendo en cuenta
las restricciones de cada diseo), se considera como una medida adecuada
para garantizar este supuesto.
Homogeneidad de varianzas. Supone que las varianzas dentro de cada
tratamiento son homogneas, o sea que constituyen estimaciones de una
varianza comn de errores.
Cuando se presenta la heterogeneidad de varianzas puede ser de dos
tipos, regular o irregular. En el tipo regular generalmente existe cierta
relacin funcional entre las medias de los tratamientos y las varianzas, por
ejemplo en las ciencias biolgicas se encuentra con alguna frecuencia una
correlacin positiva entre la media y la varianza, o sea que grupos de
organismos con medias grandes tienden a tener varianzas grandes y
viceversa. Este problema puede solucionarse aplicando una transformacin
apropiada a los datos, de tal manera que en la variable transformada
resulten independientes (o casi independientes) estos parmetros.
En el tipo irregular, ciertos tratamientos poseen considerablemente mayor
variacin que otros sin que exista una relacin clara entre media y
varianzas. En este caso a veces es posible descartar ciertos tratamientos


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

responsables de la heterogeneidad y analizar los restantes o dividir el error
en grupos y hacer las comparaciones entre los tratamientos de cada grupo
donde las varianzas resulten homogneas.
Para verificar si se cumple el supuesto de homogeneidad de varianzas se
han propuesto diferentes pruebas, tales como la de Hartley descrita en
forma detallada por Gill (1978) que involucra la relacin entre la varianza
mayor y la varianza menor de los diferentes grupos. Sin embargo la ms
generalizada es la de Barlett (1937) que puede utilizarse para tratamientos
con desigual numero de replicaciones.

Leccin 15: Anlisis de Covarianza

El anlisis de covarianza es un procedimiento muy importante en experimentacin.
Utiliza el anlisis de varianza y el de regresin para eliminar la variabilidad que
existe en la variable independiente X; tambin ajusta medias de tratamiento y as
estima mucho mejor el efecto de la variable independiente X sobre la variable
dependiente Y.
El anlisis de covarianza trata de dos o ms variables medidas y donde cualquier
variable independiente medible no se encuentra a niveles predeterminados, como
en un experimento factorial. Este aparte trata de la covarianza lineal. A menudo,
una relacin lineal es una aproximacin razonablemente buena para una relacin
no lineal con tal que los valores de las variables independientes no cubran un
intervalo muy amplio.

La variable independiente X es una observacin hecha en cada unidad
experimental antes de aplicar los tratamientos, e indica hasta cierto grado la
respuesta final Y de la unidad experimental. Por ejemplo, en un experimento con
cerdos se tienen pesos iniciales X, y consumo de alimento Y; si se hubieran
usado varias raciones las diferencias entre sus efectos podran o no ser
significativas, es decir, puede o no haber diferencias en cuanto a la calidad de las
raciones. Sin embargo, antes de llegar a conclusiones hay que preguntarse, de
existir la variacin de los pesos iniciales de las camadas, la diferencia en los
pesos finales de los cerdos se puede atribuir a la bondad de alguna de las
raciones?, O alguna parte en las diferencias en los pesos finales se debe a la
diferencia en los pesos iniciales de dichas camadas? Con respecto a esta ltima
pregunta se sabe que los lechones de mayor peso al nacer son ms agresivos y,


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

en consecuencia, consumen mayor cantidad de alimento y aumentan de peso con
mayor facilidad que los lechones pequeos de poco peso.
Al ajustar los valores de Y, de acuerdo con los valores correspondientes de X, es
posible analizar con mayor precisin los resultados del ensayo. Por medio del
anlisis de covarianza se puede calcular y eliminar la parte correspondiente a las
diferencias en los pesos iniciales. En general, en ensayos de alimentacin con
animales, las diferencias entre medias de tratamiento no ajustadas se deben al
valor nutritivo de las raciones, a la cantidad consumida por los animales, o a
ambas causas. Si se ajustan las diferencias de aumento de peso a un peso inicial
comn y se aplican las raciones, las medias ajustadas indicaran si en realidad las
dietas tienen valor nutritivo diferente.

Usos del anlisis de Covarianza

Los usos ms importantes del anlisis de covarianza son:
1. controlar el error y aumentar la precisin
2. Ajustar medias de tratamientos de la variable dependiente a las diferencias en
conjuntos de valores de variables independientes correspondientes.
3. Ayudar en la interpretacin de los datos, especialmente en lo concerniente a la
naturaleza de los efectos de los tratamientos.
4. Particionar una covarianza total o suma de productos cruzados en
componentes.
5. Estimar datos faltantes.











UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


UNIDAD 2. DISEO DE EXPERIMENTOS

CAPITULO 4: Diseo de experimentos

Leccin 16: El experimento y sus elementos

Qu es un experimento?
Experimento, tiene dos acepciones, una general y una particular. La regla general
se refiere a "tomar una accin" y despus observar las consecuencias. Se
requiere la manipulacin intencional de una accin para analizar sus posibles
efectos y la aceptacin particular (sentido cientfico). "Un estudio de investigacin
en el que se manipulan deliberadamente una o ms variables independientes
(supuestas efectos), dentro de una situacin de control para el investigador".
Cul es el primer requisito de un experimento puro?
El primer requisito es la manipulacin intencional de una o ms variables
independientes. La variable independiente es considerada como supuesta causa
en una relacin entre variables; es la condicin antecedente, y al efecto provocado
por dicha causa se le denomina variable dependiente (consecuente). El
investigador no puede incluir en su estudio a dos o ms variables independientes.
Un experimento se lleva a cabo para analizar si una o ms variables
independientes afectan a una o ms variables dependientes y por qu lo hacen.
En un autntico experimento, la variable independiente resulta de inters para el
investigador por ser la variable hipottica, que ser una de las causas que
producen el efecto supuesto. Para obtener respuesta de esta relacin causal
supuesta, el investigador manipula la variable independiente y observa si la
dependiente vara o no. Manipular es hacer variar o dar distintos valores a la
variable independiente.
La variable dependiente se mide, no se manipula. Se mide para ver el efecto de
que la manipulacin de la variable independiente tiene de ella.
La manipulacin o variacin de una variable independiente puede realizarse en
dos o ms grados. El nivel mnimo de manipulacin es dos: presencia-ausencia de


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

la variable independiente. Cada nivel o grado de manipulacin implica un grupo en
el experimento.

Presencia-ausencia implica, un grupo a la presencia de la variable independiente y
otro no. Luego los dos grupos son comparados para ver si el grupo que fue
expuesto a la variable independiente difiere del grupo que no fue expuesto. Al
primer grupo se le conoce como "grupo experimental" y al segundo se le
denomina "grupo de control".
A la presencia de la variable independiente se le llama "tratamiento experimental"
o "estmulo experimental".
En general, en un experimento puede afirmarse lo siguiente: si en ambos grupos
todo fue "igual" menos la exposicin a la variable independiente, es muy razonable
pensar que las diferencias entre los grupos se deban a la presencia-ausencia de la
variable independiente.
Manipular la variable independiente en varios niveles tiene la ventaja de que no
slo se puede determinar si la presencia de la variable independiente o
tratamiento experimental tiene un efecto, sino tambin si distintos niveles de la
variable independiente se producen diferentes efectos. Es decir, si la magnitud del
efecto (Y) depende de la intensidad del estmulo (X1, X2, X3, etctera). Debe
haber al menos dos niveles de variacin y ambos tendrn que diferir entre s.
Cuantos ms niveles mayor informacin, pero el experimento se va complicando:
cada nivel adicional implica un grupo ms.
En ocasiones, la manipulacin de la variable independiente conlleva una
combinacin de cantidades y modalidades de sta. Finalmente, es necesario
insistir que cada nivel o modalidad implica, al menos, un grupo. Si tiene tres
niveles (grados) o modalidades, se tendrn tres grupos como mnimo.

Experimento aleatorio.
La investigacin en las ciencias agropecuarias se caracteriza en parte porque se
puede repetir bajo las mismas condiciones siguiendo un procedimiento estndar.
En el caso de la aplicacin de un insumo (nutrimento, fungicida, fitohormona, etc.)
a una especie vegetal. De la nica forma como un investigador puede obtener
informacin de tal accin es inmediata la ejecucin de un EXPERIMENTO. Cada
experimento termina con un resultado, pero la caracterstica de estos


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

experimentos es que el resultado final no se puede predecir con seguridad, sino
hasta la realizacin del experimento.
Esta clase de experimento, con tres caractersticas esenciales: repeticin bajo las
mismas condiciones, desconocimiento del resultado final y conocimiento de
todos los posibles resultados antes de la ejecucin del experimento, se conoce
como experimento aleatorio.
El propsito fundamental de la estadstica es el de proveer modelos matemticos
para estos experimentos aleatorios. Una vez que se provee el experimento
aleatorio de tal modelo, el estadstico y el investigador puede realizar la inferencia
(induccindeduccin), acerca del experimento aleatorio en cuestin. Un alto
porcentaje de la generacin de tecnologa en las ciencias agropecuarias est
basado en experimentos aleatorios. Con estas notas se buscar
fundamentalmente, establecer los diferentes modelos estadsticos que se adecuan
a este tipo de experimentos.
Adems de la caracterizacin del experimento aleatorio. Se define el concepto de
experimento como tal. La palabra EXPERIMENTO, para nuestro propsito, es un
ensayo fsico, planeado con el fin de confirmar los resultados de experimentos
anteriores o como resultado de la formulacin de una hiptesis a ser probada
mediante procedimientos experimentales. Con los experimentos se genera la
tecnologa, los cuales contribuyen a la solucin de los problemas del sector
agropecuario.
Los experimentos, en general se pueden dividir en tres amplias categoras, as:
bsicos, crticos y demostrativos. En un experimento bsico el investigador prueba
un gran nmero de tratamientos con el objetivo de tener gua para trabajos futuros
o bien es aquel que conduce a la obtencin de nuevos conocimientos a partir de
los cuales se desarrolla la investigacin aplicada.
En experimentos crticos, el investigador compara la respuesta diferentes
tratamientos, usa un mayor nmero de observaciones para asegurar mas la
bondad de un conjunto de tratamientos sobre otro conjunto particular, se busca
obtener conocimiento de origen: nuevos insumos, bienes o servicios, los cuales
conducen a que se incorpore una tecnologa y practicas adecuadas dentro de los
diferentes sistemas de produccin.
Los demostrativos ocurren ya con agentes de extensin donde se compara lo
obtenido en una granja experimental contra un estndar regional de amplio uso; es
una etapa fundamental dinmica y se basa en adecuar la tecnologa bsica a nivel
de los sistemas de produccin local.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Se puede agregar que cada experimento es un conjunto de respuestas a una o
ms preguntas. Con esto en mente el investigador decide qu comparacin de
tratamientos produce la informacin ms relevante. Se conduce entonces un
experimento para medir o probar hiptesis sobre diferencias entre los tratamientos
bajo condiciones comparables, se toman observaciones y medidas sobre el
material experimental.
En general, el objetivo de un experimento agropecuario o ambiental es obtener
informacin (datos) que resuelva un limitante tecnolgico en una especie animal,
vegetal parmetro ambiental o dar solucin a un interrogante ya planteado en
investigaciones anteriores. En consecuencia, un buen diseo experimental es el
resultado de un anlisis muy preciso del problema o limitando tecnolgico. Al
estadstico con frecuencia se le solicitara asesora para hacer inferencias
(inducciones y deducciones) de los resultados experimentales. Puesto que las
inferencias que se puedan hacer dependen solamente de la forma como se
ejecuto el experimento, el asesor requerir de una descripcin detallada del
ensayo y sus objetivos. Entonces es posible que no se puedan hacer las
inferencias requeridas y aquellas variables no responden a los interrogantes
planteados por el investigador; es decir, un refinamiento que se proponga en la
tcnica estadstica, no sustituye la claridad que se tenga a la problemtica. La
estadstica provee de herramientas que facilitan y otorgan medios a la solucin del
interrogante planteado, pero no que decida sobre el problema como tal.
En un diseo de experimentos, se establecen los objetivos, se clasifican los
interrogantes, se plantean las hiptesis, se estiman los efectos, se jerarquizan los
objetivos y finalmente con base al anlisis se producen las recomendaciones.

Leccin 17: ORIENTACIONES GENERALES EN LA EXPERIMENTACION
AGRICOLA
En la planificacin agrcola o biolgica y en el desarrollo de una investigacin en
particular, son de inters las siguientes aspectos:
a. Especificar los problemas, con el fin de probar hiptesis o encontrar
respuestas. Es necesario considerar que los experimentos sean:
Experimentos simples, cuando se estudia un solo factor de variacin; por
ejemplo, probar cinco variedades de sorgo, estudiar cinco dosis de
nitrgeno en trigo, etc.
Experimentos factoriales, cuando se estudian simultneamente dos o ms
factores que influyen en la produccin; por ejemplo, estudiar tres


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

variedades, cada una sembrada a tres densidades de siembra, o bien
tratamientos de fsforo, nitrgeno y potasio, cada uno a cuatro dosis por
unidad de superficie.
b. Ubicar el lugar adecuado para la realizacin de los experimentos, para lo cual
se debe elegir una localidad accesible y representativa de reas agrcolas, de
suelo uniforme, con unidades experimentales lo ms uniforme posible, y escoger
el material adecuado para experimentos, de manera que pueda estratificarse
(agruparse unidades experimentales con caractersticas homogneas) el terreno
correctamente para formar grupos uniformes y de fcil manejo.
c. Reducir las fuentes de error, tanto del experimento como de aquellos errores o
equivocaciones operacionales. Es muy importante que en la seleccin de datos,
muestreo, etc., el personal responsable est constituido por tcnicos o personas
con entrenamiento.
d. Mantener constante los diversos factores que pueden afectar a la produccin o
a la calidad del producto, de manera que los nicos factores de variacin sean los
tratamientos objeto de estudio.
e. Extremar precauciones y ser cautos en los resultados experimentales,
considerando que un experimento es una observacin de una muestra en una
poblacin de experimentos.
f. Repetir experimentos uniformes en diferentes localidades, suelos y aos.
g. Tener conocimiento de la tecnologa de campo y saber cules son los
problemas del productor.
En la planeacin o diseo de un experimento agronmico, es necesario aplicar un
conjunto de disciplinas y conocimientos biolgicos con el fin de encontrar una
respuesta correcta a un problema especfico. Por ejemplo, si se comparan
diversas variedades de trigo, todos los factores de la produccin que influyen en el
comportamiento de las variedades deben permanecer constantes y las nicas
fuentes de variacin o diferencias sern presentadas por las variedades de trigo, si
tales fuentes existen. Para lograr lo anterior, es necesario contar con ciertos
conocimientos sobre:
a) Suelos, a fin de elegir el terreno ms uniforme y adecuado para realizar el
experimento.
b) Fertilizacin, para cuando sea necesario planear experimentos con
fertilizantes qumicos orgnicos o abonos orgnicos.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

c) Topografa e hidrulica, para trazar parcelas, niveles, riegos, etc.
d) Especialidades afines como: Botnica, entomologa, fitopatologa, fisiologa,
gentica, ecologa, etc. para poder trabajar con seres vivos.
e) Tecnologas de Cultivos, sistemas agroforestales, agrosilvo pastoriles y
zootecnia, para manejar las unidades experimentales.
f) Estadstica (biometra o bioestadstica), para evaluar y separar las diversas
causas de variacin y para realizar la interpretacin de los resultados
experimentales.
Pasos al planear un experimento:
El mtodo cientfico sugiere que en el planeamiento de la experimentacin se
debe tener presente las siguientes etapas:
Definir el problema: En esta etapa se debe determinar los antecedentes,
importancia, objetivos, hiptesis a probar y revisin de la bibliografa.
Planeamiento y diseo del experimento: En esta etapa se debe tener en
cuenta: Lugar de ejecucin del experimento, tamao de la parcela o unidad
experimental, nmero de repeticiones por tratamiento, equipos e
instrumentos a utilizar y mtodos de evaluacin de los resultados
Ejecucin del experimento.
Recoleccin de datos del experimento.
Ordenamiento de la informacin experimental.
Discusin de los resultados obtenidos.
Anlisis econmico de los tratamientos que se probaron y utilidad prctica.
Conclusin final y recomendacin.


Leccin 18: Diseo experimental.

Kempthorne (1952) plantea que el experimento general del mtodo cientfico es
formular hiptesis y despus verificarlas mediante la experimentacin o medir sus
consecuencias. Para hacer la verificacin se requiere de la observacin y es el


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

diseo de experimentos quien seala la forma como provienen esas
observaciones. El diseo experimental permite establecer si una hiptesis puede
ser verificada o no, de si las observaciones que se toman son relevantes con la
hiptesis y capaces de dar las respuestas correctas a lo que se plantea.
Observaciones que se toman de cierta forma no proveen la informacin necesaria
para probar una hiptesis, mientras que si se toma de otra forma sirven para la
verificacin de la hiptesis. Kempthorne, agrega que una investigacin
estadsticamente diseada consistira de los siguientes pasos:
1- Establecer el problema.
2- Formular las hiptesis.
3- Sealar la tcnica y el diseo experimental.
4- Examinar los posibles resultados y revisar las razones del problema, para
asegurarse de que el experimento le provee de la informacin adecuada a sus
interrogantes.
5- Considerar los resultados desde el punto de vista de los procedimientos
estadsticos que serian aplicados, para asegurarse de las condiciones necesarias
para que estos sean validos.
6- Realizar el experimento.
7- Aplicar las tcnicas estadsticas de los datos experimentales.
8- Obtener conclusiones, de acuerdo con la estimacin estadstica que se
haga; se debe tener consideracin cuidadosa de la validez de las conclusiones de
acuerdo con la poblacin para la cual se aplica.
9- Evaluacin de toda la investigacin, especialmente con otras
investigaciones realizadas con el mismo o problemas similares.
Por diseo experimental se entender la forma o procedimiento de cmo se
asignan los tratamientos a las unidades experimentales o bien la restriccin que se
hace al asignar los tratamientos a las unidades experimentales.

Unidad experimental y tratamiento
Una unidad experimental es una unidad material (fsica biolgica) a la cual se
aplica un tratamiento el tratamiento es un procedimiento o estimulo, cuyo efecto se
desea medir o comparar con otra serie de tratamiento.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

La unidad experimental puede ser un animal (vaca, novilla, pollo, rbol, muestra
de agua, muestra de suelo, etc.) o grupo de las anteriores especies, una parcela,
plantas de maz, frjol, naranja, etc. Al seleccionar un conjunto de tratamientos es
importante definirlos clara y precisamente con cada uno de ellos y considerarlos
uno con respecto a los dems y as dar una respuesta eficiente a los objetivos de
experimentacin.

Error experimental
En general una caracterstica de las unidades experimentales usadas en
investigaciones agropecuarias, es la variacin existente en las unidades cuando
se ejecutan las medidas pertinentes. La variabilidad de las unidades
experimentales en las ciencias agropecuarias es el producto de su misma
constitucin: son seres vivos y en ellos su condicin natural es la variabilidad,
dinmicos en su expresin, los resultados finales de un experimento son inciertos,
se requiere de la probabilidad para medir su incertidumbre y en consecuencia de
modelarlos a travs de los as llamados experimentos aleatorios. A esta
variabilidad Cochran y Cox (1952) la denominaron variabilidad inherente o propia
del material experimental. La incertidumbre del resultado final o variabilidad propia
de las unidades experimentales, se conoce estadsticamente como error
experimental. Tambin se interpreta como error experimental al hecho por el cual
las unidades experimentales no producen los mismos resultados aun as estn
tratadas igualmente y manejadas bajo las mismas condiciones experimentales.
Existe otra variabilidad en la experimentacin agropecuaria y es la resultante de
no conducir tcnica o adecuadamente el experimento, son los errores de
medicin, de atencin, de la falla en la tcnica experimental de campo o
laboratorio que ocurre al desarrollo de un experimento. Es de vital importancia
hacer todos los esfuerzos posibles para reducir el error experimental, para mejorar
as la eficiencia de la investigacin y asegurar el xito de la misma. Esto se puede
obtener si se considera:
1- Tomar material experimental en el cual la variabilidad que lo caracteriza sea
mnimo.
2- Refinar la tcnica experimental de campo o laboratorio.





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Replicacin y su funcin
Cuando un tratamiento se aplica ms de una vez, se dice que el tratamiento se ha
replicado.
Las funciones de la replicacin son:
1- Proveer de un estimativo del error experimental.
2- Mejorar la precisin del experimento al reducir el error estndar del
promedio de un tratamiento.
3- Aumentar el alcance de la inferencia del experimento, seleccionar y usar el
nmero apropiado de unidades experimentales.
La estimacin del error experimental es necesaria para ejecutar las pruebas de
hiptesis y para establecer los intervalos de confianza para los promedios. Un
experimento en el cual el tratamiento aparece solo una vez se dice que es un
experimento y una replicacin o repeticin; de este experimento no se logra una
estimacin del error experimental; aqu es posible observar la diferencia entre
tratamientos es debida a la naturaleza de una unidad experimental. En otras
palabras, cuando no exista un, mtodo de estimar el error experimental no hay
forma de determinar si las diferencias observadas son debidas a los tratamientos o
son causa de la estructura de la unidad experimental.
Cuando el nmero de replicaciones se incrementa, los estimadores de los
promedios son ms precisos, as si n aumenta y el error tiende a decrecer.
En cierto tipo de experimentos, la replicacin indica un enlace mayor de la
inferencia estadstica. Por ejemplo, deseamos saber si existe un efecto real de un
nutriente sobre dos razas diferentes. Si el objetivo del experimento es sacar
conclusiones sobre ambas razas, es obvio que dichas razas deben estar en un
periodo de aos. La razn es obvia puesto que las condiciones varan de un ao a
otro y es importante conocer el efecto de los aos sobre los diferentes
tratamientos, puesto que las recomendaciones usualmente son hechas para los
aos futuros. Igualmente se usan diferentes localidades para evaluar los
tratamientos bajo los diferentes ambientes. Las replicaciones en el tiempo (aos) y
en el espacio (localidades) son consideradas como repeticiones y su propsito
es el de aumentar el alcance de la inferencia. Los mismos principios se usan con
frecuencia en experimentos de laboratorio.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Control del error experimental.
El error experimental puede ser disminuido mediante los siguientes pasos:
1. Diseo experimental.
2. Uso de informacin adicional.
3. Tamao y forma de la unidad experimental.
1. El uso del diseo experimental como un medio de reducir el error
experimental ha sido ampliamente investigado desde los aos veinte del ao
actual. Esta es una materia de alta discusin y solo se presenta y solo se
presentan principios bsicos. Para ver Cochran y Cox, Federer y Kempthorne.
El control del error por medio del diseo consiste en planear de tal forma que la
variacin natural en las unidades experimentales no contribuyan a falsear la
diferencia debido a tratamientos cuando, por ejemplo, las unidades experimentales
se agrupan en bloques (un bloque que posea todos los tratamientos), de tal forma
que la variacin entre las unidades del bloque sea menor que entre bloques, la
precisin del error experimental incrementa. Tales bloques se denominan
replicaciones. El error experimental se basa el la variacin de las variacin de las
unidades dentro del bloque, puesto que la variacin entre bloques puede ser
eliminada.
Cuando el nmero de tratamientos se aumenta, el nmero de unidades por bloque
se incrementa.
Ciertos diseos permiten dividir los bloques en sub-bloques los cuales poseen una
porcin total de tratamientos. Tales diseos se denominan diseos de bloques
incompletos donde la precisin de ciertas comparaciones se incrementa a
expensas de otras
2. Uso de informacin adicional. En muchos experimentos la precisin se
puede aumentar mediante el uso de una tcnica estadstica llamada covarianza.
Unos de los principales ejemplos de covarianza es el peso inicial de los animales,
la edad de los animales y el nmero de partes al inicio del ensayo.
3. Tamao y forma de la unidad experimental. El tamao ptimo de una
parcela en la experimentacin de un cultivo particular depende de factores como la
forma de la variabilidad del suelo y el costo de los procedimientos experimentales,
los cuales son determinados por los tratamientos, se debe agregar que existe


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

variacin de ao a ao en las parcelas donde se experimenta, como resultado de
las condiciones ambientales que interactan con la fertilidad natural de las
parcelas.
En los experimentos agronmicos existen los llamados ensayos en blanco o de
uniformidad los cuales conducen a determinar el tamao y la forma de la parcela
experimental, al igual que el nmero de repeticiones. Otros factores de
importancia son la clase de cultivos, el nmero de variedades o tratamientos, clase
de maquinaria agrcola a usar, costo de mano de obra y presupuesto con que se
cuenta.
Parcelas pequeas serian convenientes, cuando un nmero alto de tratamientos
se estn comparando, o cuando por ejemplo se dispone de muy poca cantidad de
semillas.

Seleccin de tratamientos
En casi la totalidad de las investigaciones agropecuarias y ambientales (variables
biolgicas), los tratamientos son los entes que van a solucionar los limitantes
tecnolgicos planteados en el estudio; son hasta cierto punto la hiptesis o
supuestos del problema. En consecuencia, son muy importantes en el concepto de
la investigacin; se requiere un serio anlisis para su seleccin, debe dedicarse un
buen tiempo de reflexin, revisin bibliogrfica, para tener antecedentes de los
mismos y as hacer una buena decisin de aquellos que hagan parte de la
experimentacin final. El investigador debe plantearse una pregunta como: es
necesario testigo?, Cul?, el del productor convencional?, el comercial?, se
adiciona o sustrae A o B tratamientos, se resuelven las hiptesis planteadas?, o
hacen ms complejos los interrogantes?.
La consulta al estadstico, en esta etapa de la experimentacin, es de fundamental
importancia y de gran ayuda para el investigador.
La seleccin de tratamientos es substancial para la precisin y conclusiones a
llegar; en general, es el investigador quien mejor conoce sus tratamientos, este
conocimiento es el que ayuda a menudo a decidir sobre la cantidad de dosis de un
tratamiento particular.
Tcnica experimental de campo
Una tcnica cuidadosa en la conduccin fsica del ensayo es bsica para las
conclusiones y recomendaciones finales del mismo. Es la responsabilidad del


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

investigador que cada paso de la experimentacin debe ser ejecutado con el
mayor cuidado posible para asegurarse as de buenos resultados. En general, la
variacin resultante de la no atencin adecuada del experimento no es una
variacin aleatoria por tanto no sujeta las leyes de probabilidad en las cuales esta
basada la inferencia estadstica. Esta variacin puede denominarse incapacidad
tcnica, en contraste con las variaciones mencionadas. Entonces se debe ser
cuidadoso en:
Tener unidades uniformes en el caso de que el diseo as les exija.
Precisin en las cantidades de raciones o fertilizantes al suministrarlas a las
unidades experimentales.
Es fundamental el manejo uniforme a todo grupo de unidades del
experimento.
Asegurarse en que los tcnicos ejecuten las medidas con la precisin
necesaria.
Tomar las observaciones en el momento adecuado y preciso (las plantas y
los animales no tienen das festivos)
Asegurarse de que se transcriban correctamente las informaciones
tomadas.

Aleatorizacin
La principal funcin de la aleatorizacin es la de proporcionar estimadores
insesgados para los promedios y la validez de las pruebas de hiptesis. La
aleatorizacin es una de las nuevas caractersticas de los modernos diseos
experimentales. La idea y estructuracin de la misma se debe a Fisher.
Generalmente envuelve procedimientos como el lanzamiento de una moneda, o el
uso de tablas de nmeros aleatorios y se define como el procedimiento mediante
el cual se asignan los tratamientos a las unidades experimentales segn el diseo
empleado.
Hay que tener en cuenta que cada tratamiento debe tener igual oportunidad de ser
asignado a cualquier unidad experimental, sea ella favorable o no. Cochran y Cox
sealan: la aleatorizacin es anloga a un seguro, en el sentido de que es una
precaucin contra eventualidades que pueden o no ocurrir y que pueden ser o no
serias si ocurren.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

La Idea De Significancia Estadstica
Pearse (1976) presenta el siguiente razonamiento al trmino estadstico
significativo y no significativo. Suponga que en un experimento se encontraron
diferencias estadsticas al nivel del 1%. Esto entonces significa que el investigador
tiene que escoger una de dos alternativas completamente incompatibles y tiene
que aceptar que la diferencia se debe al efecto de los tratamientos o que el
resultado es una coincidencia de uno en cien. En efecto, un nivel de significancia
indica que una probabilidad muy baja de que tal coincidencia ocurra, lo cual es
diferente a lo que se espera como resultado de tratamientos.
Para mayor claridad, significativo al 1% no quiere decir que existe una
probabilidad del 99% de que las diferencias corresponden a lo encontrado en el
experimento.
Por otra parte, cabe anotar que la seleccin que haga el investigador depender
de la naturaleza de los tratamientos y de sus conocimientos. As por ejemplo
suponga que a un grupo de plantas se les ha humedecido un tratamiento y que
estas produjeron ms que el grupo control. Si dicho tratamiento hubiese sido una
invocacin y una danza ritual a la diosa luna un investigador podra en algn
momento pensar en la invocacin y danza ritual a la diosa luna como explicacin
al mayor rendimiento.
El investigador dara el redimiendo por la aplicacin de sulfato de amonio y no por
la invocacin claro que es visto que las dos razones tienen su interpretacin. En
general si (p < 0,05) la evidencia en favor de una diferencia verdadera, es
suficientemente fuerte para merecer su publicacin.
1. si (p < 0,01) el efecto se considera bien establecido.
2. si (p < 0,001) la evidencia se considera como real

Leccin 19: Modelo estadstico

TIPOS DE MODELOS ESTADISTICOS
De acuerdo a la seleccin de los tratamientos y otros factores se tiene la siguiente
clasificacin:
Modelo I (Efectos Fijos):


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Se presenta cuando los tratamientos y dems factores que intervienen en un
experimento son fijados por el investigador; es decir, no se efecta una eleccin
aleatoria. En estos casos las conclusiones del anlisis de variancia solamente son
vlidas para los tratamientos y otros factores usados en el experimento. En el
presente trabajo se ha considerado nicamente el caso de modelo de efectos fijos,
por ser el que se presenta con mayor frecuencia en la experimentacin agraria.
Modelo II (Efectos aleatorios):
Se presenta cuando los tratamientos y dems factores que intervienen en un
experimento son elegidos al azar de una poblacin. En estos casos las
conclusiones del anlisis de variancia son vlidos, tanto para los tratamientos y
dems factores usados, asi como para todas las poblaciones de tratamientos y
factores.
Modelo III (Modelo Mixto):
Este modelo es la combinacin de los dos anteriores y se presenta cuando
algunos factores son fijados y otros son elegidos al azar. En estos casos las
conclusiones del anlisis de variancia se- rn vlidas para toda la poblacin de
factores cuando estos son elegidos al azar, y solamente para los factores usados
cuando estos son fijados

SUPUESTOS ACERCA DEL MODELO ESTADISTICO
Los supuestos necesarios del modelo estadstico son:
Aditividad: Los factores o componentes del modelo estadstico son aditivos,
es decir la variable respuesta es la suma de los efectos del modelo
estadstico.
Linealidad: La relacin existente entre los factores o componentes del
modelo estadstico es del tipo lineal.
Normalidad: Los valores resultado del experimento provienen de una
distribucin de probabilidad Normal con media y variancia 2 .
Independencia: Los resultados observados de un experimento son
independientes entre s.
Variancias Homogneas (Homocedasticidad): Las diversas poblaciones
generadas por la aplicacin de dos o ms tratamientos tienen variancias
homogneas (variancia comn).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


Leccin 20: Transformacin de datos

La razn principal de la transformacin de datos es que de llevarse a cabo un
anlisis esta- dstico con resultados que no cumplan con los supuestos acerca del
modelo estadstico, se puede llegar a una conclusin equivocada.
Un cambio de escala puede variar la media y la variancia de la variable as
como su relacin con respecto a otras variables. La forma de la distribucin de una
variable cambia con la escala. Mediante una transformacin adecuada puede
conseguirse que un variable que no se distribuye normalmente pase a tener una
distribucin casi normal. Las poblaciones con variancias desiguales pueden
convertirse en homocedsticas (variancias homogneas) mediante una
transformacin apropiada.
Las transformaciones ms usadas son:
a. Transformacin logartmica
El modelo lineal (por ejemplo Yij = + i + j + eij) indica que el efecto del bloque ,
el efecto del tratamiento y el error experimental, son todos ellos aditivos. Si los
bloques y los tratamientos aumentan o disminuyen las mediciones en un
determinado porcentaje en lugar de una determinada cantidad, entonces se dice
que los efectos son multiplicativos y no aditivos. En estos casos, una
transformacin logartmica transformar en aditiva la relacin multiplicativa y en
consecuencia el modelo lineal podr ser aplicado a los nuevos datos.
Para ciertos tipos de anlisis, el investigador prefiere la escala que
elimina las interacciones mientras que para otras puede preferir la escala que
restituye los efectos lineales. Lo que hay que recordar es que la relacin entre las
variables est muy influenciada por las escalas con las que se miden dichas
variables. Las interpretaciones de los datos slo son vlidas en relacin con la
escala particular adoptada en un caso determinado.
b. Transformacin de la raz cuadrada
Cuando los datos estn dados por nmeros enteros procedentes del conteo de
objetos, como por ejemplo el nmero de manchas en una hoja o el nmero de
bacterias en una placa, los nmeros observados tienden a presentar una
distribucin de Poisson ms que una distribucin normal. Las consideraciones


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

tericas conducen a la transformacin de la raz cuadrada de los nmeros
observados. Normalmente esta transformacin determina que las variancias de los
grupos sean ms iguales. Tambin es aplicable a las distribuciones sesgadas
puesto que acorta la cola larga.
Si y es el nmero observado, para el anlisis estadstico y la prueba de
significacin utiliza- remos y1/2 . Cuando los nmeros observados son pequeos
(de 2 a 10), se prefiere la transformacin (y+0.5)1/2, en especial cuando algunos
de los nmeros observados son cero.


CAPITULO 5: Clases de Diseos experimentales

Leccin 21: Diseo Completamente al azar

Caractersticas generales del diseo completamente al azar
En la actualidad los investigadores de las ciencias agrcolas, pecuarias y
ambientales (en general las que tengan estn relacionadas con variables
biolgicas) estn interesados en detectar diferencias estadsticas, tan pequeas
como sean posibles. Para su obtencin se requiere del uso eficiente de diseo
experimentales y mtodos estadsticos, que reduzcan lo ms efectivamente le
error experimental. En el logro de este propsito, el anlisis de varianza es una de
las principales herramientas del investigador. Esta tcnica se aplican en una
amplia gama de experimentos, los cuales van desde la simple comparacin de un
par de tratamientos, hasta ensayos ms complejos que envuelven varios factores
como por ejemplo: raza, sexo, ambiente, manejo, especie, edad, finca, lote. La
simple extensin de comparar tres o ms tratamientos, constituyen el diseo
experimental al azar.
El diseo completamente al azar es el ms simple de todos los diseos que se
utilizan para comparar dos o ms tratamientos, dado que solo considera dos
fuentes de variabilidad: Los tratamientos y error aleatorio. Por eso es comn
encontrar casos de uso y abuso de esta diseo en situaciones en las que no eran
lo ms adecuado, sobre todo porque haba la presencia de otras fuentes
importantes de variabilidad (Factores de bloque por ejemplo),por lo que al final se


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

tienen comparaciones burdas y no confiables de los tratamientos objeto del
estudio.
Este diseo se llama completamente al azar por que todas las corridas
experimentales se realizan en orden aleatorio completo, ya que al no haber
bloques (generados por otro factor adicional al factor de inters), no existe ninguna
restriccin a la aleatorizacin. Ms especficamente, si durante el estudio se
hacen en total N pruebas estas se corren al azar, de manera que los posibles
efectos ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.
Este tipo de diseo es el ms simple de todos y tambin se le conoce con los
nombres de diseo completamente randonizado o diseo completamente aleatorio
o diseo de una sola va. En l se asignan al azar los tratamientos a un grupo de
unidades experimentales previamente determinadas. Asimismo todas las
variables, excepto las que estn en estudio, se mantienen constantes. Sin
embargo R. A. Fisher seala que claramente que este tipo de diseo es
inadecuado para muchos problemas de investigacin, en virtud de que las leyes
naturales de hecho son controladas e influenciadas por causas (variable)
Este diseo se puede aplicar a ensayos de campo cuando se cuente con
condiciones de suele y ambientes relativamente uniformes. Tambin en til en
experimentos con animales cuando existe cierta uniformidad bien sea gentica,
por peso, edad, etc.
En general este diseo no es el ms adecuado para la experimentacin de campo
con plantas o animales mayores, pero es el ms funcional para la evaluacin de
cierto tipo de tratamientos en laboratorios e invernadero o cuando dichos
tratamientos son aplicados a unidades experimentales homogneas.
El diseo experimental proporciona el mximo nmero de grados de libertad para
la estimacin del error experimental; adems no requiere estimar datos faltantes;
es decir el diseo puede analizarse con igual nmero de repeticiones por
tratamiento (diseo balanceado) o diferentes nmeros de repeticiones por
tratamiento (diseo desbalanceado).

Ventajas
No tiene lmite en el nmero de tratamientos (tres o ms), segn se hayan
planteado los objetivos de la investigacin.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

El nmero de repeticiones puede variar dentro de cada tratamiento, aunque
es preferible que el nmero sea igual.
El anlisis estadstico es sencillo an cuando se hayan perdido una o ms
unidades experimentales.
En condiciones homogneas, se puede aplicar cuando an cuando el
material experimental es escaso.
En cierta media, aunque puede ser una desventaja en confiabilidad, no
requiere la medicin de variables que influyen sobre los resultados y que pueden
ser costosas o difciles de medir por el uso de equipos o materiales
especializados.

Desventajas
La principal desventaja consiste en que a veces resulta ineficiente ya que
toda la variabilidad resulta de unidades experimentales (exceptuando los
tratamientos) y esta pasa a formar parte del error experimental.
El grado de precisin de los resultados se pueden reducir por el efecto de
aleatorizacin de las unidades experimentales, evitando que los tratamientos sean
aplicado a unidades similares u homogneas.
Cuando el investigador no tiene experiencia en la decisin del modelo
(diseo) a aplicar, tiende a tomar como nica alternativa el Diseo completamente
al alzar, sin ser el ms confiable para el tipo de experimentacin propuesta. En
estos casos, se puede desconfiar de los resultados y creer que es el mtodo el
ineficiente, cuando realmente es que se ha tomado la decisin errada en la
seleccin de mtodo base de experimentacin.
Modelo estadstico
Para este tipo de diseo (con igual o diferente nmero de repeticiones) se plantea
estadsticamente el siguiente modelo matemtico:

i =1,2,..,r repeticiones y
j = 1,2, t tratamientos.
Representa la observacin de la repeticin i-sima en el tratamiento j-simo.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Es la media global de las poblaciones combinadas
Es el efecto producido por el tratamiento j-simo
Es el error experimental aleatorio en la observacin
Llmese error a la cantidad en la que cualquier valor difiere de la media de su
grupo y se representa con el smbolo ij. El trmino error no significa
equivocacin. Este trmino se utiliza para referirse a la variacin no controlada
que existe entre los miembros de cualquier poblacin. Dada la poblacin de
plantas de maz para ensilar (72 das), por ejemplo, se sabe que la altura de
algunas plantas est por arriba de la altura media verdadera de la poblacin,
mientras que algunas alturas muestran lo contrario. Esta variacin se debe a
diversos factores hereditarios y ambintales. Si cualquier media de grupo, j se le
agrega un error dado, ij, el resultado ser Yij, la observacin que se desva de la
media del grupo por la cantidad ij.

Hiptesis y regla decisin
El propsito principal del anlisis de varianza es descubrir las posibilidades entre
los tratamientos para lo cual se requiere plantear una hiptesis nula y una alterna.
Hiptesis nula Ho. T = T. (igualdad)
Hiptesis alterna Ha T T (desigualdad)
Como regla de decisin se tendra.
Si Fc > Ft () se rechaza Ho
Si Fc < Ft () se rechaza Ha

Anlisis de varianza.
FV
GL

SC

CM

FC
1-
0,05 0,01
Tratamientos
Entre, factor A
t-1
tr
y
r
y
t
i
i
...
2
2
1

=
1 t
SCttos

CMee
CMttos




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Error
experimental
n-t SCtotal SC
tratamientos
) ( t n
SCee



Total n-
1
n
y
Y
r
i
k
j
ij
...
2
1 1
2

= =


Se cataloga como diseo completamente al azar desbalanceado el que por
algunas circunstancias se han perdido unidades experimntales o que al iniciar la
experimentacin se han tomado tratamientos con diferentes nmeros de
repeticiones. Como se puede ver en el anlisis de varianza presentado
anteriormente, la suma de cuadrados del error experimental est dividida sobre el
nmero de repeticiones; el cual para un diseo balanceado sera uno solo, pero
para un diseo desbalanceado, cada sumatoria se dividira entre el nmero de
repeticiones.
Una vez planteada la investigacin, planteado el problema y definido el mtodo
estadstico a segur para el anlisis de datos; incluido el diseo experimental, en
forma prctica, se plantea una secuencia para desarrollar los clculos del diseo
experimental seleccionado. Estos pasos funcionan para todos los diseos que se
plantearn en este mdulo y es una metodologa que aunque en algn momento
para el experto puede resultar engorrosa, para el aprendizaje es vlida ya que
deja ver la secuencia de clculos y facilita el entendimiento del proceso.
Es preciso recalcar que estos pasos se aplican una vez se hayan tomado los
datos para aplicar los clculos, aceptar o rechazar hiptesis y presentar
resultados. A media que el investigador se vuelve experto en el manejo de datos,
planteamiento y desarrollo de diseos, se pueden obviar pasos de los que se
proponen a continuacin:
1. Arreglo de campo.
2. Planteamiento de Hiptesis.
3. Clculo del anlisis de varianza.
4. Regla de decisin.
5. Comparacin.
6. Conclusin.
7. Otros estadsticos (desviacin estndar y coeficiente de varianza).
8. Cuadro de promedios.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

9. Grficas.
10. Anlisis, conclusiones y recomendaciones.


Leccin 22: Diseo en Bloques Completos al azar

Caractersticas del diseo de bloques aleatorizado.
De todos los diseos experimentales que se utilizan en la actualidad, parece ser
que el Diseo de Bloques Completos Aleatorizados es el que hasta ahora se
utiliza con mayor frecuencia. Este diseo fue desarrollado por el ao de 1925 por
R. A. Fisher, quien estaba buscando mtodos para mejorar los experimentos en el
campo de la agricultura. El nombre del diseo refleja su origen en los
experimentos agrcolas, donde la tierra se divida en bloques y stos en parcelas
que reciban los tratamientos bajo investigacin.
El Diseo en Bloques Completos Aleatorizados (DBCA), tambin conocido como
Diseo de Bloques Completamente Randonizados o diseo de dos vas, es un
diseo en el que las unidades experimentales a las que se les aplican los
tratamientos, se subdividen en grupos homogneos llamados bloques, de modo
que el nmero de unidades experimentales en un bloque es igual nmero de
tratamientos que se estn estudiando. Se asigna entonces al azar los
tratamientos a las unidades experimentales dentro de cada bloque. Debe tenerse
en cuenta que cada tratamiento aparece en todos los bloques y que cada bloque
recibe todos los tratamientos.
El objetivo de utilizar el diseo en bloques completos aleatorizados es aislar y
eliminar del trmino de error la variacin atribuible a los bloques, a la vez que se
asegura que las medias de los tratamientos estn libres de los efectos de bloque.
La efectividad del diseo depende de la habilidad para lograr bloques
homogneos de unidades experimentales. La habilidad para formar bloques
homogneos depende del conocimiento del investigador sobre el material
experimental. Cuando el diseo se utiliza apropiadamente, disminuye el cuadrado
medio del error (CMEE) en la tabla ANAVA, aumenta la Razn de Varianzas (FC)
y mejora la oportunidad de rechazar la hiptesis nula.
En experimentos con animales, si se tiene la sensacin de que las diferentes
razas de animales respondern de manera distinta al mismo tratamiento, la raza


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

del animal puede utilizarse como factor para formar bloques. Las camadas pueden
utilizarse tambin como bloques, caso en el cual un animal de cada camada recibe
un tratamiento. En experimentos en los que intervienen seres humanos, si se
desean eliminar las diferencias que resultan de la edad, pueden agruparse
entonces los individuos de acuerdo con su edad, de modo que una persona de
cada edad reciba cada tratamiento. El diseo en bloques completos aleatorizados
puede utilizarse tambin convenientemente cuando un experimento debe llevarse
a cabo en ms de un laboratorio (bloque), fincas, zonas, o cuando se requieren
varios das (bloques) para concluirlo.
Se pueden resumir las caractersticas en:
Los BLOQUES son conjunto de unidades experimentales seleccionadas
con anterioridad.
La variabilidad es minimizada dentro de los bloques (homogeneidad dentro
de los elementos de cada uno) y maximizado entre bloque y bloque (se busca
heterogeneidad).
Los tratamientos se deben aplicar al mismo tiempo en cada bloque y el
mismo nmero de veces.
Los grados de libertad se reducen para controlar el error.
La variabilidad del bloque se elimina a partir del error experimental. Cuando
encontremos mayor variabilidad entre bloques mayor es la posibilidad de
encontrar diferencia entre los tratamientos.
Una vez conformados los bloques es aconsejable manejar cada uno de
ellos como una unidad experimental para mantener su homogeneidad interna.
El nmero de tratamientos debe ser el menor posible.
En posible trabajar con bloques de igual nmero de elementos para evitar la
variabilidad dentro del bloque.
Es bueno diferenciar entre bloques, repeticiones o rplicas: Repeticiones:
tiene que ver con el nmero de repeticiones de los tratamientos en un
experimento. Bloques: implican la agrupacin de unidades y se debe procurar la
menor variabilidad dentro de cada uno.
El nmero de repeticiones es igual al nmero de bloques
En el anlisis de varianza se consideran tres fuentes de variabilidad, el
factor de tratamientos, el factor de bloques y el error aleatorio.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Ventajas
Algunas de las ventajas del diseo en bloques completos aleatorizados
comprenden el hecho de que es fcil de comprender y sencillo de calcular.
Adems, ciertas complicaciones que pueden surgir en el curso de un experimento
se resuelven fcilmente cuando se utiliza este diseo.
En general es posible agrupar las unidades experimentales de modo que se
logre mayor precisin con el diseo completamente aleatorizado.
No hay restriccin en cuanto al nmero de tratamientos o de bloques.
Si se desea usar repeticiones adicionales para cientos tratamientos, esto se puede
aplicar a dos o ms unidades por bloque con aleatorizacin adecuada para dar un
diseo de bloques completo al azar aleatorizado.
Si faltan datos de unidades individuales pueden estimarse fcilmente de tal
manera que no se pierda la comodidad en los clculos.
Si el error experimental es heterogneo, puede obtenerse componentes no
sesgados aplicables de comparaciones especficas.

Desventajas
La principal desventaja de los bloques completos al azar es que cuando la
variacin entre unidades experimentales dentro de un bloque es grande, resulta un
trmino de error considerable. Esto ocurre frecuentemente cuando el nmero de
tratamientos es grande; as puede no ser posible asegurar grupos de unidades
suficientemente uniformes para los bloques. En tal situacin, se dispone de otros
diseos para controlar una mayor proporcin de la variacin.

Modelo estadstico.
Cuando se decide utilizar un diseo de bloques al azar el experimentador piensa
que cada medicin ser el resultado del efecto del tratamiento donde se
encuentre, del efecto del bloque al que pertenece y de cierto error que se espera
sea aleatorio. Si actuara otro tipo de efecto o factor adicional a estos tres, dicho
efecto se carga en el error, el cual deja de ser aleatorio y como consecuencia
puede enmascarar el efecto del factor de inters al realizar el ANAVA.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

De aqu la importancia de aplicar el principio de bloqueo evitando que otro factor
no contemplado en el experimento afecte los datos del experimento
El modelo es semejante al modelo para Diseo Completamente Aleatorizado
(DCA), la nica diferencia es que se le agregado el efecto de los bloques.
Yij = + i +j +ij
i =1,2,..,n repeticiones
j = 1,2k tratamientos.
Yij = Es un valor tpico de la poblacin total.
= Es la media global de las poblaciones combinadas.
i = Representa el efecto del bloque, que refleja el hecho de que la unidad
experimental cay en el i-simo bloque
j = Representa el efecto del tratamiento, que refleja el hecho de que la unida
experimental recibi el j-simo tratamiento.
ij = Es un componente residual que representa todas las fuentes de variacin
que no sean los tratamientos ni los bloques.

Hiptesis y regla decisin
La afirmacin a probar es que las respuestas de media poblacional lograda con
cada tratamiento es la misma para los k tratamientos y que por tanto cada
respuesta media si es igual a la media global poblacional, De otra forma, se
puede afirmar que todos los efectos de tratamiento sobre la variable de respuesta
son nulos, por que cuando el efecto ti:i-=0, entonces necesariamente la
respuesta media del tratamiento es igual a la media global i=.
Teniendo en cuenta que se analizan los tratamientos, sera:
Como hiptesis alterna, se tendra que por lo menos el promedio obtenido por un
tratamiento es diferente a los dems o de otra forma se podra afirmar que por lo
menos el promedio de un tratamiento e diferente al promedio de toda la poblacin.
Como el diseo implica el anlisis de un factor ms que influye sobre los
resultados de la experimentacin, es necesario plantear hiptesis para este factor.
Por lo tanto las hiptesis para los bloques, siendo similares las de tratamientos
seran:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Como regla de decisin se tendra para tratamientos y para bloques.
Si Fc > Ft () se rechaza Ho
Si Fc < Ft () se rechaza Ha
Anlisis de varianza.

FV

GL

SC

CM

FC
1-
0,05 0,01
Tratamientos,
factor A
t-1
tb
y
b
y
t
i
i
...
2
2
1

=
1 t
SCttos

CMEE
CMttos


Bloques,
factor B
b-1
tb
y
t
y
t
i
j
...
2
2
1

=
1 t
SCbloques

CMEE
CMbloques


Error
Experimental
(t-1)(b-1)
SCTSCttos
SCbloques.
) ( t n
SCEE




Total
n-1
n
y
Y
r
i
k
j
ij
...
2
1 1
2

= =



Leccin 23: Experimentos factoriales

El experimento factorial puede ilustrarse mediante un ejemplo. Considrese
un experimento para evaluar rendimientos de variedades de pastos. En el caso de
un solo factor, todas las variables diferentes a las variables se mantienen tan
uniformes como sea posible, esto es, se escoge un solo nivel de los otros
factores. Supngase que tambin es de inters un segundo factor, distancia
entre surcos. Se puede planear un experimento con dos factores en que los
tratamientos consisten en todas las combinaciones entre las variedades y los
espaciamientos elegidos de los surcos, esto es, cada variedad se encuentra
presente en todos los espaciamientos de surcos. En un experimento de un solo
factor, todas las variedades se sembraran a un solo espaciamiento de un surco,
o una sola variedad en todos los espaciamientos entre surcos. En suelos, puede
disearse un experimento para comparar todas las combinaciones de varios
niveles de fertilizante de fsforo y potasio. En un experimento de nutricin animal,


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

los factores en consideracin pueden ser las cantidades y clases de suplementos
de protenas.

El termino nivel se refiere a los diferentes tratamientos dentro de un factor. Se
deriva de alguno de los primeros experimentos factoriales. Estos trataban de
fertilidad de suelos donde las combinaciones de diferentes cantidades, o niveles,
de los diferentes fertilizantes eran los tratamientos. Hoy esa palabra tiene un
sentido ms general, que implica una cantidad o estado dados de un factor. As,
si se comparan 5 variedades de un cultivo, usando tres diferentes practicas de
manejo, el experimento se llama experimento factorial 5 x 3, con cinco niveles
del factor variedad y tres niveles del factor manejo. El nmero de factores y niveles
que pueden compararse en un solo experimento solo se limita por consideraciones
prcticas.

As, un experimento factorial es aquel en el que el conjunto de tratamientos
consiste en todas las combinaciones posibles de los niveles de varios factores. En
la palabra factorial est implicado el concepto de diseo de tratamientos.

Notacin y definiciones
Los sistemas de notacin que se usan en experimentos factoriales son similares,
pero presentan diferencias suficientes como para que el lector tenga que
comprobar con cuidado cuando utilice nuevas referencias. Se sigue una notacin
parecida en muchos aspectos a la sugerida por Yates (1933). Las tres letras
maysculas se usan para designar factores,

Arreglos Factoriales
A los diseos completamente aleatorios, bloques completos al azar, cuadrados
latinos, cuadrados grecolatinos, e hipergrecolatinos se pueden utilizar para
estudiar el efecto de un solo factor y eliminar el efecto de otros factores externos.
A un experimento, con la caracterstica anterior, se lo denominamos experimento
unifactorial. Cuando nos interesa estudiar el efecto simultaneo de dos o ms
factores, con diferentes niveles, a los cuatro diseos anteriores debemos
agregarle lo que se denomina arreglo factorial o simplemente factorial.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Un investigador interesado en conocer, por ejemplo, el efecto de tres factores que
tienen dos niveles, cada uno, tiene que recurrir a los experimentos
factoriales. Si analizamos varios factores simultneamente obtenemos mayor
informacin que si estudiamos los factores en forma individual. Cuando
utilizamos los arreglos factoriales tenemos la oportunidad de analizar las
interacciones entre los factores.

Ventajas de la experimentacin factorial cuando los factores son independientes.
Las ventajas de la experimentacin factorial dependen naturalmente de la finalidad
del experimento. Supngase por ahora, que el propsito es investigar los efectos
de cada factor, sobre algn intervalo preasignado que est cubierto por los niveles
de ese factor usados en el experimento. En otras palabras: el objeto es obtener un
cuadro amplio de los efectos de los factores, ms bien que encontrar, por ejemplo,
la combinacin de los niveles de los factores que dan una respuesta mxima. Un
procedimiento para esto es conducir experimentos separados, cada uno de los
cuales considere un solo factor. Otro procedimiento es incluir todos los factores
simultneamente por medio de un experimento factorial.
Si todos los factores son independientes en sus efectos, el mtodo factorial
significara un ahorro considerable de tiempo y material dedicado a los
experimentos. El ahorro se deriva de dos hechos: primero como se ha visto,
cuando los factores son independientes todos los efectos simples de un factor son
iguales a su efecto principal, de tal manera que los efectos principales son las
nicas cantidades necesarias para describir completamente las consecuencias de
las variaciones en el factor. Segundo, en un experimento factorial cada efecto
principal se estima con la misma precisin que si todo el experimento se
hubiese dedicado a ese solo factor.

Leccin 24: Otras Clases de diseos experimentales

Existen otras clases de diseos que sirven de apoyo a la labor investigativa, y su
aplicacin est relacionada con situaciones ms especficas de investigacin. La
bibliografa complementaria amplia las aplicaciones de estos diseos, los cuales
se mencionan de manera bosquejada.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Diseo Cuadrado grecolatino:
Podramos definir un cuadrado grecolatino como el producto de dos cuadrados
latinos, este tipo de producto da origen a un tipo de investigacin entre los
especialistas conocido como teora de grupos de Galois. La cual despus de una
amplia sofisticacin, permite extender los factores no homogneos a los que se
deseen. Esta extensin es muy utilizada en experimentos en gentica y se sale de
nuestros objetivos.
El diseo de cuadrado grecolatino, se considera un diseo de agrupamiento
triple, como producto de la superposicin de dos cuadrados latinos, se denota
uno con letras griegas y otro con letras latinas, de tal modo que el par
correspondiente que se obtiene, no se repite, ni por fila ni por columna.
Diseo Bloques Incompletos
Existen ciertos experimentos, en particular aquellos que se utilizan en fitogentica,
que tienen muchas lneas. Por tal motivo, es necesario encontrar las ms
representativas para cierta zona de estudio. En dichos experimentos se presenta
un alto nmero de tratamientos y es imposible trabajarlos mediante un diseo de
bloques completos al azar, porque no se podra controlar la variacin existente
dentro de cada bloque.
Ya se dijo que cuando existe un gran nmero de factores y tratamientos se recurre
al principio de confundido para tratar de confundir varias interacciones, al dividir
cada repeticin en varios bloques incompletos para disminuir la excesiva
heterogeneidad existente en el suelo debido al alto nmero de tratamientos, y as
evitar bloques muy grandes.
Diseo Parcelas Divididas
En la leccin anterior sobre experimentos factoriales, se suponan que el conjunto
de todas las combinaciones de tratamientos se aplicaba a las unidades
experimentales de acuerdo con el proceso de Aleatorizacin apropiado para el
diseo completamente aleatorio, de bloque completos aleatorizados o de
cuadrado latino. Pero son posible s otros procesos de Aleatorizacin. Una de las
aleatorizaciones alternas da lugar al diseo de parcelas divididas, que es una
clase especial de diseo de bloques incompletos. El de parcelas divididas y
algunas de sus aplicaciones es el tema siguiente.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Al aumentar la complejidad de un diseo, disminuyen los grados de libertad del
error. Esto se debe al incremento de las fuentes de variacin de los diseos que
repercuten en los grados de libertad del error.
Al usar el diseo de parcela dividida, los decrementos no suceden para la
subparcela o parcela chica, sino que son iguales a medida que aumentan dichos
diseos experimentales. La razn como se menciono previamente es que la
primer aparte del diseo de parcela dividida es el diseo completamente al azar,
bloques al azar o cuadro latino, y la segunda parte es el arreglo factorial, o sea
que la parcela dividida est formada por un arreglo con su respectiva distribucin.

Leccin 25: Bsqueda de unidades perdidas (Mtodo Yates)

Cuando por efectos ajenos al tratamiento nos encontramos con unidades
experimentales perdidas ser necesario calcular estas antes de iniciar el anlisis
de datos. El mtodo considera que si falta una observacin en la variable
respuesta, entonces se debe:
a) Estimar la informacin completa.
b) Imputar el dato faltante.
La justificacin del procedimiento se basa en dos ventajas:
1. Produce estimaciones correctas va mnimos cuadrados
2. Se logra una estimacin correcta de la suma de cuadrados de los errores.
Existen varias maneras de calcular las observaciones perdidas a travs de
promedios, ya sean entre bloques, tratamientos o con el total; sin embargo, estos
procedimientos incrementan en gran forma el error, lo cual resta eficiencia en el
anlisis de los datos.
El mtodo de YATES, que se definir a continuacin, es el que menos incrementa
el error al calcular los datos faltantes. De acuerdo con este mtodo, cuando falta
una observacin se aplica la formula siguiente:
Cuando falta una observacin.
Donde:
x = la observacin faltante.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

b = nmero de bloques.
B = suma de las observaciones presentes en el bloque donde falta la observacin.
t = nmero de tratamientos.
T = suma de las observaciones presentes en el tratamiento donde falta la
observacin.
G = suma del total de las observaciones presentes en el cuadro de concentracin
donde faltan la observacin.
Una vez calculado el dato, se sustituye en el cuadro de concentracin para
analizar los datos, reduciendo en uno los grados de libertad del error y del total al
efectuar el anlisis de varianza.
Cuando son dos las observaciones que faltan, estas pueden ser del mismo
tratamiento, del mismo bloque o de diferente bloque y diferente tratamiento.
Cuando faltan dos observaciones del mismo tratamiento:
En este caso se debe definir si los dos datos corresponden a un solo tratamiento,
a un solo bloque o a un tratamiento y un bloque diferentes. Los datos faltantes se
catalogan como x1 y x2; para lo cual:

Si los datos faltantes corresponden al mismo tratamiento.
Donde:
T12 = Suma de las observaciones presentes en el tratamiento donde falta x1 y x2.
B1 = Suma de las observaciones presentes en el bloque donde falta x1.
B2 = Suma de las observaciones presentes en el bloque donde falta X2.

Si los datos faltantes corresponden al mismo bloque.
Donde:
B12 = total de las observaciones presentes en el bloque donde faltan x1 y x2.
T1 =total de las observaciones presentes en el tratamiento donde falta x1.
T2 = total de las observaciones presentes en el tratamiento donde falta x2


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Si los datos faltantes corresponden diferente bloque y diferente tratamiento:
Donde:
En muchas situaciones experimentales, la misma unidad experimental recibe dos
o ms tratamientos en periodos diferentes; cuando esto sucede, el diseo
experimental se conoce como crossover, el cual puede estudiarse en Jones &
Kenward (2003).

CAPITULO 6: Anlisis estadstico

Leccin 26: usos de las comparaciones mltiples de medias

Cuando en el diseo se rechaza la hiptesis nula, parecera innecesario plantear
ms preguntas. Sin embargo, considerar solo con el ANAVA el conjunto de
tratamientos en el experimento, hace pensar que sta es una simplificacin
exagerada. Por lo general, el investigador se hara la pregunta dnde estn las
diferencias reales?
Tradicionalmente, la tcnica frecuente del anlisis de los datos, recurre a un
anlisis de varianza con su correspondiente prueba de F. sin embargo, por s
misma la prueba no proporciona diferencia sobre comparaciones especficas entre
los grupos que a menudo son de inters. En la prctica, algunas de las
comparaciones pueden ser planeadas o preespecficadas (antes de observar los
datos), mientras que otras pueden ser no planeadas o seleccionadas luego de
examinar los datos (seleccionadas post-hoc).
Los diseos permiten comparar la diferencia entre tratamientos a nivel de un
conjunto, sin embargo, en ocasiones es conveniente hacer comparaciones
particulares con el fin de determinar la eficiencia precisa de los diferentes
tratamientos aplicados en un experimento, por tanto, se recurre al mtodo de
comparacin mltiple de medias.
Este mtodo se puede efectuar aplicando varias pruebas realizadas por algunos
estadsticos. Se debe buscar la ms adecuada para cada uno de los casos. Las


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

recomendaciones para hacer comparaciones mltiples en pruebas de hiptesis
son las siguientes:
1. Llevar a cabo la prueba F para igualdad de medias (ANAVA).
2. Si el estudio F es significativo al 5%, lleve a cabo las comparaciones
planeadas que quiera, usando la metodologa de los contrastes ortogonales o el
mtodo de Diferencia Mnima Significativa. Si se tiene igual nmero de
repeticiones por tratamiento, puede usarse el mtodo de Duncan.o Tukey.
3. Si el estadstico F para igualdad de medias no es significante, el
experimentador an podr considerar las comparaciones planeadas pero deber
usar el mtodo de t-multivariado o el mtodo de Bonferoni. En este caso no debe
hacerse ningn tipo de seleccin post-hoc o comparaciones sugeridas de los
resultados. En realidad, dado que la prueba F no es significante para igualdad de
medias, la prueba de comparacin mltiple no producir ninguna diferencia
significativa.

Leccin 27: Prueba de Tukey

El procedimiento de Tukey, tambin llamado HDS de Tukey (Diferencia
Verdaderamente Significativa de Tukey) DSH de Tukey (Diferencia significativa
Honesta de Tukey). Este mtodo hace uso de la amplitud estudentizada y es
aplicable a pares de medias; necesita de un solo valor para juzgar la significancia
de todas las diferencias y por tanto es fcil y rpido de usar. Ya que solo se hacen
comparaciones por pares, el valor crtico es menor que el exigido por otros
mtodos.
Para efectuar la prueba se utiliza la tabla de puntos porcentuales superiores de
amplitud estudentizada o de Tukey. Con un nmero de tratamientos y los grados
de libertad del error experimental se obtiene el valor T.
Pasos para aplicar el mtodo Tukey.
1 Para facilitar la comparacin de datos es aconsejable ordenar las medias de
forma decreciente.
2. Determinar el nmero de comparaciones posibles.
2
) 1 (
=
a a
es compracion n


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

3. Calcular el valor terico comn, mediante la aplicacin de la siguiente ecuacin.
r
CMEE
x s
x s T w
=
=

T = valor estndar de la tabla teniendo como gl (ttos y (ndatos ttos), es
decir; en el numerador en nmero de tratamientos y en el denominador, los grados
de libertad del error experimental.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


4. Comparacin de las medias:
Diferencia entre medias.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Si D(diferencia entre medias) >= w la diferencia se debe considerar
significativa
Si D(diferencia entre medias) < w, la diferencia se debe considerar no
significativa.

COMPARACIN DIFERENCIA (D) DECISIN TUKEY
RESULTADO
A vs B X
1
X
2
= d >, < valor W NS
*, **
A vs C X
1
X
3
= d >, < valor W
A vs D X
1
X
4
= d >, < valor W
B vs C X
2
X
3
= d >, < valor W
B vs D X
2
X
4
= d >, < valor W
C vs D X
3
X
4
= d >, < valor W
En la columna de resultados, NS representa la no diferencia significativa; * indica
que existe diferencia significativa al 95% y ** representa diferencia significativa al
99%
5. Representacin de resultados.
a. Cuadro de diferencias de medias.
Promedios X1 X2 X3 X4
X4 0
X3 0
X2 0
X1 0
b. Con lneas.
c. Con letras.
d. con grficas y letras.
6. Comparacin de medias en forma decreciente.
Medias Xn Xn Xn Xn Xn


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

% relativo % % % % %
El ltimo valor o menor, se toma como 100% y luego se saca por regla de tres el
valor en % para los dems.

Ejemplo. Un zootecnista tiene como estudio comparar la ganancia de peso de
terneros destetos hasta el sacrificio suplementando con diferentes fuentes
nitrogenadas que faciliten la formacin de protena bacteriana.
Como se sabe que entre el destete y sacrificio la edad del animal implica
fisiolgicamente cambios en la eficiencia digestiva el zootecnista decide hacer
grupos de animales por edades y poderlos comparar adems de los
tratamientos.
Ganancia de peso (g/dia/animal) de terneros Suplementados con NNP, del
destete al sacrificio
EDAD
MESES TESTIGO UREA AMONIACO GALLINAZA
8....12 605 720 740 740
12....16 630 750 760 780
16.....20 650 790 800 815
20....24 670 800 805 832
24......26 615 750 790 790
Estadsticos para la ganancia de peso (g/da/animal) de terneros Suplementados
con NNP de acuerdo a la edad.
EDAD Cuenta Suma Promedio Varianza
8....12 4 2805 701,25 4206,25
12....16 4 2920 730 4600
16.....20 4 3055 763,75 5856,25
20....24 4 3107 776,75 5262,25
24......26 4 2945 736,25 6889,58333
Estadsticos para la ganancia de peso (g/da/animal) de terneros Suplementados
con NNP de acuerdo a los tratamientos
TRATAMIENTOS Cuenta Suma Promedio Varianza
TESTIGO 5 3170 634 692,5
UREA 5 3810 762 1070
AMONIACO 5 3895 779 780
GALLINAZA 5 3957 791,4 1244,8
Anlisis de varianza para la ganancia de peso (g/da/animal) de terneros
suplementados con NNP


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS




Origen de las
variaciones
Grado
s de
liberta
d
Suma de
cuadrado
s
Promedio de
los
cuadrados F
Probabilida
d
Valor crtico
para F
Edad 4 14069,8 3517,45
39,104502
5 8,598E-07
3,2591600
5
Tratamiento
s 3 79363,6
26454,533
3 294,10265 1,708E-11 3,4902996
Error 12 1079,4 89,95
Total 19 94512,8

Teniendo en cuenta que se encontr significancia para el factor edad (bloques) y
para el factor tratamientos, se deben hacer las comparaciones mltiples de medias
para los dos factores; pero para ejemplarizar el procedimiento, se tomar
nicamente el efecto de los tratamientos.
Comparacin de medias para tratamientos por el mtodo de Tukey.
1. Ordenar los promedios de forma decreciente.
GALLINAZA AMONIACO UREA TESTIGO
791,4 779 762 634

2. Determinar el nmero de comparaciones posibles.
2
) 1 (
=
a a
es compracion n
6
2
) 1 4 ( 4
=

= es compracion n
1. Gallinaza-amoniaco 4.Amonicao-urea 6. Urea-testigo
2. Gallinaza-urea 5.Amoniaco-testigo
3. Gallinaza-testigo
3. Clculo del valor terico.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

r
CMEE
x s
x s T w
=
=

5
89,95
= x s
24 , 4 = x s x s T w = T
0,05
= 3,80
) 24 , 4 )( 80 , 3 ( = w
11 , 16 = w
4. Comparacin de las medias.

5. Representacin de resultados.
a. Cuadro de diferencias de medias.
Promedios Gallinaza Amoniaco Urea Testigo
Gallinaza 0
Amoniaco 12,4 NS 0
Urea 29,7* 17* 0
Testigo 157,4* 145* 128* 0
b. Con lneas.
Gallinaza Amoniaco Urea Testigo
791,4 779 762 634
c. Con letras.
Gallinaza Amoniaco Urea Testigo
COMPARACION DIFERENCIA DECISION W RESULTADO
Gallinaza-amoniaco 12,4 < 16,11 NS
Gallinaza-urea 29,4 > 16,11 *
Gallinaza-testigo 157,4 > 16,11 *
Amoniaco-urea 17 > 16,11 *
Amoniaco-testigo 145 > 16,11 *
Urea-testigo 128 > 16,11 *


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

791,4 779 762 634
a b c d
d. Con grficas y letras.
634 c
762 b
779 a
791,4 a
0
100
200
300
400
500
600
700
800
900
GALLINAZA AMONIACO UREA TESTIGO

6. Comparacin de medias en forma decreciente.
Gallinaza Amonaco Urea Testigo
791,4 779 762 634
124,82% 122,87% 120,19% 100%


Leccin 28: Prueba de rango mltiple de Duncan

La prueba de Amplitudes Mltiples de Duncan es la ms popular por su sencillez
y aunque no es muy rigurosa, utiliza ciertos niveles de proteccin para las
comparaciones entre las medias de los tratamientos que estn ms alejados entre
s, una vez que se han ordenado por la magnitud de sus medias. De esta manera
se busca obviar las diferencias en cuanto a nivel de significacin que pueden
existir al comparar los promedios que estn alejados. Sin embargo, la solucin al
problema es solo parcial y algunos autores prefieren recomendar pruebas ms
rigurosas como la de Tukey o la de Sceffe.
A continuacin se describen los pasos a seguir para efectuar la prueba, utilizando
las tablas de Amplitudes Estudiantizadas Significativas o tablas de Duncan
1. Calcular el error estndar de los promedios.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

r
CME
S
x
=

2. Con los grados de libertad del error se consultan las tablas de Amplitudes
Estudiantizadas Significativas de Duncan A.E.S. escogiendo el nivel de
significancia deseado ( = 0,05 0,01) y se buscan los valores de hilera
correspondiente hasta un "p" (grado de separacin entre los promedios que se
comparan) igual al nmero de tratamientos.
P2: tDuncan, P3: tDuncan, P4: tDuncan, Pn: tDuncan,
Estos valores son multiplicados por el error estndar de los promedios
x
S con el
fin de obtener los valores de amplitudes lmites de significacin de Duncan
A.L.S.; tal como se presenta en la siguiente tabla.
Valores de A,E.S. y A.L.S. para efectuar la prueba de Duncan.
Valores de P. 2 3 4
A.E.S. tDuncan tDuncan tDuncan
A.L.S. = A.E.S x
x
S Duncan Duncan Duncan

3. Se organizan en orden creciente los promedios de los tratamientos, tal como se
indica a continuacin:
4. Se efectan las comparaciones en el siguiente orden: el promedio ms bajo
con los que estn a su derecha, luego el siguiente promedio con los que estn a
su derecha y as sucesivamente. En cada comparacin de promedios se evala si
la diferencia (D) entre el par de promedios supera al A.L.S. correspondiente. Si la
diferencia D > A.L.S., entonces se concluye que los promedios difieren
significativamente. Si D < A.L.S., la diferencia no es significativa.
En cada comparacin el A.L.S. escogido tiene en cuenta la ubicacin de los
promedios en el arreglo ordenado, as:
A.L.S. con P = 2: Cuando los promedios que se comparan son
consecutivos. Por ejemplo A vs B, B vs C, C vs D.
A.L.S. con P = 3. Cuando entre los promedios que se comparan hay un
tratamiento de por medio. Por ejemplo A vs C, B vs D.
A.L.S. con P = 4. Cuando entre los promedios que se comparan existen
dos tratamientos de promedio. Por ejemplo A vs D.
y as sucesivamente.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

A continuacin se indica el detalle de la prueba para el ejemplo
planteado:
COMPARACIN DIFERENCIA (D) DESICIN A.L.S. RESULTADO
A vs B X
1
X
2
= d >, < valor DUNCAN NS
*, **
A vs C X
1
X
3
= d >, < valor DUNCAN
A vs D X
1
X
4
= d >, < valor DUNCAN
B vs C X
2
X
3
= d >, < valor DUNCAN
B vs D X
2
X
4
= d >, < valor DUNCAN
C vs D X
3
X
4
= d >, < valor DUNCAN
Para indicar todas las comparaciones entre los promedios se puede utilizar una
notacin resumida a base de lneas o letras, as:
a. Utilizando lneas. Los promedios ordenados por magnitud se subrayan con
lneas as: Los promedios que no sean significativamente diferentes se subrayan
con una lnea comn; los promedios que difieren no aparecen unidos. Para el
ejemplo anterior, la notacin queda en la siguiente forma:
Tratamientos
A B C D
Promedios prom 1. prom 2. prom 3. prom 4.
_________________________

De acuerdo con la prueba de Duncan el tratamiento D, es diferente a los
tratamientos restantes. Entre los tratamientos A, B, C no se encontr
diferencia significativa.
b. Utilizando letras. En este caso, los promedios que no difieren significativamente
aparecen con una letra en comn. Los promedios que difieren significativamente
no tienen letras en comn. As:
A B C D
x. prom 1. Prom 2. prom 3. prom
4.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

a a A b
El uso de letras para resumir las comparaciones tiene la ventaja de que los
tratamientos pueden presentarse en el orden que interese al investigador, en
cambio para "la notacin con lneas se requiere ordenar los promedios por
magnitud.
C. cuadro de diferencias de medias.
Promedios X1 X2 X3 X4
X4 0
X3 0
X2 0
X1 0
Comparacin de medias en forma decreciente.
Medias Xn Xn Xn Xn Xn
% relativo % % % % %
El ltimo valor o menor, se toma como 100% y luego se saca por
regla de tres el valor en % para los dems.
Para ilustrar ms detalladamente estos sistemas de notacin consideremos el
siguiente ejemplo: Al estudiar comparativamente 7 tratamientos bajo un D.C.A.
con replicaciones se obtuvo los siguientes promedios:
TRATAMIENTOS
A B C D E F G
75,18 63,75 60,18 64,18 92,1 67,68 80,0
Los valores de A.L.S. obtenidos en la prueba de Duncan con = 0.05
fueron:
P 2 3 4 5 6 7
A.L.S. 10.63 11.17 11.49 11.71 11.88 11.99
Utilizando el sistema de lneas con los promedios ordenados por magnitud se
obtiene:
C B D F A G E
60.18 63.75 64.18 67.68 75.18 80.0 92.1
______________________
_________


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

_________

Puede observarse que el tratamiento E supera a los restantes en forma
significativa. El tratamiento G supera a los tratamientos F, D, B, e, pero no al
tratamiento A. A su vez A supera a D, B, y C pero no a F. Finalmente no se
encuentra diferencia significativa entre C, B, D, y F.
Utilizando el sistema de letras, la prueba queda en la siguiente forma:
C B D F A G E
60.18 63.75 64.18 67.68 75.18 80.0 92.1
A a a ab bc c d

Leccin 29: Anlisis de regresin y Correlacin

El anlisis de regresin, trata de establecer la naturaleza de la relacin entre
variables es decir, estudiar la relacin funcional entre las variables y, por tanto,
proporcionar un mecanismo de prediccin, o pronostico. El segundo, anlisis de
correlacin, tiene como objetivo determinar el grado de relacin entre variables.
El anlisis de regresin y correlacin es el estudio de la relacin entre varias
variables. El conocimiento de esta relacin nos permite pronosticar el
comportamiento de un evento cuando sospechamos que est siendo afectado por
otro u otros eventos.
El anlisis de regresin consiste en generar un modelo o ecuacin que nos
permita pronosticar, aproximadamente, el valor de la variable dependiente Y a
travs de valores conocidos de X.

TIPOS DE REGRESIN:

Graficas:






UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS



Regresin lineal: Es un modelo matemtico mediante el cual es posible inferir
datos acerca de una poblacin. Se conoce como regresin lineal ya que usa
parmetros lineales. Sirve para poner en evidencia las relaciones que existen
entre diversas variables.
Caracterstica:
Slo se maneja una variable independiente, por lo que slo cuenta con dos
parmetros.
Determina la relacin de dependencia que tiene una variable respecto a otra.

Ecuacin: y = a + bx
Donde:
y = valor esperado
a = intercepto entre la lnea proyectada en el eje y
b = pendiente de la lnea proyectada
x = cualquier valor sobre el eje x

Grafica:



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


En la regresin lineal interesa cuantificar la intensidad de la relacin entre dos
variables (dependiente e independiente). El parmetro que nos da tal
cuantificacin es el coeficiente de correlacin lineal o coeficiente de de correlacin
de Pearson, cuyo valor oscila entre -1 y 1.




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Como se observa en los diagramas anteriores, el valor de r se aproxima a +1
cuando la correlacin tiende a ser lineal directa mayores valores de (X implican
mayores valores de Y) y se aproxima a -1 cuando la relacin tiende a ser inversa.
Esquema de interpretacin de correlaciones.


Coeficiente de correlacin. Es el grado de asociacin entre las variables. Se
simboliza con la letra griega p (rho), para el parmetro, y "r" para el estimador.
El coeficiente de correlacin varia entre -1 y 1; en smbolos: -1< r S 1. Valores muy
cercanos a -1 y 1 indican un alto grado de asociacin entre las variables, por el
contrario, valores cercanos a cero. Se interpretan como un bajo grado de relacin
entre las variables.
Observamos entonces que hay coeficientes negativos y positivos. Un coeficiente
de correlacin negativo significa que la relacin entre las variables es inversa; esto
quiere decir que al incrementarse la variable x", se produce una disminucin de
"y"; por otra parte, una correlacin positiva, significa una relacin directa: un
incremento de "x" produce un crecimiento en los valores de "y"

Coeficiente de Determinacin (r2). Se calcula elevando al cuadrado el
coeficiente de correlacin,
Por ejemplo si el coeficiente de correlacin calculado es de 0.965, el coeficiente de
determinacin es = 0.965)
2
= 0.9312.
Esto significa que el 93.12% de las variaciones en la variable dependiente son
debidas a cambios en la variable independiente, y el resto 6.88% son cambios
debidos a errores de muestreo, o mediciones mal hechas.
Leccin 30: Anlisis de varianza para la regresin

El anlisis de varianza nos permite conocer las diferencias, si las hay, entre dos o
ms tratamientos y as estaremos en capacidad de seleccionar la mejor
metodologa bajo estudio. Si no hay diferencia entre los tratamientos la tcnica
estatifica nos est indicando que es indiferente utilizar cualquiera de ellos.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Ejemplo: se tienen el Peso promedio X y consumo de alimento Y de 50
gallinas provenientes de 10 razas White leghorn Periodo 350 das

Peso del Consumo de
Cuerpo Alimento


X X = X- 4.0 Y Y = Y- 80


4.6

0.6

87.1

7.1
5.1 1.1 93.1 13.1
4.8 0.8 89.8 9.8
4.4 0.4 91.4 11.4
5.9 1.9 99.5 19.5
4.7 0.7 92.1 12.1
5.1 1.1 95.5 15.5
5.2 1.2 99.3 19.3
4.9 0.9 93.4 13.4
5.1 1.1 94.4 14.4

(X- X)
2
= 1.536 (Y- Y)
2
=135.604
Cada una con 9 gl

Fuente: Steel Y Torrie,
1990)

Vemos que hay una relacin bastante definida entre las dos variables. Como
observamos antes, de los datos de la tabla 6.1 podemos obtener diagrama de
dispersin, recta de mnimos cuadrados, coeficientes de regresin, e
determinacin, y tambin realizar una anlisis de varianza a la regresin.
Para Nuestro caso la recta de regresin, de mejor ajuste o de mnimos
cuadrados para el ejemplo anterior es: Y= 55.26 +7.69 X, que significa que para
aumentar una libra de peso, el consumo de alimento debe ser de 7.69 libras de
alimento.
Las fuentes de variacin que afectan una variable no siempre son controlables
mediante un plan experimental. Cuando el plan no puede efectuar el control, es
posible medir algunas caractersticas de la fuente de variacin. Por ejemplo, la
cantidad de alimento consumido por las gallinas es una variable de importancia
econmica. Sera de esperar que se viera afectada por otras variables
medibles, tales como el peso del cuerpo y el nmero y peso de los huevos


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

puestos. Para los datos de la tabla anterior, el peso del cuerpo fcilmente
explica la mayor variabilidad en el alimento consumido. La importancia
econmica es obvia.
Ahora usamos la tabla anterior para ilustrar el control estadstico de una fuente de
variabilidad mediante el uso de una observacin concomitante. La
desviacin estndar de Y antes de la variacin en X es (Y-Y)2 /(n-1)
=135.604/9 =3.88 lbs. Hemos visto que luego de ajustarla es Sy.x = 2.37 lbs.
La parte de la suma de cuadrados de Y atribuible a la variacin en X la da la
ecuacin siguiente:
Reduccin en SC = SC (regresin = SC (Y/X) = | (X - X) (Y-Y)|
2
=
(11.812)
2

(X-X)
2
1.536
= 90.386

Para nuestro ejemplo, tiene un grado de libertad. Tambin podemos observar que
la proporcin de la suma de cuadrados de Y atribuible a la variacin en Y es
| (X X) (Y- Y)|
2
/ (X X)
2
= 90.386 = 0.67 (o 67 por
ciento)
(Y Y)
2
135.604


La suma de cuadrados de Y reducida o residual se encuentra por diferencia y
tiene n-2 grados de libertad.
SC (residual para Y) = 135.604 90.836 = 44.768 con 8 grados de libertad.
A continuacin se presenta la tabla de anlisis de varianza de los datos de las
gallinas.

Anlisis de varianza para la regresin:

Fuente gl Sc simblica Ejemplo
gl Sc CM F
X
1|(XX)(YY)|
2
/(XX)
2 1 90.836 90.836 16.22**


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Residual n2 por sustraccin 8 44.768 5.60
Total n1 (YY)
2
9 135.604

























UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS


FUENTES BIBLIOGRAFICAS

American Association for the Advancement of Science. La naturaleza de la
ciencia.
http://www.project2061.org/esp/publications/sfaa/online/chap1.htm. Accesado
Junio 2005.
Box, G.E.P., Hunter, W.G.S., y Hunter, J.S. 1993. Estadstica para investigadores:
Introduccin al diseo de experimentos, anlisis de datos y construccin de
modelos. Edit. Reverte, Espaa. 422 p.
Bunge, M. La ciencia, su mtodo, y su filosofa. Ediciones Siglo XX. Buenos Aires.
1972.
Cabria, S. (1994). Filosofa de la estadstica. Servicio de Publicaciones de la
Universidad de Valencia
Chou, Ya-Lun. Anlisis estadstico. Edit. Mc Graw Hill, Mxico. 1992. 808 p.
Clarke, G and Kempson, R. E. 1997. Introduction to the design and analysis of
experiments, Arnod, London.

Cliford, G.J. A history of the impact of research on teaching. In R. M.W. Travers
(Ed), Second handbook of research on teaching. Chicago: Rand Mc nally,1973, pp
1-46.
Cooper H, Hedges LV. The Handbook of Research Synthesis. New York:
Russell Sage Foundation, 1993.
Collins, C. Statistical Experiment Design and interpretation. An introduction
with agricultural examples. Wiley& Sons, New York, 1999
Cochran, W.G. y , y G.M. Cox. Diseos Experimentales, Ed. Trillas, Mxico,1989.
661 p.
Dean, A and S. Voss, D. Design and Analysis of experiments. Springer Editors,
new York, 1999.
De La Loma, J.L. Experimentacin Agrcola, 2 ed. Uteha, Mxico. 1966. 493 p.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Dixon ,J.W. y Massey, F.J. Introduccin al anlisis estadstico. Edit. McGraw
Hill.1965. 489 p.
Domnguez, C. D. Diseo Experimental para Zootecnistas
UNAD, Ediformas.2001.127 p.
Gmez, H. Estadstica Experimental Aplicada a las Ciencias Agrcolas.
Universidad Nacional de Colombia, Medelln, Colombia. 1997. 571 p.
Guenther, W.C. Introduccin a la inferencia estadstica. Edit. McGraw Hill.
1977. 357 p.
Infante, S. G, y Zarate de Lara, G.P. Mtodos Estadsticos: Un Enfoque
Interdisciplinario. Edit. Trillas, Mxico, Mxico. 1984. 643 p.
Kuehl, R. O.2001. Diseo de Experimentos: Principios estadsticos de diseo y
Anlisis de investigacin Thompson Learning, Mxico.
Lastra, O. J. Estadstica al alcance de todos: Un dialogo autodidacta. Orlastra
Bogot D.C. 2004. 486 p.
Little, M. T. y Jackson, F.H. Mtodos Estadsticos Aplicados a la Investigacin en
Agricultura. Ed. Trillas, Mexico.1976. 270 p.
Martnez, B. C. Estadstica. Ecoe, Bogot- 1992. 774 p.
Martnez, G. A. Diseos experimentales: Mtodos y Elementos de teora. Ed.
Trillas, Mxico.1988. 756 p.

Martnez, B. R., y Martnez, B. N. Diseo de experimentos: Anlisis de datos
estndar y no estndar. Editora Guadalupe. Fondo Nacional Universitario.
Universidad Nacional de Colombia. Bogot D.C. 1997. 479 p.
Montgomery, D.C. 2002. Diseo y anlisis de experimentos. Edit. Limusa,
Mxico. 686 p.
Moore, D. S. (1992). Teaching statistics as a respectable subject. In F. Gordon &
S. Gordon (Eds.), Statistics for the twenty-first century (pp. 14-25).
Washington, DC: Mathematical Association of America.
Morris, T.R. Experimental Design and Analysis in Animal Sciences. Cabi
Publishing, Reading, UK.1999. 208 p.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Escuela de Ciencias Agrcolas, Pecuarias y del Medio Ambiente
Contenido didctico del curso BIOMETRIA Y DISEO DE EXPERIMENTOS

Munch, L. y ngeles, E. Mtodos y Tcnicas de Investigacin. Ed. Trillas,
Mexico.1993. 166 p.
Reyes, C. P. Bioestadstica Aplicada: Agronoma, Biologa, Qumica. Edit.
Trillas, Mxico. 1995. 216 p.
Reyes, C. P. Diseo de Experimentos Aplicados. Ed.Trillas, Mxico. 1989. 348
p.
Rodrguez Del ngel, J. Mtodos de Investigacin Pecuaria. Ed. Trillas,
Mxico, 1990. 208 p.
Steel. G. D. R. y Torrie, H. J. Bioestadstica: Principios y Procedimientos. Ed.
McGraw Hill, Mxico. 1990. 622 p.
Susan J.M. Estadstica para Biologa y Ciencias de la Salud. McGraw-Hill
Interamericana.2001. 592 p.
Tamayo, T. M. El Proceso de La Investigacin cientfica. Ed. Limusa, Mxico.
1993. 161p.
Tamayo, T. M. Diccionario de la Investigacin Cientfica, edit. Blanco. Bogot
D.C. 1984.
Towsend, J. C. (1993). Introduction to Experimental Method.. New York: Mc Graw
Hill.
Wayne, W. D. Bioestadstica: Base para el anlisis de las ciencias de la salud.
Edit. Limusa, Mxico. 1990. 667p.

You might also like