You are on page 1of 211

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

UNIVERSIDAD NACIONAL SAN ANTONIO ABAD


DEL CUSCO
ESCUELA DE POST-GRADO

MAESTRIA EN ECOLOGIA

40

Porcentaje

30

20

10

0
Bajo

Intermedio

Alto

Hbito de estudio

ESTADISTICA APLICA A LA ECOLOGIA

Dr. CLETO DE LA TORRE DUEAS


cletounsaac@gmail.com
2016
1

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

1RA EDICION

Hecho el Depsito Legal en la Biblioteca Nacional del Per


REGISTRO N : 2009-09684

Todos los derechos reservados.


Prohibida la reproduccin total o parcial de este libro en forma idntica o
modificada por cualquier medio mecnico o electrnico, incluyendo fotocopia,
grabacin o cualquier sistema de almacenamiento y recuperacin de
informacin no autorizada por el autor.

Impreso en Per, 2009.

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

CAPITULO I
INTRODUCCION A INVESTIGACION CIENTIFICA

1.1 INVESTIGACIN CIENTFICA

La investigacin cientfica, se puede entender como un conjunto de actividades


que realizamos para obtener conocimientos nuevos, sobre problemas nuevos
que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir,
respecto al conjunto de conocimientos ya provisionalmente establecidos y
sistematizados por la humanidad, conocimientos nuevos que, como aportes, se
sumarn a la Ciencia.

Qu es investigar?
Investigar viene del latn investigare.
Es la forma ms adecuada de aproximarse al conocimiento de la verdad
mediante verdades parciales.
Desarrollar actividades con el objetivo de registrar, indagar o descubrir
la verdad.

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

En trminos generales, es agregar algo nuevo a los conocimientos


humanos.
Es un proceso que, mediante la aplicacin del mtodo cientfico, procura
obtener informacin relevante y fidedigna.

De entender, verificar,

corregir o aplicar el conocimiento

1.2 EL PROCESO DE INVESTIGACIN

INTERROGANTES PARA EL PROCESO: DISEO


Qu estudiar?

Seleccin del tema.

Cul es la situacin actual?

Planteamiento del problema

Cules son las preguntas de Formulacin del problema


investigacin

que

deben

propsitos

tiene

ser

respondidas?
Qu

la Objetivos.

investigacin que se plantea?


Cules son los motivos para Justificacin.
hacer el estudio propuesto?
Quines

han

anteriormente

investigado Marco Histrico

sobre

el

tema

planteado?
Qu hay escrito al respecto?

Marco Terico.

Qu se pretender probar?
Cmo

se

va

Hiptesis.

realizar

la

Metodologa.

investigacin?
Cunto tiempo se requiere para el

Programacin

estudio propuesto?
Qu recursos se necesitan?

Presupuesto.

A que fuentes escritas se va a

Bibliografa.

referir el investigador?

INTERROGANTES PARA EL PROCESO: DESARROLLO


4

Mtodos Estadsticos

Qu

tipo

de

informacin

Dr. Cleto De La Torre Dueas

se Identificacin de informacin.

necesita para cumplir los objetivos,


responder la
investigacin

pregunta (s) de
y

verificar

las

hiptesis?
Dnde encuentro la informacin?

Definicin

de

fuentes

de

informacin.
Si utilizo fuentes primarias, a Determinacin de la muestra
cuntas personas

debo requerir

para obtener informacin?


De qu forma puedo obtener la Tcnicas
informacin?

de

recoleccin:

Observacin, encuesta, etc.

Cmo organizar la informacin Tabulacin,


obtenida?

procesamiento

ordenamiento

de

y
la

informacin.
Cmo se utiliza la informacin Elaboracin
procesada y ordenada?

anlisis

de

la

informacin.

Cmo se puede presentar el Presentacin de los resultados de


informe

de

los

resultados

del la investigacin.

anlisis?

1.3 PROBLEMA DE INVESTIGACIN


Es un hecho, fenmeno o situacin que incita a la reflexin o al estudio y es
importante puesto que permite conocer la situacin que se va a
mostrando sus

estudiar

principales rasgos.

CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS.


De manera general se considera que hay un problema cuando lo que
DEBERA SER, difiere de lo que ES.
El DEBERA SER, es el marco referencial, el patrn comparativo, el
ideal, el modelo, el paradigma.
Lo que ES, representa la realidad, es la prctica.
DEBERA SER diferente a ES, entonces existe Problema
5

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

PROBLEMA DE INVESTIGACION.
Para la presentacin del POI, es necesario considerar cuatro momentos: el
diagnstico, el pronstico, el control del pronstico y la formulacin de la
pregunta o preguntas o la redaccin de un texto a manera de pregunta.
El diagnstico es la descripcin de los sntomas o problemas.
El pronstico es la serie consecuencias de los problemas.
El control del pronstico es la serie de acciones para superar las
consecuencias de los problemas.
Formulacin del problema

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Aspectos a integrar en la conceptualizacin y en la definicin de un


problema de investigacin.
Pensar en:

Elementos del enunciado:

Qu se investigar?

Variable/s

Quines participarn

Sujetos a estudiar

Qu estrategia se seguir?

Diseo

Dnde se realizar?

mbito de estudio

Cundo se realizar?

Perodo de Tiempo.

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

1.4 ELEMENTOS DE DEL TITULO DE UN PROBLEMA


Especificidad

Situacin

Unidad de

problemtica

estudio

Espacio

Tiempo

Situacin problemtica
Responde a la pregunta Qu investigar?
Por ejemplo: Rendimiento acadmico, gestin educativa, desempeo
profesional,..
La especificidad
Es el aspecto o los aspectos concretos que se quiere investigar acerca
del hecho o situacin problemtica.
Por ejemplo: causas, consecuencias, caractersticas, importancia,
influencia, tendencia, modalidades, incidencia, prevalencia, implicancias,
estructura, funcin, nivel, relacin, evolucin, etc.
Unidades de estudio.
Son aquella en las se ponen de manifiesto los hechos o situaciones
problemticas y constituyen, desde el punto de vista estadstico, la
poblacin o muestra a la que se refiere la investigacin. Son: Personas,
grupos

sociales,

seres,

acontecimientos,

instituciones,

objetos,

procesos.
Espacio
Esta referido al lugar en el que ocurre el hecho o situacin problemtica.
Puede ser geogrfico o administrativo. Dnde?; Per, Ciudad del
Cusco, Zona Franca, Aceros Arequipa, etc.
Tiempo
Est referido al momento en que ocurre el hecho o situacin
problemtica. Cundo?

1.5 FORMULACION DE OBJETIVOS


Son los propsitos o fines que se pretenden lograr al realizar la
investigacin.
Los objetivos son de dos tipos:

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

El objetivo general (singular). Es un enunciado proposicional integral y


un Logro terminal a alcanzar en la investigacin.
Los objetivos especficos (plural). Los Objetivos Especficos, Son
enunciados desagregados del objetivo general orientados al logro de
propsitos concretos y estn en relacin a lo que aspira alcanzar con el
estudio.
Los objetivos deben ser verificables
Al definir los objetivos, debemos pensar inmediatamente en la manera
de verificar si stos se han cumplido o no (pensar en mtodos o
herramientas para ello)
Lo anterior nos permitir ir dibujando el perfil metodolgico de nuestra
investigacin
Los objetivos se convierten as en la carta de navegacin de la
investigacin a realizar
Los objetivos deben ser precisos y no muy ambiciosos: deben ser
acordes con los recursos disponibles (tiempo) y ello delimitar el nivel de
detalle esperable.

Estar expresados en verbos en infinitivo (determinar, analizar,


identificar, evaluar, diagnosticar,

conocer,

explicar,

refutar,

comprobar, etc.)

Elementos a tomar en cuenta para redactar un objetivo


Sujeto

Elemento de estudio.

Contenido

Expresa el cambio requerido

Accin

Conjunto de actividades que se desarrollan.

Ejemplo 1: Reforzar la capacidad de gestin en los centros de educacin inicial


del pas para la atencin de los dominios del aprendizaje de los nios de 4 y 5
aos de edad.
Accin

: Reforzar la capacidad de gestin en los centros de

educacin inicial del pas.


Contenido: La atencin de los dominios del aprendizaje.
Sujeto

: Nios de 4 a 5 aos de edad


9

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

1.6 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIN


Criterios de justificacin.
Originalidad
Relevancia
Inters
Factibilidad
Criterios para delimitar
Espacial - Geogrfica
Cronolgica
VIABILIDAD
Es necesario plantearse las siguientes preguntas:
Se dispone de Recursos?
Es factible realizar en el tiempo previsto?
Es factible lograr la participacin de los sujetos u objetos necesarios?
Es factible conducir el estudio con la metodologa necesaria?
La metodologa a seguir, conduce a dar respuesta al problema?
Se conoce y se domina la metodologa seleccionada?
Hay problemas ticos morales en el desarrollo?
1.7 MARCO TEORICO
En el marco terico se integra con las teoras, enfoque tericos, estudios y
antecedentes en general que se refieran al problema de investigacin.
Para elaborar el marco terico es necesario detectar, obtener y consultar la
literatura y otros documentos pertinentes para el problema de investigacin,
as como extraer y recopilar de ellos la informacin de inters.
La revisin de la literatura puede iniciarse manualmente o
acudiendo a un banco de datos al que se tenga acceso por
computadora.
La

construccin

del

marco

terico

depende

de

lo

que

encontremos en la revisin de la literatura:


Marco Terico: Fundamentacin terica dentro de la cual se
enmarca la investigacin
Marco Conceptual: Definicin de conceptos relevantes utilizados en
el estudio
10

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Marco Normativo: Normas, leyes referentes al estudio


Qu funciones cumple el marco terico?
Sirve de gua al Investigador
Provee un marco para la interpretacin de resultados
Prevenir errores.
Orientar el estudio,
Ampliar el horizonte del estudio y guiar al investigador,
Delimitar el rea de investigacin,
Establecer los antecedentes del problema,
Fundamentar el contenido del problema,
Facilitar la formulacin de las hiptesis,
Implicar nuevas lneas y reas de investigacin,
Proveer un marco de referencia para interpretar los resultados de
estudio.

1.8 HIPOTESIS DE INVESTIGACION


Afirmaciones o suposiciones que hace el investigador respecto al
problema de investigacin.
Es una suposicin que permite establecer relaciones entre hechos. El
valor de una hiptesis reside en su capacidad de establecer esas
relaciones entre los hechos y de esa manera, explicarnos por qu se
produce el fenmeno de estudio.

Qu Funciones cumple?
Direccionar el problema objeto de investigacin
Identificar variables objeto de anlisis
Orientar el uso de mtodos y tcnicas de obtencin de informacin

Elementos estructurales de la hiptesis


1. Las unidades de anlisis, que puedan ser los individuos, grupos,
viviendas, instituciones, etc.

11

Mtodos Estadsticos

2.

Variables,

las

caractersticas

Dr. Cleto De La Torre Duea

propiedades

cualitativas

cuantitativas que presentan las unidades de anlisis.


3. Los elementos lgicos, son los que relacionan las unidades de
anlisis con las variables y estas entre s.
Requisitos para estructurar las hiptesis
Las hiptesis deben referirse slo a un mbito determinado de la
realidad social. Las hiptesis en las ciencias sociales slo pueden
someterse a prueba en un universo y contexto bien definidos.
Los conceptos de las hiptesis deben ser claros y precisos. En las
hiptesis, los conceptos son las variables y las unidades de
anlisis.
Los conceptos de las hiptesis deben contar con realidades o
referencias empricas observables (verificables).
El planteamiento de las hiptesis deben prever las tcnicas para
probarlas. Se deben formular hiptesis que estn relacionadas
con tcnicas disponibles para su verificacin.
REQUISITOS PARA FORMULAR LA HIPTESIS

Debe referirse a hechos reales.


Debe ser formulada en trminos de

relacin o causalidad.

Las variables y su relacin, tienen que ser comprensibles,


precisos y concretos.
Tener fundamentacin terica.
Deben ser de poder predictivo y explicativo.
CARACTERSTICAS DE UN PROBLEMA DE INVESTIGACION
Ser especficas (E):
Debe indicar un asunto concreto por investigar.
Ser lgica (L):
-

La relacin de las variables debe ser racionalmente pertinentes

Debe tener poder explicativo, debe ser respuesta a su problema.

Debe ser compatible con los conocimientos actuales (Teora)

Ser Contrastable (C) :


12

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Es decir, ser comprobable


-

Necesita tener referencia emprica, capacidad de ser probada y

verificada en los hechos.


-

Debe ser operacional.

Fundamentarse en un cuerpo terico.

Estar de acuerdo con las tcnicas y recursos disponibles para probarlas.

ELEMENTOS ESTRUCTURALES DE LA HIPTESIS


Las unidades de anlisis:, que pueden ser individuos, familias, grupos,
instituciones y otros.
Las Variables: Independiente y

dependiente.

Los elementos lgicos, que

relacionan

con

las

variables y

las unidades de anlisis

a estas entre s.

1.9 ALCANCE DE INVESTIGACIN.

ALCANCE DESCRIPTIVA
Orientada al descubrimiento de las propiedades particulares del hecho o
situacin problemtica y tambin a la determinacin de la frecuencia con que
ocurre el hecho o situacin problemtica.
Responde a las preguntas Cmo son? Cuntos son? Dnde estn? Se
refiere a las caractersticas cualidades internas y externas, propiedades y
rasgos de la poblacin de estudio

Pregunta

Cul es grado de .....? Qu nivel?

Ejemplo 2:
Nivel de conocimiento de las estrategias cognitivas por los profesores, de la
poblacin de la ciudad de Cusco, 2011.

13

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

INVESTIGACIN CORRELACIONAL
Orientada a descubrir la relacin o correspondencia entre los valores de
dos hechos o situaciones problemticas.
Orientada al descubrimiento de las causas o consecuencias o
condicionantes de la situacin problemtica
Est dirigida a responder a las causas de los eventos fsicos o sociales y
su inters se centra en explicar por qu y en qu condiciones ocurre un
fenmeno, o por qu dos o ms variables se relacionan.
Por qu? La finalidad es determinar por qu un hecho o fenmeno de
la realidad tiene tales y cuales caractersticas.
Problema Pregunta

En que medida .....? Qu relacin existe..?

Ejemplo 3:
Principales causas de la desercin escolar en la regin andina del Per, 2010.

Ejemplo 6:
Correlacin entre hbitos de estudio y aprendizaje en los estudiantes de la
Universidad de Nacional San Antonio Abad del Cusco, 2011.
ALCANCE EXPLICATIVO
Orientada a descubrir la validez de un hecho para la modificacin de una
situacin problemtica.
Qu cambios y modificaciones se han producido? Qu mejoras se
han logrado?.
Pregunta

Es ms eficaz ...que....?

Ejemplo 7:
Evaluacin del efecto del uso de tres tipos de materiales didcticos en el
rendimiento acadmico, en las I.E de la ciudad de Cusco, 2011.

1.10 TIPOS DE INVESTIGACION


Los Tipos de investigacin se determinan mediante la aplicacin de distintos
criterios, a continuacin se refieren algunos de ellos.

14

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento


cientfico existente acerca de la realidad.
INVESTIGACION APLICADA.

Se investiga

para transformar, modificar o

producir cambios en un determinado sector de la realidad.

INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su


propsito es dar respuesta objetiva a interrogantes que se plantea en un
determinado fragmento

de la realidad y del conocimiento con el objeto de

contribuir en la estructuracin de las teoras cientficas.

INVESTIGACION

TECNOLOGICA.

Se

relaciona

esencial,

objetiva

metodolgicamente con el nivel experimental, se busca cambios mediante la


aplicacin de nuevos sistemas.

1.11 DISEOS DE INVESTIGACION.


Conjunto de estrategias procedimentales y metodolgicas definidas
y elaboradas para el desarrollo del proceso de investigacin.
El diseo de investigacin puede ser pensado como la estructura
de la Investigacin.
El investigador debe seleccionar un diseo de investigacin. Esto
se refiere a la manera prctica y precisa que el investigador adopta
para cumplir con los objetivos de su estudio, ya que el diseo de
investigacin indica los pasos a seguir para alcanzar dichos
objetivos. Es necesario por tanto que previo a la seleccin del
diseo de investigacin se tengan claros los objetivos de la
investigacin.
Las maneras de cmo conseguir respuesta a las interrogantes o
hiptesis

planteadas dependen de la investigacin. Por esto,

existen diferentes tipos de diseos de investigacin, de los cuales


debe elegirse uno o varios para llevar a cabo una investigacin
particular (Hernndez, Fernndez y Baptista, 2000; Castillo, 2005).
La precisin, la profundidad as como tambin el xito de los
resultados de la investigacin dependen de la eleccin adecuada
15

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

del diseo de investigacin. He aqu un esquema donde se


resumen los diferentes tipos de investigacin segn Hernndez,
Fernndez y Baptista (2000).

Diseos experimentales
Son aquellos en los que se cumple que:
Los grupos a ser investigados han sido asignados al azar, por
procedimientos aleatorios y los grupos resultantes son equivalentes, de
tal manera que se tiene un grupo control equivalente a los grupos
experimentales.
Diseos cuasi-experimentales.
Entendemos por diseos cuasi-experimentales cuando se cumplen las
siguientes condiciones:
Los grupos sobre los que se lleva a cabo la investigacin no han
podido establecerse como equivalentes en las caractersticas
fundamentales. Los grupos no han sido asignados al azar, sino
que han sido establecidos por algn otro procedimiento de
muestreo.
16

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Como dice Hernndez et al.En los diseos cuasi-experimentales


los sujetos no son asignados al azar a los grupos no
emparejados; sino que dichos grupos ya estaban formados antes
del experimento, son grupos intacto (la razn por la que surgen y
la manera como se formaron fueron independientes o aparte del
experimento.
Tambin algunos autores denominan CUASI-EXPERIMENTAL,
cuando el investigador aplica un tratamiento a un solo grupo de
sujetos, sin grupo de control, observndolo antes y despus de
aplicar el tratamiento.
Diseos no-experimentales.
Se establece que un diseo no-experimental es: la que se realiza sin
manipular deliberadamente variables. Es decir, se trata de investigacin donde
no hacemos variar intencionadamente las variables independientes. Lo que
hacemos en la investigacin no experimental es observar fenmenos tal y
como se dan en su contexto natural, para despus analizarlos. (Hernndez,
184)
La diferencia con los diseos experimentales y cuasi- experimentales se ve con
claridad, porque en estos dos siempre hay algn tipo de intervencin del
investigador, que manipula las variables independientes para averiguar su
influencia en las variables dependientes.

Mtodo transversal: Es el diseo de investigacin que recolecta datos de un


solo momento y en un tiempo nico. El propsito de este mtodo es describir
variables y analizar su incidencia e interrelacin en un momento dado.

Diseos transversales descriptivos: son aquellos que tienen como objetivo


indagar la incidencia y los valores en que se manifiesta una o ms variables.

Diseos transversales correlacionales: Se encargan de describir relaciones


entre dos o ms variables en un momento determinado.

Diseos transversales

explicativos: Son aquellos en los cuales las

17

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados)


y el

investigador los observa y explica.

Diseos longitudinales: Son aquellos que analizan cambios a travs del


tiempo (en variables o sus relaciones), dentro de alguna poblacin en general.

1.12 VARIABLES
A las caractersticas objeto de estudio en la poblacin se les llama variables, ya
que pueden variar de un individuo a otro y se representara por letras
maysculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que
hay, lo cual nos va a permitir utilizar las herramientas estadsticas apropiadas.

TIPOS DE VARIABLES.
Las variables estadsticas pueden ser de dos tipos:
Variables cualitativas o atributos: describen cualidades y no toman
valores numricos, estas a su vez pueden ser:
Nominales.- Las cualidades no presentan ningn orden. Ejemplo Sexo
del estudiante (Femenino, Masculino), Procedencia, I.E.
Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de
estudios

(Analfabeto,

primaria,

secundaria,

superior),

Nivel

de

conocimiento de Docentes.

Variables cuantitativas: toman valores numricos. A su vez pueden ser:


Discretas.- Solo toman un nmero finito o infinito numerable de valores
distintos (generalmente nmeros naturales o enteros). Ejemplos:
nmero de estudiantes por secciones, nmero de profesores, nmero
de aulas, etc.
Continuas.-

Toman

valores

en

un

intervalo.

Generalmente

corresponden a medir magnitudes continuas. Ejemplo, Rendimiento


acadmico, altura, ingreso del docente, etc.

Una caracterstica esencial de este tipo de variables es que sus valores nunca
son observables con exactitud, sino que dependen (las observaciones) de la
precisin del instrumento de medida.
18

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Ejemplo 7

Un especialista estudia, el nivel de introversin en nios menores de 4 aos en


las instituciones educativas de la ciudad de Cusco.

Defina los conceptos

previos para este estudio.


Solucin:
Poblacin: Nios menores de 4 aos de las I.E de la ciudad de Cusco.
Muestra: Nios de 3 aos de las I.E de la ciudad de Cusco.
Variable: Nivel de Introversin.
Tipo de variable: Cuantitativa
Unidad de estudio: Nio menor de 4 aos.

1.13 ESCALAS DE MEDICION


Se llama medicin
Tenemos las

al proceso de atribuir nmeros a las caractersticas.

siguientes escalas de medicin: nominales, ordinales,

cuantitativas de intervalo y cuantitativas de razn.

Escala nominal. La clave de estas escalas de medida es que slo


informan de la igualdad o desigualdad de los individuos en una
caracterstica, pero no de posibles ordenaciones, puesto que la
caracterstica a la que se refieren no se tiene en mayor o menor medida,
sino que simplemente adopta formas cualitativamente distintas.

Los

nmeros solo sirven para distinguir valores o categoras diferentes de la


variable.
Esta escala se emplea para variables cualitativas nominales.

Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un


proceso de codificacin pero no significa que la mujer sea mayor que el
hombre, ni el doble, ni que existe sexo intermedio.

Escala Ordinal. Los nmeros adems de servir para distinguir reflejan un


orden existente sobre los valores de la variable.

19

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Se obtiene clasificando objetos o arreglndolos en un orden con respecto


a alguna variable comn. La pregunta es simplemente, si el objeto tiene
ms o menos de esta variable que algn otro objeto.
Esta escala se emplea para variables cualitativas ordinales.

Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de


los docentes. Excelente=5, bueno =4, regular =3 y malo = 2. es cierto la
relacin de orden 2<3<4<5.

Escala de Intervalo: La ubicacin del punto origen no es fija, puesto que


0 no denota la ausencia del atributo. Aqu los nmeros para clasificar los
objetos representan tambin incrementos iguales del atributo que se esta
midiendo. Esto significa que los nmeros pueden ser comparados. La
diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de
la diferencia entre 2 y 4.
Las temperaturas Fahrenheit y Centgrados son medidas que tiene
diferentes escalas de intervalo y diferentes puntos de 0.
Escala de Razn: Medida numricas en las cuales cero es un valor fijo
en cualquier escala y la diferencia entre valores es diferente
Adems de la distancia de orden e intervalo, se aade un origen absoluto
de forma que no solo cabe hallar distancias (ya en la escala de intervalo),
si no tambin mltiplos exactos. En este caso, el valor representado por 4
tiene doble cantidad medida que l representado por un 2.
Ejemplo 10: Edad del profesor expresada en aos.
40 aos y 20 aos son edades distintas y 40 aos es superior a 20
aos
Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30.
El 0 tiene sentido. Una persona con 0 aos, realmente no tiene edad
todava no ha nacido.
En el siguiente cuadro se muestra un resumen de las caractersticas de
las escalas de medicin.

Resumen de escalas de medicin


20

Mtodos Estadsticos

Tipo

Dr. Cleto De La Torre Dueas

Informacin

Transform.

Significa Significa

Significa

deducible

admisibles

orden

Origen

Relaciones
Nominal igual que o
distinto que

No

Ordinal

mayor que
o igual que

No

No

Ejemplos
Procedencia

Aplicaciones

del Profesor,

inyectivas

tipo de
metodologia
Si

Relaciones

distancia

No

No

Grado de
planificacin,

Funciones

Nivel de

crecientes

utilizacin de
materiales
educativos.

Igualdad o
Intervalo

Si

Si

No

desigualdad

A + b.x

Temperatura,

de

(b 0)

inteligencia

diferencias
Igualdad o
Razn

desigualdad
de razones

Si

Si

Si

Rendimiento

B .x

acadmico,

(b 0)

Nmero de
estudiantes.

ESCALAS PARA LA MEDICION DE ACTITUDES


La escala de clasificacin por categoras es la que usan ampliamente los
investigadores de ciencias de la salud y sociales.
Escala de clasificacin por categoras:
Existen cuatro categoras a partir de las cuales los entrevistados pueden
elegir para sealar su nivel general de satisfaccin.
- Muy satisfecho (+2)
- Satisfecho (+1 )
- Algo satisfecho (0)
- No del todo satisfecho (-1)
Escala De Comparacin:
Es una versin de la escala de categoras, califica a estas categoras
como: excelente, muy bueno, bueno, regular

y deficiente,

eliminando de esta forma la comparacin implcita. El problema con tal


21

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

escala es que el punto de referencia es poco claro y diferentes


entrevistados pueden usar diferentes puntos de referencia o estndares.
Escala de Likert:
La escala de Likert requiere que un entrevistado indique un grado de
acuerdo o desacuerdo con respecto a una variedad de afirmaciones
(reactivos) relacionadas con el objeto de las actitudes.

Es un tipo de instrumento de medicin o de recoleccin de datos que


disponemos en la investigacin social.

Es una escala para medir las actitudes.

Consiste en un conjunto de tems bajo la forma de afirmaciones o juicios


ante los cuales se solicita la reaccin (favorable o desfavorable, positiva
o negativa) de los individuos.
Alternativas o puntos en la escala de Likert

Asignacin Asignacin
Numrica

Numrica

II

Alternativa

Alternativa

Alternativa

Alternativa

Muy de

Totalmente

Definitivamen Completame

acuerdo

de acuerdo

te s

nte
verdadero

De acuerdo

De acuerdo

Probablemen

Verdadero

te s
0

Ni de

Neutral o

acuerdo, ni

indiferente

Indeciso

Ni falso, ni
verdadero

en
desacuerdo
-1

-2

En

En

Probablemen

desacuerdo

desacuerdo

te no

Muy en

Totalmente

Definitivamen Completame

desacuerdo

en

te no

desacuerdo

22

Falso

nte falso

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Para obtener las puntuaciones de la escala de Likert, se suman los valores


obtenidos respecto de cada items. El puntaje mnimo resulta de la
multiplicacin del nmero de tems por 1. Una puntuacin alta est dada por el
nmero de tems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------PA
Donde: PM: Puntaje mnimo y PA: Puntaje Mximo.

Ejemplo 11: Ha encontrado en la institucin educativa el apoyo y las


facilidades necesarias para que usted desarrolle de modo ptimo su trabajo.
( ) Definitivamente s
( ) Probablemente s
( ) Indeciso
( ) Probablemente no
( ) Definitivamente no

Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso


humano.
Categoras de Respuesta

Frecuencia

Porcentaje

Asignacin de
puntajes

Totalmente de acuerdo

(5)

4.4%

2(5)

De acuerdo

(4)

9%

4(4)

Indeciso

(3)

15.6%

7(3)

En desacuerdo

(2)

20%

9(2)

23

51%

23(1)

n=45

100%

Total=88

Totalmente en desacuerdo (1)

Para interpretar el puntaje se ubica en los tramos de la escala de likert.

23

Mtodos Estadsticos

Totalmente
En

En

desacuerdo desacuerdo

(1)

(2)

45*1=45

45*2=90

Dr. Cleto De La Torre Duea

Indeciso
(3)

De acuerdo
(4)

45*3=135 45*4=180

Totalmente de
Acuerdo (5)

45*5=225

La puntuacin 88 se aproxima a 90, por lo tanto se ubica en la parte que indica


en desacuerdo.

1.14 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION


CIENTIFICA.
Toda caracterstica de estudio se conoce como variable.
Variable independiente
Es aquella que juega un rol determinante, causal o de influencia en
otra u otras variables, supone cierta autonoma con relacin a las
dems variables, pero es necesario, sealar que las variables
independientes en determinados problemas, pueden cambiar, segn
sea la posicin que ocupen en el enunciado, debido a que la realidad
est en movimiento y que todos los hechos estn concatenados.
Este tipo de variable se encuentra en las siguientes investigaciones:
1. Explicativa,
2. Relacional
3. Experimental ( en la experimental se le conoce como estmulo)
4. Correlacional

Variable dependiente
Es aquella que juega un rol de consecuencia, al ser determinada,
originada o influida por la variable independiente. Esto significa que
no pueden existir variables dependientes sin las independientes.
Considerando el tiempo, las independientes son ms antiguas que
las dependientes. Se encuentran en las siguientes investigaciones:
1. Explicativa
24

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

2. Relacional
3. Correlacinal
4. Experimental (La variable dependiente en una investigacin
experimental se le conoce como respuesta)
Ejemplo 13:
En el problema influencia del uso de mapas mentales en el rendimiento
acadmico de los estudiantes de las I.E de la regin de Cusco, 2011.
Variable independiente: Rendimiento Acadmico
Variable dependiente: Uso de mapas mentales

Variable Intermedia
Es aquella que juega un rol de factor condicionante, pues su
presencia entre la variable independiente y variable dependiente
hace que sin tener el carcter de factor causal o determinante,
modifique le resultado ms complejas y de mayor profundidad.

Ejemplo 14:
En el estudio de formacin acadmica y rol de la experiencia en el
desempeo profesional, Quillabamba. 2011.
Variable independiente: formacin acadmica.
Variable Dependiente: Desempeo profesional
Variable Intermedia : Experiencia

Variable interviniente
Es aquella que en ciertas medida juega un rol pasivo en el problema,
pues permite medir las caractersticas, atributos, estructuras,
incidencia, elementos o aspectos que se son inherentes.
La variable interviniente, la encontramos en investigaciones:
1. Descriptiva
2. Comparativa.

25

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Ejemplo 15:
En el problema: Niveles de desnutricin de los estudiantes de las
instituciones educativas de la ciudad de Sicuani, 2011.
Variable interviniente : Nivel de desnutricin.
Variables Asociadas
Son aquellas que no guardan mayor nivel de dependencia, no hay
relacin causal entre ellas y considerando el criterio tiempo vienen a
ser ms o menos contemporneas, pues para que aparezca el
problema surgen de manera simultnea.
Este tipo de variables, se encuentra en la investigacin descriptiva
multivariable, se trata de dos o ms variables intervinientes, por lo
que nunca van acompaadas de algn otro tipo de variables.

Ejemplo 16:
En el problema: Rasgos sociales y culturales de los profesores de la
ciudad de Cusco , 2011.
Las variables asociadas son rasgos sociales y rasgos

culturales

Variables Interdependientes
Son aquellas que indistintamente pueden ser consideradas como
causa o como consecuencia una de otra. Corresponden a la
investigacin correlacional.

Ejemplo 17:
En el problema: Correlacin entre tipo de alimentacin y obesidad
de los estudiantes de la ciudad de Cusco, 2010.
Las variables interdependientes, son tipo de alimentacin y obesidad

26

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Resumen del tipo de variables segn tipo de investigacin.

Descriptiva

Interviniente

Asociada

Comparativa

Relacional

Interviniente

Explicativa

Independiente(s)

Dependiente(s)

Correlacional

Experimental

Independiente

Interdependiente

Estimulo (Factor)

Dependiente

Interdependiente

Respuesta

Observaciones:
1.

Las variables segn su naturaleza se clasifican en


cuantitativas y cualitativas.

2.

Las variables segn su relacin casual se clasifican en:


independiente, dependiente, interviniente.

En el rea de las ciencias de la salud, se tiene los siguientes tipos de


investigacin biomdica.
1.15 RECOPILACIN DE DATOS.
Dentro de un proceso de investigacin una de las actividades que se realizan
es la recopilacin de datos, la cual es el acopio de informacin y se incluye
desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios con el
empleo de tcnicas de muestreo.
Para Hernndez et.al. (2006) un instrumento de medicin es un recurso que
utiliza el investigador para registrar informacin o datos sobre las variables que
tiene en mente.
La construccin de instrumento consiste en generar un nmero suficiente de
tems para medir todas las variables con todas sus dimensiones.

La recopilacin de datos, se puede realizar mediante:


Investigacin documental
Investigacin de campo

27

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

La investigacin documental. Consiste en el estudio de documentos


escritos sobre un objeto determinado, es decir son todos aquellos
documentos registrados en diferentes dispositivos fsicos a los que
podemos tener acceso en forma directa o indirecta para su consulta y se
puede clasificar en:
1.- Documental bibliogrfica

4.- Documental audiogrfica

2.- Documental hemerogrfica

5.- Documental videogrfica

3.- Documental escrita

6.- Documental iconogrfica

La investigacin de campo. Consiste en obtener informacin directa


mediante diferentes actividades por contacto directo con el hecho que se
quiere investigar as como las personas relacionadas y se puede
realizar:
a) Por observacin directa
b) Por interrogacin

La observacin. Es el procedimiento emprico bsico, el cual consiste


en realizar la percepcin intencionada de una actividad determinada
mediante la experimentacin la cual consiste en la obtencin de datos
cuantitativos por medio de la medicin del fenmeno que se este
observando.

Para

realizar

la

observacin

se

utilizan

diversos

instrumentos auxiliares los cuales son:


1.- La ficha de campo

3.- La entrevista

2.- Estudio de Actividades 4.- La encuesta

La Entrevista. Es una de las tcnicas ms comunes y es considerada


como la relacin directa entre el investigador y el objeto de estudio a
travs de individuos o grupos con el fin de obtener testimonios reales.
a) Entrevistas formales
b) Entrevistas informales

La Encuesta. Consiste en recopilar informacin sobre una parte de la


poblacin.
28

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

La informacin recopilada puede emplearse para un anlisis cuantitativo


con el fin de identificar las magnitudes del problema.

El Cuestionario. Es un eficaz auxiliar en la observacin cientfica que


contiene aspectos del fenmeno esenciales, las cuales son preguntas
formuladas por escrito y no es necesaria la presencia del investigador.
- Cuestionarios por correo
- Cuestionario administrado por el entrevistado
- Cuestionario administrado por el entrevistador

La Cedula. Tiene carcter de annimo, donde el encuestador es quien


llena la cedula de entrevista, adems de que es posible aclara la
informacin sobre las preguntas y es utilizada cuando una persona tiene
un bajo nivel cultural.

1.16 VALIDACIN DEL INSTRUMENTO

La validacin de los instrumentos se realiza con el fin de conseguir una mayor


objetividad al seleccionar los tems en los respectivos cuestionarios.

VALIDEZ DE CONTENIDO
El proceso de validacin de contenido es eminentemente lgico, si bien pueden
utilizarse jueces expertos en el tema para valorar la congruencia entre los
diversos items y los diversos objetivos.
Existen procedimientos cuantitativos diversos para que cada experto valore el
grado en que un tem sirve para evaluar el objetivo al que corresponde. El
procedimiento cuantitativo ms sencillo sera el siguiente:
Especificar los diversos objetivos (v.gr. reas diferentes de contenidos)
que se Pretenden evaluar.
Elaborar varios tems para cada objetivo.
Seleccionar una muestra de expertos en el contenido del test.
Pedirles que, segn su opinin, asignen cada tem al objetivo que
pretende medir.
29

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Seleccionar los tems en los que los expertos manifiestan mayor acuerdo
en sus clasificaciones.
CRITERIO DE EXPERTOS
Mtodo 1:HOJA DE PREGUNTAS PARA LA VALIDACIN
PREGUNTAS

ESCALA DE VALORACION

1. Considera usted que los tems del instrumento

miden lo que se pretende medir?


2. Considera usted que la cantidad de tems
registrados en esta versin son suficientes para
tener una comprensin de la materia de estudio?
3,

Considera

usted

que

los

tems contenidos

en este instrumento, son una muestra representativa del


universo materia del estudio?
4. Considera usted que si aplicamos en reiteradas
oportunidades este instrumento a muestras similares,
obtendramos tambin datos similares?
5. Considera usted que los conceptos utilizados en
este instrumento, son todos y cada uno de ellos, propios
de las variables del estudio?
6. Considera usted que todos y cada uno de los tems
contenidos en este instrumento tienen los mismos
objetivos?
7. Considera usted que el lenguaje utilizado en
el presente instrumento es claro, sencillo y no da lugar
a diversas interpretaciones?
8. Considera usted que la estructura del presente
instrumento es adecuada al tipo de usuario a quien se
dirige el instrumento?
9. Estima usted que las escalas de medicin
utilizadas son pertinentes a los objetos materia de

estudio?
10. Que aspectos habra que modificar, que aspectos tendran que incrementarse o que aspectos
habra que suprimirse?

PROCEDIMIENTO
30

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

El mtodo DPP mide la adecuacin de los instrumentos, para medir la variable


de inters, en funcin a la valoracin de los expertos.

Ejemplo 18.
En el presente estudio la valoracin de los expertos es:

EXPERTOS
Item

Promedio

4.75

4.5

4.5

4.25

4.5

2. Con los promedios hallados, se determina la distancia de punto mltiple


(DPP), mediante la siguiente ecuacin:

DPP = (X1 Y1 )2 +(X 2 Y2 )2 + ................(X 9 Y9 )2


Donde:
Xi = Valor mximo en la escala para el tem i.
Yi = El promedio del tem i.
DPP = ( 5 4.75 )2 +( 5 5 )2 + ................( 5 4.5 )2 1.541

Determinar la distancia mxima (Dmax) del valor obtenido respecto al punto de


referencia Cero (0), con la ecuacin:
2
2
2
D

(1
x

(1
x

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
(1
x

)
M
a
x
1
2
n

Donde:
Xi = Valor mximo en la escala concedido para el tem i.
1 = Valor mnimo de la escala para cada tem.
DMax (5 1)2 (5 1)2 ...................(5 1) 2 12

31

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

La Dmax hallada fue de 12


La Dmax se divide entre el valor mximo de la escala, lo que nos da un valor
de 12/5=2.4
5. Con el valor hallado anteriormente (apartado 4) se construye una nueva
escala valorativa a partir de cero, hasta llegar a Dmax. Dividindose en
intervalos Iguales entre si, llamndose con las letras A, B, C, D, y E.
Siendo:
Escala

Valoracin

Valoracin de
Expertos

0-2.4

A = Adecuacin Total

DPP=1.541

2.4-4.8

B = Adecuacin en gran medida

4.8-7.2

C = Adecuacin Promedio

7.2-9.6

D = Escasa Adecuacin

9.6-12

E = inadecuacin

6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta


requiere reestructuracin y/o modificacin, luego de las cuales se somete
nuevamente a juicio

de expertos. El valor hallado del DPP fue de 1.541

cayendo en la zona A, lo que indica la Adecuacin del instrumento y que


puede ser aplicado.

Mtodo 2

32

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de


validacin.

TEM

Criterios a evaluar

observaciones

Claridad

Coherencia

Induccin

Lenguaje

En

interna

Adecuado

la

redacci

la

respuesta
Con el nivel

Mide lo

si

debe

que

eliminarse

pretend

modificarse un

e medir

favor indique)

(sesgo)
Del
informante
Si

No

Si

No

Si

No

Si

No

Si

No

Si

No

1
..
n
Aspectos generales
El instrumento contiene instrucciones claras y precisas
para responder el cuestionario
Los tems permiten el logro del objetivo de la investigacin
Los tems estn distribuidos en forma lgica y secuencial
El nmero de tems es suficiente para recoger la
informacin. En caso de ser negativa su respuesta, sugiera
los tems a aadir
Validez
Aplicable ( )

No aplicable ( )

Validado por:
Firma:

1.17 CONFIABILIDAD del INSTRUMENTO


33

*************

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario


sobre un pequeo grupo de poblacin. Esta prueba piloto ha de garantizar las
mismas condiciones de realizacin que el trabajo de campo real. Se
recomienda un pequeo grupo de sujetos que no pertenezcan a la muestra
seleccionada pero s a la poblacin o un grupo con caractersticas similares a la
de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta
manera se estimar la confiabilidad del cuestionario.
La confiabilidad responde a la pregunta con cunta exactitud los tems,
reactivos o tareas representan al universo de donde fueron seleccionados?. El
trmino confiabilidad designa la exactitud con que un conjunto de puntajes
de pruebas miden lo que tendran que medir (Ebel, 1977, citado por Fuentes,
op. cit., p. 103).

Entre los mtodos para estimar la confiabilidad, se tienen:


Mtodo Test-Retest: una forma de estimar la confiabilidad de un test o
cuestionario es administrarlo dos veces al mismo grupo y correlacionar las
puntuaciones obtenidas.
El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad
porque denota la coherencia de las puntuaciones en el tiempo
Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95
(Popham, 1980, citado por Fuentes, op. cit.).
Se usa la correlacin por el mtodo de los puntajes directos (Correlacin r de
Pearson):

rxy

n xi yi xi yi
n xi2 xi * n yi2 yi
2

Donde:

rxy : es el coeficiente de correlacin


n: nmero de sujetos
X: valores de X (1 aplicacin)
Y: valores de Y (2 aplicacin)
34

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Mtodo comn de divisin por mitades o Hemitest: este mtodo computa el


coeficiente de correlacin entre los puntajes de las dos mitades del test o
cuestionario aplicado. Esto supone que las dos test mitades son paralelos,
tienen igual longitud y varianza entre s. Se estima a travs del coeficiente de
confiabilidad de Spearman-Brown:
Se establece la correlacin entre los dos puntajes de las dos mitades del test a
travs del mtodo de los puntajes directos, Correlacin r de Pearson:

r12

n x1 x2 x1 x2
n x12 x1 * n x22 x2
2

Estimacin del test completo (Spearman-Brown) con la frmula:

rtt

2r12
1 r12

Se interpreta la prueba de hemitest como coeficiente de consistencia


interna, ya que una sola prueba contiene las dos formas equivalentes y su
nfasis lo pone en las puntuaciones de los sujetos, no en los temes.

El mtodo de divisin por mitades de Rulon: utiliza la divisin del test en


mitades, pero su mtodo no supone necesariamente varianzas iguales en los
sub-tests. coeficiente de consistencia interna.

sd2
rtt 1 2
st
Donde:

rtt : coeficiente de confiabilidad


sd2 : varianza de la diferencia entre las puntuaciones de las mitades
st2 : varianza de las puntuaciones del test total

El mtodo de divisin por mitades de Guttman: tambin se denomina


coeficiente de consistencia interna. Su frmula es:

35

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

sa2 sb2
rtt 2 1 2
st

Donde:

rtt : coeficiente de confiabilidad


sa2 : varianza de las puntuaciones de los temes pares
sb2 : varianza de las puntuaciones de los temes impares
st2 :varianza de las puntuaciones del test total

ALFA DE CRONBACH

Para evaluar la confiabilidad o la homogeneidad de las preguntas o tems es


comn emplear el coeficiente alfa de Cronbach cuando se trata de alternativas
de respuestas policotmicas, como las escalas tipo Likert; la cual puede tomar
valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa
confiabilidad total. El coeficiente de Cronbach puede ser calculado por medio
de la varianza de los tems y la varianza del puntaje total (Hernndez Sampieri
et al, 2003). Para calcular el coeficiente de confiabilidad se us el
COEFICIENTE ALFA DE CROMBACH ( ) Crdova (2009), cuya ecuacin
es:

donde:
: coeficiente de confiabilidad de la prueba o cuestionario
nmero de tems del instrumento
: Varianza total del instrumento.
: Sumatoria de las varianzas de los tems.

Mtodo de Kuder-Richarson 21: permite obtener la confiabilidad a partir de


los datos obtenidos en una sola aplicacin del test. La suposicin bsica es
considerar que todos los temes presentan igual varianza. Coeficiente de
consistencia interna.

36

Mtodos Estadsticos

KR21

Dr. Cleto De La Torre Dueas

n M n M
1

n 1
nst2

Donde:
n: nmero total de tems
M: media aritmtica de las puntuaciones obtenidas por los individuos
st2 : varianza de las puntuaciones totales

Para la interpretacin de la confiabilidad se utiliza el siguiente cuadro:

TABLA DE CATEGORAS
ESCALA

CONFIABILIDAD

r>0.89

Muy alta
Alta
Aceptable
Moderada
Baja
Muy baja
Despreciable

37

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Ejemplo 19.
Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente
informacin

Encuestados

Preguntas (tems)

Puntos

10

12

10

10

13

11

12

13

14

15

Total

17

18

15

12

93

0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83

varianza del instrumento

38

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Varianza de cada pregunta

El ndice de confiabilidad es alto de conformidad con la tabla de categoras.


BAREMACIN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.

Para medir la variable de estudio se aplico una encuesta utilizando la escala de


likert, la misma que presenta en cada tems cinco alternativas, a partir de las
cuales los entrevistados pueden elegir, con la finalidad de sealar su nivel de
acuerdo.
Alternativa

Asignacin
numrica

Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos
respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems
(x) por 1. Una puntuacin alta (PA) est dada por el nmero de tems o afirmaciones
multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------PA
El promedio del puntaje del instrumento se obtiene mediante:

39

Mtodos Estadsticos

Pr omedio

Dr. Cleto De La Torre Duea

Puntaje
n

Para facilitar la interpretar las puntuaciones de la variable de estudio se transforman a una


escala cualitativa, segn el siguiente criterio.

Puntaje Obtenido

Categora

Pr omedio 1.49

Deficiente

1.5 Pr omedio 2.5

Malo

1.5 Pr omedio 2.5

Regular

1.5 Pr omedio 2.5

Bueno

Pr omedio 4.5

Muy
bueno

1.18 BAREMACIN DEL INSTRUMENTO, UTILIZANDO ESCALA DE INTENSIDAD.


Para medir las variables de estudio se aplica encuestas, las mismas que
presentan en cada tem cuatro alternativas, a partir de las cuales los entrevistados
pueden elegir, con la finalidad de sealar su nivel de acuerdo.

El tipo de escala que se utiliza es ordinal (Escala de intensidad), asignacin un


valor a cada alternativa como se muestra en el siguiente cuadro:
Alternativa

Asignacin
numrica

Con la finalidad de realizar un anlisis estadstico de las variables con sus respectivas
dimensiones previamente se realizo la baremacin del instrumento (Medicin de la
variable)

40

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Para medir la variable de estudio (Puntuacin), se suman los valores obtenidos respecto de
cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems (x) por 1. El
puntaje mximo (PA) est dada por el nmero de tems multiplicado por 4.

PM--------------------I----------------------I----------------------I------------------PA
En el cuadro siguiente se muestra el resumen de la puntuacin:

Caractersticas

Puntuacin
original

Nro. de
preguntas
(tems)
Mnimo
Mximo
Puntaje
Obtenido

Puntuacin
transformada
A escala
vigesimal
m

1
20
x

4m
T

La puntuacin original se transformacin a una escala vigesimal utilizando la siguiente relacin

T 1 x 1

4m-1
19
Despejando el valor de x, se obtiene la puntuacin del individuo en escala vigesimal.

19 T 1
4m 1

Finalmente la escala vigesimal es transformada a una escala cualitativa:

Puntaje

Categora

Obtenido
0-8

Deficiente

9-10

Malo

11-13

Regular

14-17

Bueno

18-20

Muy
bueno

41

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

1.19 MATRIZ DE CONSISTENCIA.


Esta referido a la estructura del proyecto de Investigacin y que para fines didcticos se presenta en el siguiente esquema:
TITULO:
PROBLEMA

OBJETIVO

HIPOTESIS

VARIABLES

General

General

General

Variable independiente

.?
Formulacin de problemas

especficos.

Formulacin de hiptesis

1. .?

Objetivo especfico

operativas.

2.

..

TIPO DE ESTUDIO

POBLACIN Y

RECOLECCIN DE DATOS

MUESTRA
Nivel de investigacin.

Variable Dependiente

PRUEBAS
ESTADISTICAS

Poblacin.

Gua de observacin

Tipo de investigacin.

Cuestionario encuestas

Diseo de investigacin

Muestra

VARIABLES

DIMENSIONES

INDICADORES

Ubicacin de tems

..

..

Entrevistas

42

Mtodos Estadsticos

1.19

Dr. Cleto De La Torre Dueas

MODELO DE TESIS

TTULO DE LA TESIS:

CAPITULO I: PROBLEMA DE INVESTIGACIN

PLANTEAMIENTO DEL PROBLEMA


FORMULACIN DEL PROBLEMA DE INVESTIGACIN
OBJETIVOS
JUSTIFICACIN
ORIGINALIDAD:
PERTINENCIA:
RELEVANCIA:
OPORTUNIDAD:
FACTIBILIDAD:
IMPORTANCIA
LIMITACIN
REA DE ESTUDIO
DELIMITACIN
DELIMITACIN ESPACIAL
DELIMITACIN TEMPORAL

CAPITULO II: MARCO TERICO

ANTECEDENTES DE ESTUDIO
MARCO CONCEPTUAL
MARCO NORMATIVO
MARCO TERICO
CONCEPTUALIZACIN EN TRMINOS
HIPTESIS DE INVESTIGACION.

CAPITULO III: DISEO METODOLGICO

43

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

NIVEL DE INVESTIGACIN
TIPO DE NVESTIGACION.
DISEO DE INVESTIGACIN
POBLACIN Y MUESTRA
VARIABLES
OPERACIONALIZACIN DE VARIABLES
TCNICAS E INSTRUMENTOS DE RECOLECCIN DE DATOS
TCNICAS DE ANLISIS DE DATOS.

CAPITULO IV: PRESENTACION DE RESULTADOS

CONCLUSIONES
RECOMENDACIONES
BIBLIOGRAFIA
ANEXOS

44

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

EJERCICIOS PROPUESTOS.

1.

Influencia

del

uso

de

materiales

didcticos

en

el

rendimiento acadmico de los estudiantes de la ciudad de Cusco.


Especifique.
b. La poblacin.
c. La(s) variable(s) de estudio y el tipo de variable.
d. La escala de medicin a emplear.
e. Tipo de estudio.
2.

Se hizo una encuesta entre los profesores de una UGEL sobre el


nivel de acuerdo con la carrera magisterial propuesta por el
gobierno.
Carrera magisterial.

Frecuencia

Totalmente de acuerdo

15

De acuerdo

40

Indeciso

25

En desacuerdo

10

Totalmente en desacuerdo

En base a la informacin, realice el anlisis correspondiente.

3.

Clasificar cada una de las siguientes variables :


a. Rendimiento Acadmico (Bajo, Medio, Alto).
b. Sexo.
c. Edad.
d. Nivel educativo (primario secundario, superior).
e. Aos de estudios completados.
f. Tipo de enseanza (privada o pblica).
g. Estrato social (bajo, medio o alto).
h. Nmero Telefnico
i.

Nmero de DNI de un profesor.

j.

Mtodo de enseanza.

k. Nivel de congruencia entre la sumilla y el silabo.

45

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

CAPITULO II

ORGANIZACIN Y PRESENTACIN

La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos de


coleccin, clasificacin, organizacin, anlisis, sntesis e interpretacin de datos;
siendo su caracterstica que la distingue, la de hacer generalizaciones o
inferencias en base a una muestra. En palabras sencillas podramos decir que la
estadstica es la ciencia de los datos
En trminos generales la estadstica aborda dos tipos de problemas:
Resumir, describir y explorar datos.
Utilizar datos de una muestra para inferir la naturaleza del conjunto del
cual se escogi la muestra.

1.1

DIVISION DE LA ESTADISTICA
As, la estadstica se divide en dos partes ntimamente relacionadas:
Estadstica Descriptiva.- Esta es la parte de la estadstica que se dedica a
la organizacin, sntesis y descripcin de conjuntos de datos.
Esta es importante, ya que antes de que la mente humana pueda interpretar
(hacer inferencias) un conjunto de datos, especialmente cuando estos son
demasiados, es necesario resumirlos o representarlos de manera clara,
simplificada o reducida.
Estadstica Inferencial.- Esta rama de la estadstica trata el problema de
inferir la naturaleza de un conjunto de datos a partir de una muestra de
dichos datos.

CONCEPTOS BASICOS
Poblacin. Es cualquier conjunto de datos, objetivo de nuestro inters,
sobre los cuales interesa observar una o ms caractersticas. Esta puede ser
finita o infinita. El tamao de la poblacin es el nmero de individuos que
tiene
46

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Muestra. Una muestra es un conjunto de individuos de la poblacin que


refleja las caractersticas de sta lo mejor posible. Si las caractersticas
quedan bien reflejadas, se dice que la muestra es representativa. El tamao
de una muestra es el nmero de individuos que tiene, lo denotamos por n.
Unidad de estudio. Es cada elemento que va a ser estudiado. Lo ms
normal es que se trate de individuos, pero no tiene por qu ser as.
Data. Es cualquier medida resultado de haber observado una variable en
una unidad de alguna poblacin.
Parmetro es una propiedad descriptiva de una poblacin. Ejemplo media y
varianza poblacional
Estadstico es una propiedad descriptiva de una muestra., ejemplo media y
varianza muestral
Variable. Cualquier caracterstica de Inters en el estudio.
Variable cualitativa: Ordinal y Nominal
Variable cuantitativa: Discreta y continua.

Por otra parte, el reporte de las variables medidas requiere de los siguientes
conceptos:
Exactitud. Hace referencia a la cercana con la que se encuentra la medicin
realizada con el valor real de la variable medida, est relacionado con el concepto
de la media.
Precisin. Hace referencia a la cercana con que se encuentran un conjunto de
mediciones realizadas sobre la misma variable, relacionado con el concepto de
varianza.

ORGANIZACIN DE INFORMACION
La presentacin de datos a travs de tablas estadsticas es una actividad
importante dentro de los sistemas de informacin, estas se fortalecen
significativamente cuando se la acompaan con grficos descriptivos ilustrativos.
En el contexto de los sistemas de informacin, en ms de una oportunidad se
encontrara que un buen grafico resume y expresa mucho ms que prrafos
completos de comentarios e interpretaciones literales.

47

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Resumir los datos es un procedimiento til para conseguirlo y puede hacerse


mediante tablas, grficos o valores numricos. A lo largo de este tema veremos
las principales tcnicas numricas y grficas que nos permiten describir una
caracterstica de inters observada en una poblacin, poniendo en relieve sus
rasgos ms importantes.

2.1

TABLA DE FRECUENCIAS.
Un primer resumen de la informacin contenida en un conjunto de datos
observado se obtiene al organizarlos en lo que se llama una tabla de
frecuencias. En sta se recogen los distintos valores (nmeros o categoras)
que toma la variable junto con sus correspondientes frecuencias de
aparicin.

2.1.1 TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


Si en una muestra de n elementos, se observa k categoras diferentes C 1, C2,,
Ck de una variable cualitativa X.
Para resumir la informacin, previamente definimos algunos conceptos.
La frecuencia absoluta de un valor Ci es el nmero de veces que dicho valor
aparece en la muestra. Se representa por ni y cumple
k

n n n
i

...... nk n

i 1

La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (n i)


entre el tamao de la muestra (n), se representa por f i
fi

ni
, se cumple
n

f 1
i

i 1

La frecuencia absoluta acumulada del valor i-simo es la suma de las


frecuencias absolutas hasta dicho valor, se denota por N i

Ni n1 n2 ...... ni
La frecuencia relativa acumulada del valor i-simo es la suma de las
frecuencias relativas hasta dicho valor, se denota por F i

48

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Fi f 1 f 2 ...... fi ,

Fi

Ni
n

Una tabla de frecuencias tiene la siguiente estructura:

Categora Frecuencias Frecuencias

Frecuencias

frecuencias

frecuencias

absolutas

relativas

de la

absolutas

relativas

Porcentuales

variable

fi

hi

pi

acumuladas acumuladas
Fi

Hi

C1

f1

h1

p1

F1

H1

C2

f2

h2

pi

F2

H2

Ck

fk

hk

pk

Fk=n

Hk=1

Total

1.00

100.00

El cuadro anterior se puede representar utilizando los siguientes grficos.

Diagrama de barras o rectangulos


Se construye dibujando sobre la categora correspondiente un rectngulo
con altura igual a la frecuencia (absoluta o relativa). Tambin es vlido para
variables cuantitativas discretas, considerando en el eje de abscisas los
valores de la variable en orden creciente en lugar de las categoras.

Diagrama de Pareto.
Se ordenan las categoras de mayor a menor importancia y se dibujan los
rectngulos correspondientes.

Diagrama de sectores
Se dibujan en un crculo sectores con reas proporcionales a las frecuencias
de cada una de las categoras.

2.1.2 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


DISCRETAS
Una vez obtenida una muestra de cualquier poblacin y observados los valores
que toma la variable en los individuos de la muestra, estos valores se suelen
ordenar. Si la variable es cuantitativa la ordenacin ser de menor a mayor.
49

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Dada una variable X, consideramos una muestra de tamao n que toma k valores
distintos, x1, . . . , xk (x1 < x2 < . . . < xk).
La organizacin es en forma similar al caso cualitativo.

Categora Frecuencias Frecuencias Frecuencias


de

la absolutas fi

relativas hi

variable

frecuencias

Porcentuales absolutas
pi

frecuencias
relativas

acumuladas acumuladas
Fi

Hi

x1

f1

h1

p1

F1

H1

x2

f2

h2

pi

F2

H2

xk

fk

hk

pk

Fk=n

Hk=1

Total

1.00

100.00

La grafica para representar esta informacin es Bastones.

Observaciones
Los datos iniciales se pueden representar utilizando los grficos

Diagrama de cajas(box-plot)
1. Paralelo a un eje numerado dibujamos un segmento con extremos en los
valores menor y mayor que aparecen en la muestra.
2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos
en ella la mediana.
3. Se hallan los lmites interiores (Q1 1.5 IQR y Q3 + 1.5 IQR) y los lmites
exteriores (Q1 3 IQR y Q3 + 3 IQR).
Donde Qi : Cuarteles que seran desarrollados ms adelante.
4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores
adyacentes de la muestra.
5. Por ltimo se indican los valores atpicos

Tallos y Hojas (stem & leaf)


Procedimiento semigrfico para el que se preparan los datos resumindolos
en dos o tres cifras (expresndolos en las unidades adecuadas). A
continuacin se disponen en una tabla de dos columnas del siguiente modo:
50

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra
de las decenas, a la derecha separada por una lnea aparecen las hojas y
se escriben ordenadas y todas seguidas.
2. Si hay tres dgitos el tallo est formado por los dos primeros. Las hojas
son las unidades.

2.1.3 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


CONTINUAS.
A veces se hace necesario trabajar con datos agrupados. Definimos entonces
como clase a cada uno de los intervalos en que se agrupan los datos. Las
frecuencias harn ahora referencia al nmero de datos que hay en cada intervalo.
Para construir distribucin de frecuencias por intervalos, se tiene los siguientes
pasos:

Elegir un numero de intervalos de clase (K)


Puede utilizar la regla de Sturges, k 1 3.3log(n)
Donde k: Numero de intervalos.
n: Numero de datos.

Determinar el rango , R xmax xmin

Determinar la amplitud de las clases A R / k

Determinacin de los intervalos:

I1 xmin , xmin A LI1 , LS1


I 2 xmin A, xmin 2 A LI 2 , LS2
..

I k xmin (k 1) A, xmin kA LI k , LSk

Determinacin de las marcas de clase, mi

LI i LSi
2

Donde LI : Limite inferior

LS : Limite superior.

Realizar la clasificacin y el conteo de datos en cada clase construida.

51

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Intervalo

Marcas

Frecuenci

Frecuenci

Frecuencias

Frecuencias

frecuencias

frecuencias

de clase

as

as

relativas

Porcentuale

absolutas

relativas

Ii

mi

absolutas

relativas

hi

acumuladas

acumuladas

fi

hi

pi

Fi

Hi

I1

m1

f1

h1

h1

p1

F1

H1

I2

m2

f2

h2

h2

pi

F2

H2

Ik

mk

fk

hk

hk

pk

Fk=n

Hk=1

1.00

1.00

100.00

Total

Este cuadro se representa mediante los siguientes grficos:

Histograma de frecuencias
Es la representacin ms frecuente con datos agrupados. Es igual que el
diagrama de rectngulos, considerando ahora en el eje de abscisas los
intervalos y en las ordenadas las frecuencias (absolutas o relativas).

Polgono de frecuencias
Se obtiene uniendo los puntos medios de los extremos superiores de los
rectngulos que forman el histograma.

Curva de frecuencias.
Resulta de suavizar el polgono de frecuencias, en sus puntos angulosos.

Ojivas

EJERCICIOS RESUELTOS

1) Un grupo de especialistas est realizando un estudio sobre la contaminacin


que genera la actividad minera en los trabajadores. Los especialistas
sospechan que los niveles de hemoglobina en la sangre se modifican por esta
actividad, por tal razn deciden medir la hemoglobina en la sangre de 90
mineros, obteniendo los siguientes resultados.

12.2 16.4 17.8 18.4

19

19.5

20

20.9

23

13.1 16.8 17.8 18.4 19.1

19.5

20

20.9

23

14.3 16.9 17.8 18.4 19.1

19.7 20.2

21

23.2

15.5 17.1 17.8 18.4 19.2

19.7 20.3

21.1

23.3

52

Mtodos Estadsticos

15.5 17.2 18

Dr. Cleto De La Torre Dueas

18.5 19.2

19.7 20.3

21.4

23.5

15.6 17.3 18.1 18.5 19.3

19.7 20.5

21.6

23.5

15.9 17.4 18.2 18.5 19.3

19.7 20.6

21.7

24.1

16.1 17.6 18.3 18.5 19.4

19.8 20.6

22

24.2

16.2 17.8 18.3 18.8 19.4

19.9 20.8

22.4

24.8

16.2 17.8 18.3

19.9 20.8

22.7

26.2

19

19.5

a) Construya la tabla de distribucin de frecuencias


b) Represente la informacin obtenida, mediante un grfico.
Solucin.
a) Para construir una tabla de frecuencia se tiene los siguientes pasos.
Elegir el nmero de clases.
Usando la relacin de sturges se tiene:
k 1 3.3log(n) 1 3.3log(90) 7.44 7

Determinar la amplitud de los intervalos


R xmax xmin 26.2 12.2 14

Determinar el tamao del intervalo de clases (c),


A

R 14
2
k 7

Establecimiento de los lmites y construccin de la tabla:

LI - LS

mi

[12.2 14.2)

13.2

[14.2 16.2)

15.2

[16.2 18.2)

17.2

[18.2 20.2)

19.2

[20.2 22.2)

21.2

[22. 2 24.2)

23.2

[24.2 26.2)

25.2

TOTAL

fi

Fi

hi= fi/n

0.02

6
18
36
16

0.07

26

0.2

62

0.4

78

0.18

87

0.1

3
n=90

90

0.03
1

b) Histograma de frecuencias relativas.


53

pi
2.22
6.67
20
40
17.8
10
3.33
100

Hi
0.02
0.09
0.29
0.69
0.87
0.97
1

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Histogram
40

Porcentaje

30

20

10

0
12

2.-

15

18
21
hemoglobina en la sangre

24

27

Se realiz un estudio del grupo sanguneo de trabajadores de una mina


expuestos a contaminacin por mercurio, observndose

los siguientes

resultados:
O, A, O, B, AB, O, O, A, O, O, A, O, B, O, O, AB, A, B, A, O, O, O A, AB, B, A,
A, B, O, AB, B, A, B, B, O, A, O.
Solucin.

Grupo Sanguneo.

fi

10

AB

15

Total

n=37

hi

Pi

0.27

27.03

0.108

10.81

0.216

21.62

0.405
1

40.54
100

50

percentage

40
30
20
10
0
A

AB

54

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

27.03%
Grupo Sanguineo
A
AB
B
O

40.54%

10.81%

21.62%

3.- Se realiz un estudio sobre la prctica de automedicacin en la ciudad de


Cusco, registrndose las reacciones adversas que causa esta prctica.

Reacciones adversas ms frecuentes dentro de l a


automedicacin

cef aleas
mareos
nauseas
v mitos
dolores estomacales
sueo
sudoracin
alergias
Otros ( edemas, taquicardia,
diarreas)
Total

Represente grficamente la informacin.

55

Frecuencia
20
11
5
13
16
2
4
2

Porcentaje
25.0
13.8
6.3
16.3
20.0
2.5
5.0
2.5

8.8

80

100.0

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

25

20

Porcentaje

15

10

0
cefaleas

mareos

nauseas

vmitos

dolores
estom.

sueo

sudoracin

alergias

Otros

4.- En el hospital regional del Cusco, se realizo un estudio sobre el conocimiento


de la emisin de radiacin . Los resultados se muestran a continuacin.
Conocimiento

Def iciente
Regular
Bueno
Total

Frecuencia
26
8
7
41

Represente la informacin mediante un grafico.

56

Porcentaje
63.4
19.5
17.1
100.0

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Porcentaje

60,0%

40,0%

20,0%

0,0%
Deficiente

Regular

Bueno

Conocimiento

EJERCICIOS PROPUESTOS

1. Para los siguientes 40 datos de anlisis de agua de concentraciones de


calcio, en mg/L.
Tabla mostrando las concentraciones de calcio de 40 anlisis de agua.

138
146
168
146
161

164
158
126
173
145

150
140
138
142
135

132
147
176
147
142

133
136
163
135
150

125
148
119
153
156

a) Construya la tabla de frecuencias.


b) Grafique el histograma.
c) Establezca si los datos siguen una distribucin simtrica.

57

149
152
154
140
145

157
144
165
135
128

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

2. Para estimar la cantidad de alimentos contaminados en las fiestas de San


Sebastian , un inspector del Ministerio de Salud, decide contar el nmero
de muestras contaminadas con alguna bacteria en los lugares de venta.
Para ello, decidi tomar 70 muestras de alimentos durante un da. Los
resultados fueron son los siguientes:
7

10

10

10

11

11

10

10

10

11

a) Construya una distribucin de frecuencias.


b) Calcule las frecuencias acumuladas, absolutas y relativas.
c) Construya un histograma de las frecuencias absolutas.

3.

caracterizar una comunidad de invertebrados acuticos

Autor:
Temperatura

Fecha:
pH

Abundanc
ia especie
1
1
3
8
4
7
2
12
8
9

Localidad:
Abundancia
especie 2

...

...

Unidad 15
7.5
15
1
Unidad
12
7.3
48
2
Unidad
12
7.2
78
3
Unidad
13
8.2
23
4Unidad 14
6.2
64
5Unidad 17
6.8
85
6Unidad 19
5.5
14
7Unidad 15
7.1
15
8Unidad 13
7.0
32
9
4. Los siguientes son los resultados para la medida de oxgeno disuelto en
diferentes ocasiones en un punto de muestreo de un ro, en gramos por litro.
7.1 6.7

6.2

6.1

3.4 5.9 8.7 6.8 6.5 3.9 7.2 8.1

3.3 7.1

8.0

5.4

7.4 7.0 4.0 5.5 5.1 8.9 6.0 7.2

58

Mtodos Estadsticos

7.7 4.5

7.6

5.8

Dr. Cleto De La Torre Dueas

7.1 7.1 6.3 6.1 6.3 5.8 5.8 7.5

a) Construya una distribucin de frecuencia que tenga 5 clases. (incluya los


limites dados, las frecuencias absolutas y relativas).

b) Calcule e interprete el valor de la tercera clase de la frecuencia absoluta


acumulada a "ms de".

c) Represente grficamente la distribucin de frecuencias por medio de un


polgono de frecuencia.

d) i Calcular las medidas de tendencia central.


e) Calcular las medidas de dispersin.
f) Calcular las medidas de forma.
g) Es esta una distribucin sesgada? De ser as, en qu direccin?
h) Encontrar el percentil 24.
5. Los siguientes datos son los tiempos de ignicin de ciertos materiales
expuestos al fuego, dados a la ms cercana centsima de segundo:
2.58

5.50

6.75

2.65

7.60

6.25

3.78

4.90

5.21

2.51

6.20

5.92

5.84

7.86

8.79

4.79

3.90

3.75

3.49

4.04

3.87

6.90

4.72

9.45

7.41

2.45

3.24

5.15

3.81

2.50

1.52

4.56

8.80

4.71

5.92

5.33

3.10

6.77

9.20

6.43

1.38

2.46

7.40

6.25

9.65

8.64

6.43

5.62

1.20

1.58

a) Cul es la amplitud total de la distribucin de los datos?


b) Obtenga la distribucin de frecuencias absolutas y relativas.
c) Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas,
con los intervalos anteriores.
d) Calcular la media y la varianza con los intervalos del apartado b y despus
calclense las mismas magnitudes sin ordenar los datos en una tabla
estadstica. Con qu mtodo se obtiene mayor precisin?
e) Dibuje el polgono de frecuencias relativas.
f) Dibuje el polgono de frecuencias relativas acumuladas.
6. El espectro de masa de una muestra de xido de plomo contiene iones de
59

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

frmula Pb0. El xido de plomo ha sido preparado a partir de 16O


isotpicamente puro. Las masas de los iones en gramos por mol, se listan a
continuacin:
220.03

220.90

226.92

225.20

216.80

229.56

222.15

232.11

235.00

223.50

224.30

227.23

224.78

218.45

231.45

222.62

228.56

224.05

230.30

215.00

223.06

228.92

223.82

230.82

225.62

229.10

224.05

232.50

221.95

218.42

a) Construya una distribucin de frecuencias con 4 clases. Incluya en la tabla la


frecuencia absoluta y la relativa.
b) Calcule la frecuencia absoluta acumulada "a menos de" y la frecuencia
relativa "a ms de". Interprete el valor de la tercera clase de ambas
frecuencias acumuladas.
c) Represente grficamente la distribucin de frecuencias por medio de un
polgono de frecuencias.
7. Se est investigando un mtodo para producir gasolina a partir de desechos
orgnicos. La planta ha proporcionado los siguientes datos referentes al
rendimiento, en porcentaje del combustible:
24.1 21.0 26.6 26.0 25.7 21.8 20.9 20.4 20.0
28.8 20.2 25.9 21.2 26.2 22.0 24.2 24.7 20.7
25.9 26.7 30.0 24.0 21.3 26.6 21.0 22.1 21.8
21.8 22.9 21.6 25.3 24.9 25.9 26.5 25.4 22.4
a) Construya una distribucin de frecuencia con 5 clases. Incluya los limites
dados, la frecuencia absoluta y la frecuencia relativa acumulada "a menos
de".
b) Dibuje el polgono de frecuencias.

60

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

CAPITULO III

MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIN DE DATOS.

Las tcnicas estudiadas anteriormente permiten una descripcin visual de la


distribucin de una variable. En muchos casos, el resumen puede hacerse
eficazmente de una forma ms sencilla y precisa: utilizando valores numricos
que den idea de la ubicacin o del centro de los datos -medidas de posicinusando cantidades que informen de la concentracin de las observaciones
alrededor de dicho centro -medidas de dispersin- y mediante nmeros que
reflejen la forma (asimetra y apuntamiento) de la distribucin -medidas de forma.
La conjuncin de tcnicas numricas y grficas permite una buena descripcin de
la variable.
Los estadsticos resmenes tratan de reflejar numricamente distintos aspectos
de la variable en estudio. Podemos distinguir 4 aspectos o caractersticas
principales que pueden resumirse en una distribucin. (Ver cuadro siguiente)

Media
Centralizacin Mediana
Moda
Percentiles
Cuartiles
Posicin
Deciles
Varianza
Desviacin tpica
Medidas
descriptivas
Coeficiente de variacin
Rango
Dispersin

Forma

Nos dan un centro de


la distribucin de
frecuencias
Son valores de la
distribucin que
dividen en partes
iguales
Las medidas de
dispersin cuantifican
la separacin, la
dispersin, la
variabilidad de los
valores de la
distribucin respecto al
Recorrido Intercuartilico
valor central
Coeficiente de Asimetra
Comparan la forma
Coeficiente de Apuntamiento que tiene la
o Curtosis
representacin grfica

61

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

3.1 Medidas de tendencia central

Los promedios o medidas de tendencia central son valores representativos de un


conjunto de datos. Pretenden resumir todos los datos en un nico valor. Las
medidas de tendencia central son fundamentales ya que permiten localizar
cuantitativamente la zona central o de mayor acumulacin de informacin de un
conjunto de datos correspondientes a una variable, obtenidos de una muestra
seleccionada de una poblacin especfica o de un conjunto de resultados del
espacio muestral de un experimento aleatorio.

Definimos tres medidas de tendencia central: media, mediana y moda.

Media, ( x )
Media para datos sin agrupar:
Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante

x , se obtiene mediante:
n

x1 x 2 ..... xn
x

x
i 1

Media para datos agrupados


Consideremos el caso en que tenemos una distribucin de frecuencia

para

variables cuantitativas discretas, en este caso la media es:

k
f 1x1 f 2 x 2 ..... fkxk
xi hi
n
i 1

Si los datos estn agrupados por intervalos, para hallar la media tomamos la
marca de las clases,
x

k
f 1m1 f 2m2 ..... fkmk
hi mi
n
i 1

62

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

La media se mide en las mismas unidades que la variable, y tiene el


inconveniente de verse muy afectada por la presencia de datos que sean
extremadamente grandes o pequeos (datos atpicos).

Mediana, (Me)
Se calcula para variables cuantitativas; es un nmero tal que al menos el 50% de
los datos es menor o igual que la mediana y al menos el 50% mayor o igual.

Mediana para datos sin agrupar


La mediana es el valor del dato central y depende del tamao de la muestra.

Me x n 1 , para n impar

x n x n
Me

1
2

, Si n es par.

Mediana para datos agrupados


Cuando trabajamos con variables agrupadas por intervalos es imposible
determinar con precisin los valores que toman los datos, ya que esa informacin
se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso,
debemos buscar otro mtodo para determinar el valor de la mediana.

2 Fi 1
0.5 H i 1
Me LI
A LI
A
hi

fi

La mediana slo tiene en cuenta la posicin de los valores en la muestra y por lo


tanto tiene mejor comportamiento que la media cuando hay observaciones
anmalas.

Moda, (Mo)
Es el valor con mayor frecuencia. Si hay ms de una moda, la variable se dice
multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o
cualitativas).

63

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Si los datos estn agrupados hablamos de clase modal y ser aquella para la que
la frecuencia absoluta sea mayor.

1
fi fi 1
Mo LI
A
A LI
1 2
fi fi 1 fi fi 1

Donde:
1 fi fi 1
1 fi fi 1

Cmo elegir entre las medidas de tendencia central?- En general, la media


es la medida de tendencia central ms til y ms empleada. El uso de la media es
el ms apropiado cuando y la distribucin de los datos es unimodal y
aproximadamente simtrica. Cuando valores extremos distorsionan la distribucin
de los datos, el uso de la mediana es ms apropiado pues se ve menos afectada,
pero en la prctica esta medida de tendencia central no se utiliza demasiado. Si
se trata de una variable ordinal, o slo necesitas una descripcin rpida y
aproximada de la tendencia central, puedes utilizar la moda, que tambin es til
cuando la distribucin est distorsionada por valores extremos o la distribucin es
bimodal.

Clases de Distribuciones
Distribucin

Simtrica se presenta si todas las observaciones estn

concentradas en un solo valor de la variable, en este caso la media, mediana y


moda coincidiran en el mismo.

x Me Mo

64

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Distribucin asimtrica sesgada a la izquierda


Supongamos ahora que las observaciones de la parte izquierda se alejan del
valor central ms que las observaciones de la parte derecha, generando una
distribucin asimtrica hacia la izquierda; en este caso como la media es la suma
de los valores de las observaciones dividido por la cantidad total de
observaciones, su valor se correr a la izquierda tambin y por el mismo motivo,
la media ser menor que la mediana y ambas menor que la moda, es decir:

x Me Mo
Distribucin asimtrica sesgada a la derecha.
En este caso la media, es mayor que la mediana y que la moda.

Mo Me x

3.2

Medidas de Posicin.

Cuartiles
Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se
denotan por Qi , i=1,2,3

i.n

4 Fk 1
Qi LI i
A
f
k

Q1, primer cuartil, al menos el 25% de los datos son menores o iguales
que l y al menos el 75% de los datos son mayores o iguales que l.

Q2, segundo cuartil, es la mediana, Q2 = Me.

65

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales
que l y al menos el 25% de los datos son mayores o iguales que l.

Percentiles
Dividen la muestra ordenada en 100 partes iguales.

i.n

100 Fk 1
Pi LI i
A
fk

El i-simo percentil, Pi ( 1 i 99 ) es un valor tal que al menos el i% de los datos


son menores o iguales que l y al menos el (100-i) % de los datos son mayores o
iguales que l.

A partir de las definiciones de los cuartiles y percentiles, es claro que Q 1 = P25, Q2


= P50 =Me y que Q3 = P75.
Deciles
Dividen el conjunto de datos en 10 partes iguales y se denota con D i , i=1,9

i.n

10 Fk 1
Di LI i
A
fk

3.3

Medidas de dispersin

Mientras los estadsticos de tendencia central nos indican los valores alrededor de
los cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o
dispersin muestran si los valores de las observaciones estn prximos entre s o
estn muy separados. Dos conjuntos de datos pueden tener la misma localizacin
central y no obstante, ser muy distintos si uno se halla ms disperso que el otro.
La dispersin es el grado en que los datos numricos tienden a extenderse
alrededor de

un valor medio. La dispersin de la distribucin suministra

informacin complementaria que permite juzgar la confiabilidad de nuestra medida

66

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

de tendencia central. Si los datos estn ampliamente dispersos, la localizacin


central ser menos representativa de los datos en su conjunto de lo que sera en
el caso de datos que se acumulasen ms alrededor de la media. Adems, si no
conviene tener una amplia dispersin de valores respecto al centro o si esa
dispersin implica un riesgo inaceptable, deberemos ser capaces de reconocerlo
y no escoger las distribuciones que presentan la mxima dispersin.
Por ejemplo, a los analistas financieros les interesa la dispersin de las ganancias
de una empresa, las utilidades con una fuerte dispersin indican un riesgo mayor
parar los accionistas que las utilidades que permanecen relativamente estables.

Varianza.
Slo tienen sentido para variables cuantitativas y se define:
n

S2

xi x
n
n

S2

i 1

mi x fi

i 1

x 2 , Para datos no tabulados.

fx

2
i i

i 1

x 2 , Para datos tabulados de variable discreta

n
n

i 1

2
i

fi

n
n

S2

i 1

x x

fm
i 1

2
i

x 2 , Para datos tabulados por intervalos, para

variables continuas.
Observaciones sobre la varianza:
Las unidades de la varianza son los cuadrados de las unidades de los
datos y en muchas ocasiones no son fciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.

Desviacin tpica (S)


Es la raz cuadrada positiva de la varianza

s s2
La desviacin tpica poblacional suele denotarse por .
67

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Observaciones sobre la desviacin tpica:


Nos permite determinar con mayor grado de precisin dnde se sitan los
valores de una distribucin de frecuencia en relacin con la media.
Las unidades de la desviacin tpica se expresan en las mismas unidades
de los datos.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.

Variables tipificadas
Los distintos conjuntos de datos estn asociados por lo general a diferentes
medias, ya sea porque son de naturaleza diferente (escalas de medidas
diferentes). Con el propsito de reducir los datos a un mismo punto de referencia
y a una escala comn, se realiza entre ellos una transformacin llamada
tipificacin.
Se conoce por tipificacin de una variable x a efectuar el cambio de origen y de
escala de la variable.

xx
para muestras
z s
Frmulas:
z x - para poblacin

Esta nueva variable (z), carece de unidades de medida y permite comparar dos o
ms cantidades que en un principio no son comparables porque aluden a
conceptos diferentes. Tambin es aplicable a casos en que se quieran comparar
individuos semejantes de poblaciones diferentes. Por ejemplo, si deseamos
comparar el nivel acadmico de dos estudiantes de diferentes universidades, z
nos indica cuntas desviaciones estndar est un valor por arriba o por debajo de
la media del conjunto de datos al cual pertenece.

Ejemplo:
Un mdico del Hospital Regional obtuvo 84 puntos en el test de aplicacin de
protocolos de salud, en el que la nota media fue 76, y la desviacin tpica 10; Otro

68

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

mdico del Hospital Antonio Lorena obtuvo 90 puntos, siendo la media 82 y la


desviacin tpica 16. Cul de los mdicos aplica mejor los protocolos de Salud?.

Mdico del HR

Mdico del HAL

x = 76

x = 82

s = 10

s = 16

x = 84

x = 90

z=

84 76
0,8
10

z=

90 82
0,5
16

Sobresali ms el Mdico del Hospital Regional.

Coeficiente de variacin Muestral de Pearson


Las medidas de dispersin anteriores dependen de las unidades de medida, el
coeficiente de variacin es, en cambio, una medida de dispersin relativa y
adimensional.
CV

S
|X|

CV es apropiado en poblaciones donde los datos son positivos.


Si 0<CV<1.5, los datos provienen de una poblacin homognea
Si CV>1.5, los datos provienen de una poblacin heterognea.

El coeficiente de variacin es til, en razn de su carcter adimensional, para


comparar muestras con medias desiguales, donde las unidades de medida de las
observaciones son diferentes. Tambin para decidir cual muestra es ms
homognea o menos variable

Recorrido o rango
Es la diferencia entre el mayor y menor valor de una muestra.
R x max x min

69

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Rango semiintercuartlico y amplitud intercuartil


El rango semiintercuartlico es la mitad de la diferencia entre el tercer y primer
cuartil, Q = (Q3 Q1)/2.
La amplitud intercuartil es el doble del valor anterior,
2Q = IQR = (Q3 Q1).
Cmo elegir entre las medidas de dispersin?- La medida de dispersin ms
til es la desviacin tpica. Slo debes usar el rango cuando dispones de pocas
medidas o cuando todo lo que necesitas conocer es la dispersin general de las
medidas. Utiliza el coeficiente de variacin cuando quieras tener una idea de la
variabilidad relativa de dos o ms variables cuyas medias son muy diferentes en
magnitud. Esto se ve facilitado por su carcter adimensional, es decir, no depende
de las unidades en que se mida la media

3.4

MEDIDAS DE FORMA

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y


Hacen referencia a la forma de la distribucin, simtrica, asimetra a la derecha o
a la izquierda. En general la mejor manera de verlo es por la representacin
grfica, pero si no la tenemos existen coeficientes que nos indican la forma de la
distribucin. Los ms utilizados son:
Coeficiente de asimetra de Pearson,
El coeficiente de asimetra de una variable mide el grado de asimetra de la
distribucin de sus datos en torno a su media, es adimensional y se define
como sigue:
Ap

x Mo
S

Este coeficiente puede ser:


Ap 0 , entonces la media igual que la moda, distribucin simtrica
Ap 0 , entonces la media mayor que la moda, asimetra a la derecha
positiva

70

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Ap 0 , entonces la media menor que la moda, asimetra a la izquierda


negativa.
Curtosis hace referencia al mayor o menor apuntamiento que tiene una
distribucin de frecuencias respecto a una distribucin Normal, por lo tanto slo se
estudia en comparacin con la campana de Gauss, se determina mediante:
K

P75 P25
0.5
P90 P10

Este coeficiente puede ser:


K 0 , la curva es igual que la normal, se llama Mesocrtica
K 0 , la curva es ms puntiaguda que la normal se llama Leptocrtica
K 0 , la curva es ms aplastada que la normal, se llama Platicrtica

71

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

EJERCICIOS RESUELTOS.

1) La siguiente tabla muestra los coeficientes de inteligencia de 480 trabajadores


de una empresa.
C.I

70 74 78 82 86 90 94 98 10
2

fi

16 28 45 66 85 72 54

10

11

11

11

12

12

38

27

18

11

Calcule:
a) El C.I. medio de los trabajadores.
b) Su desviacin tpica.
c) Si el gerente de la empresa

afirma que exactamente la mitad de los

trabajadores de la empresa tienen un C.I. superior al del trabajador Juan,


qu C.I. tiene Juan?
d) Supongamos que se desea realizar un estudios sobre mercadotecnia , para
ello se debe seleccionar a un grupo de trabajadores con mayor C.I., pero la
empresa solo puede utilizar al 15% de los trabajadores. Qu C.I. deber
tener un trabajador como mnimo para ser considerado dentro de ese grupo
de elegidos?
e) Se van a preparar unas clases de apoyo en gestin empresarial , para un
25% de los trabajadores de la empresa , precisamente para aquellos que
tengan menor C.I. Hasta que trabajador de qu C.I. deberemos considerar
en estas clases?

SOLUCION:
La variable de estudio es el cociente intelectual (X)
xi

fi

fixi2

fixi

Fi

Hi

70

280

19600

0.0083

74

666

49284

13

0.0271

78

16

1248

97344

29

0.0604

82

28

2296

188272

57

0.1188

86

45

3870

332820

102

0.2125

90

66

5940

534600

168

0.35

72

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

94

85

7990

751060

253

0.5271

98

72

7056

691488

325

0.6771

102

54

5508

561816

379

0.7896

106

38

4028

426968

417

0.8688

110

27

2970

326700

444

0.925

114

18

2052

233928

462

0.9625

118

11

1298

153164

473

0.9854

122

610

74420

478

0.9958

126

252

31752

480

1470

n=480

46064

4473216

a) Media

f 1x1 f 2 x2 ..... fkxk 46064

95.96
n
480

b) Varianza y desviacin.
n

S2

xi x

i 1

fi

fx

2
i i

i 1

x2

4473216
2
95.96 110.88
480

s 110.88 10.52

c) Mediana.
n=480 ( Par)
x n x n
Me

1
2

x 480 x 480

x 240 x 241
2

94 94
94
2

d) Percentil 85

P85 106
e) Percentil 25
P25 90

2) Una empresa contrata los servicios de un corredor de bolsa, para decidir su


inversin en una de las dos acciones A y B. Los resultados de las utilidades de

73

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

estas acciones en los ltimos 7 meses en miles de dlares esta dado en el


cuadro siguiente.
Accin

Utilidades en miles de dlares.


1

57

55

54

52

62

55

59

80

40

62

72

46

80

40

a) Halle e interprete la media, mediana y moda de las utilidades.


b) Estadsticamente Cul de las acciones es ms recomendable para la
empresa que est interesado en una mayor utilidad? Cul de las acciones
es ms recomendable para la empresa que est interesado en un menor
riesgo de inversin? Fundamente su respuesta.

SOLUCION:
XA

XA2

XB

xB2

57

80

3249

6400

55

40

3025

1600

54

62

2916

3844

52

72

2704

5184

62

46

3844

2116

55

80

3025

6400

59

40

3481

1600

394

420

22244

27144

a) Estadsticos de A.
n

x1 x 2 ..... xn
xA
i 1
n
n

xi

394
56.28
7

MeA x n1 , para n impar n=7

MeA x n1 x 71 x 4 55

MoA 55

74

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Estadsticos de B.
n

x1 x 2 ..... xn
xB
i 1
n
n

xi

420
60
7

MeB x n1 , para n impar n=7

MeB x n1 x 71 x 4 62

MoB1 40

MoB 2 80

b) Calcular la varianza
n

S A2

xi x
n

xi x
i 1

CVB

x
i 1

2
i

xA2

22244
(56.28)2 10.27
7

S
10.27

0.057
| X A | 56.28

S B2

i 1

CVA

x
i 1

2
i

xB2

27144
602 277.7
7

S
277.7

0.277
60
| XB |

La informacin se ilustra en el grafico siguiente.

75

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

80,00

Utilidad

70,00

60,00

50,00

40,00

Accin

3.- Con el fin de realizar un estudio sobre las retenciones econmicas de quinta
categora a los trabajadores de una empresa, se seleccion aleatoriamente a
24 trabajadores, obtenindose las siguientes cantidades de retencin
econmica en cientos de soles.

Retencin

Nmero de

Econmica.

trabajadores

[0, 1>

[1, 2>

[2, 3>

[3, 4>

[4, 5>

[5, 6>

[6, 7>

[7, 8>

[8, 9>

a) Halla la media, varianza, la desviacin tpica y coeficiente de variacin.


b) Mediana
76

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

c) Moda.
SOLUCION:
I

fi

mi

mi2fi

mifi

Fi

[0, 1>

0.5

0.5

[1, 2>

1.5

4.5

[2, 3>

2.5

7.5

18.75

[3, 4>

3.5

21

73.5

13

[4, 5>

4.5

31.5

141.75

20

[5, 6>

5.5

5.5

30.25

21

[6, 7>

6.5

6.5

42.25

22

[7, 8>

7.5

7.5

56.25

23

[8, 9>

8.5

8.5

72.25

24

Total

24

40.5

92

440

a) Media, varianza, desviacin y coeficiente de variacin.


Media.

fm
i

92
3.83
24

Varianza.

S
2

2
i i

x2

440
3.83 3.66
24

Desviacin.
s 3.66 1.91

Coeficiente de Variacin.

CV

S
1.91

0.498
| X | 3.83

Mediana
12 7
Me 3
*1 3.833
6

Moda

77

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Mo Li 1 A
1 2
1

7 6 1

7 1 6

1
Mo 4
*1 4.14
1 6

a.

El colegio de administradores aplico un test de conocimientos en una escala


de 0 a 20 a 60 profesionales del rea, respecto a riesgo de inversin ,
obteniendo los siguientes resultados.
Nivel de

Nro de

conocimientos de

administradores

riesgo de inversion.
0-5

10

5-10

15

10-13

25

13-18

18-20

a) Calcule la media, varianza y la desviacin.


b) Determine la mediana y la moda
c) Determine e interprete Q1, Q3, P10 y P90
d) Coeficiente de curtosis y de asimetra.
SOLUCION:
Intervalo

fi.

Fi

mi

mi2fi

mifi

0-5

10

10

2.5

25

62.5

5 -10

15

25

7.5

112.5

843.75

10-13

25

50

11.5

287.5

3306.25

13-18

58

15.5

124

1922

18-20

60

19

38

722

56

587

6856.5

60

a) Media y varianza
Media.
78

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

fm
i

587
9.78
60

Varianza.

S
2

2
i i

x2

6856.5
9.782 18.63
60

Desviacin:
s 18.63 4.31

b) Mediana y moda
Mediana

2 F k 1
Me Li
A
fK

Determinamos

n 60

30
2 2
n

2 F k 1
30 25
Me Li
A 10
3 10.6
fK
25

Moda

1
Mo Li
A
1 2
1 25 15 10

2 25 8 17

1
10
Mo Li
A 10
3 11.11
10 17
1 2

c) Determine e interprete Q1, Q3, P10 y P90

Para obtener los cuarteles se tiene la relacin.

79

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

i.n

4 F k 1
Qi Li
A
f
K

Cuartil 1

1.n

4 F k 1
15 10
Q1 Li
A 5
5 6.67
fK
15

El 25% de los administradores presentan nivel de conocimientos de riesgo


de inversin a 6.67
Cuartil 3

3.n

4 F k 1
45 25
Q3 Li
A 10
3 12.4
f
25

El nivel de conocimientos mximo de riesgo de inversin del 75% de los


administradores es de 12.4.

Para obtener los percentiles se tiene la relacin.

i.n

100 F k 1
Pi Li
A
f
K

Percentil 10

10.n

100 F k 1
60
P10 Li
A 0
5 3
fK
10

El 10% de los administradores tienen nivel de conocimientos de riesgo de


inversin entre 0 a 3

Percentil 90

80

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

90.n

100 F k 1
54 50
P90 Li
A 13
5 15.5
f
8

d) Coeficiente de Asimetra.
Ap

x M o 9.78 11.11

-0.308
s
4.31

Puesto que Ap < 0 la distribucin es asimtrica negativa o a izquierdas


(desplazada hacia la izquierda).

Coeficiente de curtosis de fisher.

Q3 Q1
12.4 6.67
0.5
0.5 -0.0416
P90 P10
15.5 3

Si k 0 , entonces la distribucin es platicrtica.

EJERCICIOS PROPUESTOS

1. Las utilidades de empresas dedicadas al rubro de alimentos, en una regin


del pas presenta el siguiente comportamiento:
Utilidades en miles

[0, 40[

[40,70[

[70, 90[

[90,110[

[110,120]

10

20

de soles.
Nmero de empresas
Calcule e interprete:

La media aritmtica, mediana y moda.

Varianza, coeficiente de variacin.

Cuartel 1, Decil 6 y Percentil 85.

81

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

2.- Una muestra de pequeas empresas se clasifica en funcin de su antigedad


en el mercado y del porcentaje de deudas sobre el capital que presentan, con
los siguientes resultados:
Deudas

Empresas antiguas

Empresas Nuevas

0-15

19

29

15-30

13

10

30-50

11

50-70

32

En base a los resultados, Puede admitirse que el porcentaje de deudas de las


empresas es independiente de su antigedad?. Fundamente su respuesta.

3.

En una empresa donde los salarios tienen una media de 700 dlares y

una desviacin estndar de 150 dlares, el sindicato solicita un reajuste de


25% ms un incentivo de 10 dlares. El Directorio acoge parcialmente la
peticin rebajando los salarios solicitados en un 10%.

a) El Sindicato se declara satisfecho en sus negociaciones si el sueldo


promedio final aumenta por lo menos en un 20% respecto de su valor
actual. Se logra esto aceptando la proposicin del Directorio? Justifique
su respuesta.
b) El Sindicato pretende con su proposicin aumentar la homogeneidad de

los sueldos de

sus afiliados Se logra este objetivo aceptando la

proposicin del Directorio? Fundamente su respuesta.


c)

Si en la Empresa laboran 500 funcionarios En qu porcentaje aument


la planilla de sueldos respecto a la planilla inicial?.

4. Una empresa constructora tiene 2 secciones A y B. Las distribuciones de


ingresos diarios de sus empleados son los siguientes:

82

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Seccin A
Ingresos ($)

Frecuencia

80-100)

30

100-120)

80

120-140)

40

140-160)

10

160-180)

180-200)

Seccin B
Ingresos ($)

Frecuencia

60-90)

10

90-120)

20

120-150)

50

150-180)

20

180-210)

15

210-240)

10

240-270)

Calcular la media aritmtica y varianza de la seccin A y B.

Compare los ingresos.

5. Los estudios sobre aves suelen realizarse mediante captura, anillamiento y


puesta en liberta, de manera que puedan seguirse despus sus movimientos. Una
variable estudiada es la distancia de vuelo desde el punto en que se suelta un ave
recin anillada hasta su primera posada. Los datos contenidos en la Tabla 1
corresponden a dos especies de ave, el petirrojo y la paloma torcaz (fichero
Aves). Con estos datos vamos a realizar un anlisis descriptivo de los para
determinar si hay diferencias en la variable distancia a la primera posada de estas
dos especies

83

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Tabla1. Datos de distancia a la primera posada de dos especies de ave


Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Petirrojo
3926
4877
5855
4980
5681
4761
2134
305
1743
1987
2100
753
1140
3039
8077
2399
1469
2109
3575
1113
4292
1807
2173
3210

Paloma
1219
2438
9568
5355
1692
1362
5081
2542
11634
8132
4959
2316
674
5182
8038
11268
10939
424
5044
9668
9162
6026
8781
3109
36576

6. Las precipitaciones cadas en un pas han disminuido de manera


preocupante durante el ltimo ao. Antes de tomar ninguna medida se
decide hacer un estudio previo para saber si el descenso de las lluvias se
produjo de forma homognea en todo el pas. Para ello se seleccionan
aleatoriamente cinco estaciones meteorolgicas en cada una de las cuatro
regiones del pas, obtenindose los siguientes porcentajes de disminucin
de las precipitaciones en cada una de ellas:
Regin Este

Regin Norte

Regin Oeste

Regin Sur

10.4

12.8

15.6

9.2

12.8

14.2

16.3

10.1

11.2

9.8

10.7

6.3

13.9

14.2

12.8

15

84

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

En qu zona parecen haber disminuido ms las precipitaciones?


7. Se saca una muestra aleatoria de anlisis qumicos de compuestos de
cloruros (Cl-) expresados en unidades de mg/L procedentes de una
muestra de aguas residuales. Estos anlisis se hicieron usando el mtodo
de nitrato de mercurio descrito en el texto Mtodos Estndares. La tabla
con los valores de los cloruros se da abajo:
Tabla mostrando los datos del problema.
17.2 17.1

17 17.1 16.9

17 17.1

17 17.1 17.3 17.2 17.4 17.1 17.1

17 17.3 17.2 16.9


17 17.1

a) Encontrar el promedio.
b) Encontrar la varianza.
c) Encontrar la desviacin estndar.
d) Hacer una tabla de frecuencia mostrando la frecuencia, la frecuencia
relativa y la frecuencia relativa acumulada
e) Hacer un histograma.
f) Qu tanta simetra hay en esta distribucin?
8. En el cuadro se muestra la concentraciones de DBO en una regin
Intervalos

Nmero de

(Conc. DBO)

anlisis

50.00 - 59.99

60.00 - 69.99

10

70.00 - 79.99

16

80.00 - 89.99

14

90.00 - 99.99

10

100.00 - 109.99

10.00 - 119.99

a) Encontrar el promedio.
b) Encontrar la varianza.

85

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

c) Encontrar la desviacin estndar

9. Se le pide a un analista experimentado la evaluacin de dos mtodos


diferentes para la determinacin de trazas de plomo en cido actico glacial,
y se le entrega una muestra que contiene precisamente 1.282 ppm. de Pb,
por

litro (dato

desconocido por

el

analista).

Se realizaron cinco

determinaciones mediante cada mtodo, que dieron los siguientes resultados


para la concentracin del plomo, en partes por milln (ppm):

Mtodo A: 1.34

1.33

1.32

1.34

1.31

Mtodo B: 1.30

1.26

1.30

1.33

1.24

Compar ambos mtodos en cuanto a su exactitud y variabilidad.

10. La siguiente tabla da las emisiones de xidos de azufre (SO2 en toneladas


mtricas) provenientes de 200 plantas siderrgicas localizadas en cierta
regin industrial.

Tabla mostrando los datos.


Emisin de SO2 (ton)

Nmero de plantas

1.00 - 1.02

1.02 - 1.04

26

1.04 - 1.06

52

1.06 - 1.08

58

1.08 - 1.10

39

1.10 - 1.12

15

1.12 - 1.14

1.14 - 1.16

a. Calcular el promedio aritmtico de la distribucin.


b. Calcular la desviacin estndar.
c. Calcular la mediana y la moda de la distribucin.

86

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

CAPITULO IV

DISTRIBUCIONES BIDIMENSIONALES

Si resumir la informacin de una variable es de por si interesante, en investigacin


lo es mucho ms el poner de manifiesto la posible relacin entre dos de ellas.
El anlisis de la relacin de dos variables, X e Y, depende del tipo de variables y
Segn

sean los tipos de cada una de ellas se usa tcnicas estadsticas

diferentes.

4.1 CUALITATIVA-CUALITATIVA.
Cuando las variables de estudio son cualitativas (categricas) o cuantitativas
discretas con poca
variables X

modalidades, se suele presentar las observaciones de las

e Y, mediante pares ordenados

(x i, yi), esta forma de

presentaciones se denomina tablas de contingencia. Las tablas de contingencia


son de doble entrada organizada por filas y columnas y donde se presenta la
distribucin de frecuencias conjuntas de las dos variables.
Dada una variable bidimensional ( X, Y ), consideramos una muestra de
tamao n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores
distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj).
La frecuencia absoluta de un valor (xi, yj) es el nmero de veces que dicho
valor aparece en la muestra. Se representa por f ij , se cumple
k

f
i 1 j 1

ij

La frecuencia relativa de un valor (xi, yj) es el cociente de la frecuencia


absoluta fij entre el tamao de la muestra n, se representa por hij
87

Mtodos Estadsticos

hij

Dr. Cleto De La Torre Duea

fij
,
n

se cumple:

h
i 1 j 1

ij

Distribuciones marginales
Nos indican el comportamiento aislado de cada una de las variables X e
Y que dan lugar a una variable bidimensional.

fi. fi1 fi 2

Frecuencia absoluta marginal de xi,

fil fij
j 1

fi .
n

Frecuencia relativa marginal de xi,

hi.

Frecuencia absoluta marginal de yj,

f. j f1 j f 2 j

h. j

Frecuencia relativa marginal de yj,

f kj fij
i 1

f. j
n

Una tabla de doble entrada de una variable bidimensional sigue la estructura


que se presenta a continuacin, en la que tienen cabida las frecuencias
marginales (representadas en la ltima fila y ltima columna). Puede ser de
frecuencias absolutas o relativas.

y1

y2

.....

yl

ni.

x1

f11

f12

.....

f1l

f1.

x2

f21

f22

.....

f2l

f2.

..

..

..

.....

..

..

fk2

.....

fkl

fk.

f.2

.....

f.l

xk
n.j

fk1
f.1

Ejemplos.

88

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

El gerente de ventas de la firma A desea determinar el comportamiento de las


ventas de cuatro productos (I, II, III y IV), en funcin de la clase de clientes
clasificados en cuatro grupos. Una muestra aleatoria de las ventas suministro la
siguiente informacin.
Grupo de

Producto

clientes

II

III

IV

Profesionales

30

35

55

40

Comerciantes

155

50

125

80

Obreros

130

30

105

50

Amas de casa

35

15

20

45

Las ventas de los cuatro grupos son homogneas?

Solucin
Producto
Grupo de clientes
Prof esionales
Comerciant es
Obreros
Ama de casa
Total

I
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje

30
18.8%
155
37.8%
130
41.3%
35
30.4%
350
35.0%

89

II

III

IV

35
21.9%
50
12.2%
30
9.5%
15
13.0%
130
13.0%

55
34.4%
125
30.5%
105
33.3%
20
17.4%
305
30.5%

40
25.0%
80
19.5%
50
15.9%
45
39.1%
215
21.5%

Total
160
100.0%
410
100.0%
315
100.0%
115
100.0%
1000
100.0%

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

160
140
120
100

80

II
III

60

IV

40
20
0
Profesionales

4.2

Comerciantes

Obreros

Amas de casa

CUALITATIVA-CUANTITATIVA.
Supongamos que tenemos datos numricos para varias categoras, por
ejemplo en un experimento donde hacemos mediciones numricas en dos o
ms grupos. En estos casos, lo que se realiza es un estudio descriptivo de
la variable numrica en cada una de las muestras y se comparamos los
resultados.

Ejemplo

Ejemplo
La estructura financiera de una firma se refiere a la forma en que se dividen
los activos de la empresa por debe y haber, y el apalancamiento financiero
se refiere al porcentaje de activos financiados por deuda. En un estudio
financiero se afirma que el apalancamiento financiero puede utilizarse para
aumentar la tasa de rendimiento sobre la inversin, es decir que, los
accionistas pueden recibir rendimientos ms altos con la misma cantidad de
inversin gracias a su uso. Los siguientes datos muestran las tasas de

90

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

rendimiento utilizando 3 diferentes niveles de apalancamiento financiero y un


nivel de control (deuda cero) de empresas seleccionadas al azar:

Tasas de Rendimiento
Control

Bajo

Medio

Alto

4.6

7.9

7.4

4.5

6.8

6.8

1.8

11.6

5.8

4.2

3.2

9.2

1.6

6.8

11

Son las tasas medias de rendimiento en los niveles de apalancamiento


financiero bajo, medio, alto y control diferentes?
Solucin.
Nivel de
Apalancamiento Mean

Variance CoefVar Median

Alto

8.140

4.158

25.05

7.900

Bajo

3.68

5.13

61.56

3.20

Control

3.840

4.468

55.05

4.200

Medio

7.18

7.07

37.04

6.80

91

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

12

Tasas de rendimiento

10

2
Alto

4.3

Bajo
Control
Nivel de apalancamiento

Medio

CUANTITATIVA-CUANTITATIVA.
Anlisis de dos variables cuantitativas y establecimiento de una relacin
entre ellas. La forma ms sencilla de estudiar la posible asociacin entre
estas variables es el diagrama

de dispersin (Nube de puntos). Si

reconocemos una tendencia, entonces el inters ahora ser el anlisis de


regresin.

Media y varianza
La informacin de las dos variables X e Y se puede resumir usando la media
y la varianza como se muestra a continuacin:
Media de la variable X:

fx

Media de la variable Y:

fy

i i

n
i

Varianza de la variable X: s

2
x

fx

Varianza de la variable Y: s

2
y

fy

La covarianza
92

2
i i

2
i

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Es una medida de la asociacin lineal existente entre dos variables. Resume


la informacin contenida en el diagrama de dispersin. Presenta la siguiente
expresin:
cov( x, y) sxy

fxy
i i

x. y

Si la covarianza est muy prxima a cero, no existe relacin entre las


variables o si existe es marcadamente no lineal, si es positiva, hay
asociacin lineal positiva, y si es negativa, hay asociacin lineal negativa. Sin
embargo, como la covarianza depende de las unidades de medida de las
variables, no nos permite cuantificar el grado de asociacin lineal ni
comparar la asociacin existente entre distintos pares de variables. Para dar
solucin a este problema se obtiene el coeficiente de correlacin.

Correlacin.
Estudia la relacin o dependencia que existe entre dos variables que
intervienen en una distribucin bidimensional.

Coeficiente de correlacin lineal.


Es un nmero que mide el grado de dependencia entre las variables X e Y.
Se mide mediante la siguiente frmula:

s xy
s x .s y

Su valor est comprendido entre 1 y 1.

Si r = -1 r = 1 todos los valores de la variable bidimensional se


encuentran situados sobre una recta.

Si 1< r < 0 se dice que las

variables X e Y estn tambin en

dependencia aleatoria. La correlacin es negativa.

Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin


en dependencia aleatoria.

La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es


tanto ms dbil a medida que se aproxima a 0.

93

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Anlisis de Regresin.
Regresin: conjunto de tcnicas que son usadas para establecer una relacin
entre una variable cuantitativa llamada variable dependiente y una o ms
variables independientes, llamadas predictoras. Estas tambin deberan ser
cuantitativas, sin embargo algunas de ellas podran ser cualitativas.

Modelo de regresin. Ecuacin que representa la relacin entre las variables


Y X

Estimacin de la lnea de regresin usando Mnimos Cuadrados


n

i 1

i 1

Se debe Minimizar el error cuadrtico medio: Q , ei2 ( yi xi )2


n

i 1
n

i 1

n xi yi xi yi
i 1

n xi2 ( xi ) 2
i 1

S xy
S xx

i 1

y x
La pendiente , indica el cambio promedio en la variable de respuesta cuando
la variable predictora aumenta en una unidad adicional.
El intercepto , indica el valor promedio de la variable de respuesta cuando la
variable predictora vale 0. Sin embargo carece de interpretacin prctica si es
irrazonable pensar que el rango de valores de x incluye a cero.
A partir de la recta Y X podemos calcular los valores de y conocidos los
de x. La fiabilidad que podemos conceder a los clculos obtenidos viene dada por
el coeficiente de correlacin: si r es muy pequeo no tiene sentido realizar ningn
tipo de estimaciones.
Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores
reales.
Si r = 1 o r = -1, las estimaciones realizadas coincidirn con los valores reales.

Ejemplos.

94

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

1.- Se realiz una investigacin sobre el efecto del calentamiento global en la


poblacin de un tipo de especie para ellos se ha medido la temperatura anual
media X ( Grados Fa) en varias ciudades y la tasa de mortalidad (Y) de dicho tipo
de de especie. Los datos que obtuvo fueron los siguientes:
X

51.3

49.9

50

49.2

48.5

47.8

47.3

45.1

46.3

42.1

44.2

43.5

42.3

40.2

31.8

34

102..5

104.5

100.4

95.9

87

95

88.6

89.2

78.9

84.6

81.7

72.2

65.1

68.1

67.3

52.5

a)

Trace un diagrama de dispersin.

b)

Ajuste una recta de regresin.

c)

Calcule la correlacin lineal e interprete dicho valor.

Solucin:
110

100

90
80

70

60

50
30

35

40

45

50

X2

X.Y

Y2

51.3

102.5

5258.25

2631.69

10506.25

49.9

104.5

5214.55

2490.01

10920.25

50

100.4

5020

2500

10080.16

49.2

95.9

4718.28

2420.64

9196.81

95

Mtodos Estadsticos

n
i

2
x

2
y

87

4219.5

2352.25

7569

47.8

95

4541

2284.84

9025

47.3

88.6

4190.78

2237.29

7849.96

45.1

89.2

4022.92

2034.01

7956.64

46.3

78.9

3653.07

2143.69

6225.21

42.1

84.6

3561.66

1772.41

7157.16

44.2

81.7

3611.14

1953.64

6674.89

43.5

72.2

3140.7

1892.25

5212.84

42.3

65.1

2753.73

1789.29

4238.01

40.2

68.1

2737.62

1616.04

4637.61

31.8

67.3

2140.14

1011.24

4529.29

34

52.5

1785

1156

2756.25

713.5

1333.5 60568.34 32285.29 114535.33

713.5
44.59375 ;
16

1333.5
83.34375 ;
16

2
i

32285.29
44.593752 29.228
16

114535.33
83.343752 212.277 ;
16

x
y

x y

Dr. Cleto De La Torre Duea

48.5

2
i

sxy

x. y

60568.34
(44.59375).(83.34375) 68.9
16

Recta de regresin
n

i 1
n

i 1

n xi yi xi yi
i 1

n xi2 ( xi ) 2
i 1

S xy
S

2
x

68.9
2.357
29.228

i 1

96

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

y x 83.34375 2.357(44.59375) 21.76


Y X 21.76 2.357 X
r

sxy
sx .s y

68.9
0.8747
29.228. 212.277

Ejercicios propuestos.
1. Se ha medido la superficie en dm2 ocupada por Poa bulbosa (x) y especies
anuales (y) en 5 cuadros de muestreo de 10 dm2 para comprobar si se
asocian o no. Los resultados obtenidos aparecen en la siguiente tabla: 2.
n Poa bulbosa (x)
9
2
nplantas anuales
1
7
(y)
Calcular el coeficiente de correlacin (r).

2
8

1
10

6
4

2. En un estudio de ingeniera del agua relacionado con las reducciones


de los slidos suspendidos, en funcin de la demanda qumica de
oxgeno (DQO), se sac una muestra aleatoria, cuyos datos se dan en
la tabla de abajo. Para lo siguiente:
a. Identificar la variable dependiente y la independiente y hacer una
grfica de DQO versus reduccin de slidos.
b. Calcular la ecuacin de la lnea de regresin.
c. Hacer una tabla de anlisis de varianza que incluya la F crtica y el
valor de p.
d. Validar el modelo candidato, a travs de estadsticas como R2,
PRESS, s y de la estadstica de Durbin-Watson (para la prueba de
auto correlacin de residuales).

e. Evaluar la utilidad del modelo a travs de grficos subjetivos:


Tabla mostrando las mediciones de slidos y la demanda qumica de oxgeno.
(Elaboracin propia)
30

Slidos supendidos
29
33
37
25

32

29
97

27

DQO
31
36

25

31

Mtodos Estadsticos

30
29
34
28
27

30
30
31
31
32

33
34
36
36
36

30
30
29
28
27

35
36
31
33
31

31
30
30
32
32

Dr. Cleto De La Torre Duea

29
28
33
26
27

28
29
30
30
32

32
34
35
34
34

29
29
28
28
26

30
34
30
30
29

30
29
28
31
31

3. En la adsorcin de tierra y sedimento, la magnitud de la acumulacin


en forma condensada de los productos qumicos en la superficie es una
caracterstica importante que influye en la eficiencia de insecticidas y
varios otros productos qumicos. El artculo Adsorption of Phosphate,
Arsenate, Methanearsonate and Cacodylate by Lake and Stream
Sediments: Comparison with Soils (J. of Environ. Qual., 1984, pp. 499504) presenta los siguientes datos en la tabla de abajo. Aqu se toma Y
como la variable dependiente, la cual denota el ndice de adsorcin de
fosfato,

es una de las variables independientes denotando la

cantidad de hierro extrable y,

es otra de las variables independientes

denotando la cantidad de aluminio extrable. (Devore, 2000)

Tabla mostrando los datos del ejemplo.

X2
X1 (Hierro (Aluminio Y (ndice de
Observacin extrable) extrable) adsorcin)
1
61
13
4
2
175
21
18
3
111
24
14
4
124
23
18
5
130
64
26
6
173
38
26
7
169
33
21
8
169
61
30
9
160
39
28
10
244
71
36
11
257
112
65
12
333
88
62
13
199
54
40
Hacer los clculos pertinentes.
98

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

4. En un estudio de laboratorio para ver la relacin entre los slidos


suspendidos y las concentraciones de DBO se sac una muestra con
los datos que se muestran en la tabla de abajo.
Tabla mostrando los datos.
Slidos
suspendidos 18

14

31

21

11

16

26

29

DBO5

17

36

85

62

18

33

41

63

87

55

a) Hacer una grfica que vaya en funcin de la variable dependiente y de la


b) variable independiente.
c) Obtener el modelo de la ecuacin de regresin y trazarla en la grfica.
5. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la
capacidad corporal para absorber hierro y plomo. Participan en el
estudio 10 sujetos. A cada uno se le da una dosis oral idntica de hierro
y plomo. Despus de 12 das se mide la cantidad de cada componente
retenida en el sistema corporal y, a partir de sta, se determina el
porcentaje absorbido por el cuerpo. Se obtuvieron los siguientes datos:
Porcentaje de
hierro, X
Porcentaje de
plomo, Y

17

22

35

43

80

85

91

92

96 100

17

18

25

58

59

41

30

43

58

a) Comprobar la idoneidad del modelo lineal de regresin.


b) Obtener la recta de regresin, si el modelo lineal es adecuado.
c) Predecir el porcentaje de hierro absorbido por un individuo cuyo sistema
corporal absorbe el 15% del plomo ingerido
6.

Un ornitlogo est interesado en conocer la longitud del pico de una


poblacin de aves que estudia. Sin embargo esa medida resulta ms
costosa de tomar que el peso corporal. Por ello quiere saber si ambas
variables se correlacionan para estimar la primera a partir de la segunda.
Longitud
del pico
(mm)

Peso
corporal
(g)
99

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

33.
51
5
59
38.
49
0
54
32.
50
0
55
37.
48
5
53
31.
52
5
57
33.
0
7.
Se sospecha que la 31.
abundancia de la especie de gramnea Poa
0
bulbosa en los pastizales 36.
mediterrneos depende en gran medida de la
5
humedad que hay en el suelo.
34. Para comprobar la hiptesis se realiza un
muestreo con una cuadrcula0 de 20 cm de lado, que se dispone 12 veces al
35.
azar sobre la comunidad de 0pasto. En cada cuadrcula se mide la cobertura
de la especie y la humedad del suelo mediante un TDR.

Obs.
1
2
3
4
5
6
7
8
9
10
11
12

Cobertura
82
98
87
40
116
113
111
83
85
126
106
117

Humedad Rango cob. Rango hum.


42
2
3
46
6
4
39
5
2
37
1
1
65
10
8
88
9
11
86
8
10
56
3
6
62
4
7
92
12
12
54
7
5
81
11
9

100

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

CAPITULO V

PROBABILIDADES

El Clculo de Probabilidades se ocupa de estudiar ciertos experimentos que se


denominan aleatorios, cuya caracterstica fundamental es la incertidumbre
del resultado, esto significa que es imposible predecir los resultados porque hay
ms de uno posible.
En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su
calificativo

probable, considerando probable

a aquellos eventos en los que

tenemos alto grado de creencia en su ocurrencia. En esta lnea probabilidad es


un concepto asociado a una medida del azar.
El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos
eventos inciertos.

Experimento aleatorio.
Es una accin que da lugar a resultados identificables y se caracteriza por:
Todos los posibles resultados son conocidos previamente.
Repeticiones en situaciones anlogas pueden dar resultados diferentes.
No se puede predecir el resultado del mismo antes de realizarlo, es decir,
no se sabe cul de los posibles resultados aparecer al final.

Espacio muestral.
Es el conjunto de todos los resultados posibles del experimento y se denota por
. A cada elemento de se denomina punto muestral w , es decir:

w / w es un punto muestral .

Evento o Suceso Aleatorio.


Un evento aleatorio es un subconjunto del espacio muestral y se denota con
letras maysculas.
101

Mtodos Estadsticos

El evento

Dr. Cleto De La Torre Duea

seguro , es aquel que ocurre siempre al realizar el

experimento.
El evento imposible , es aquel que no ocurre nunca.
Lo s eventos elementales solo tienen un punto muestral.
El evento complementario Ac , esta dado por todo los puntos muestrales
que no estn en A
OPERACIONES DE EVENTOS.
Unin de eventos: Dados dos eventos A y B de un mismo espacio muestral su
unin se representa por A B y es el evento que contiene los elementos que
estn en A o en B o en ambos. El evento A B ocurre si al menos uno de los dos
eventos ocurre.
Interseccin de eventos: Dados dos eventos A y B de un mismo espacio
muestral su interseccin se representa por A B y es el evento que contiene los
elementos que estn en A y B al mismo tiempo.
El evento A B ocurre cuando ambos eventos ocurren simultneamente.
Evento Complemento: El complemento de un evento A se representa por Ac y
es el evento que contiene todos los elementos que no estn en A. El evento Ac
ocurre si A no ocurre.

Definicin clsica de probabilidad:


La probabilidad de un suceso A se calcula como el nmero de
casos favorables al suceso A, partido por el nmero de casos posibles del
experimento aleatorio.

p( A)

casos favorables
casos posibles

Definicin axiomtica de probabilidad:


La probabilidad es una funcin que asigna a cada suceso A un
nmero real que varia entre 0 a 1.
P : y que verifica:
102

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

A p(A)
i) 0 p( A) 1 A
ii) p 1
iii) Si A y B son sucesos incompatibles,

p A B p A p B
Como consecuencia de estos tres axiomas, se verifican adems las
siguientes propiedades:
iv)

p( Ac ) 1 p A

v)

p( ) 0

vi)

Si A B , p( A) p( B)

vii) P( A \ B) P( A) P( A B) , A,B
viii) Si A 1 , A 2 , ...... , A n son incompatibles dos a dos, entonces

p A1 A2 ... An p A1 p A2 ... p An
ix)

Si A, B son dos sucesos cualesquiera, entonces

p A B p A p B p A B
x)

Si A, B son dos sucesos cualesquiera, entonces


p( A) p A Bc p A B

Probabilidad condicionada:
En muchas ocasiones, la verificacin o no de un suceso se estudia en
funcin de otro suceso de cuya verificacin depende o del cual est
condicionado.
Definimos la probabilidad de A condicionada a B como la probabilidad de que
ocurra A sabiendo que ha ocurrido B, la denotamos por P(A|B)
P( A | B)

P( A B)
, p(B) 0.
P( B)

En consecuencia,
p(A B) =p( A) p( B )
A

103

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Independencia.
Dos sucesos A, B se dicen independientes si:
p( A) p( A | B) , o bien p( B) p( B | A)

Es decir, se cumplir que:


p( A B) p( B). p( A)

Si A y B son independientes, entonces A y B C son independientes,


A C y B son independientes, y A C y B C son independientes.

Observacin. Decimos que n sucesos A1, A2,

An son independientes si

para cada par (Ai, Aj), P( Ai Aj ) P( Ai) P( Aj ) si i j , si para cada tro


(Ai, Aj, Ak) P( Ai Aj Ak ) P( Ai) P( Aj ) P( Ak ) si i j k y as
sucesivamente. En general, P( A1 A2 An) P( A1) P( A2) P( An)

Teorema de la probabilidad compuesta.


Dados n sucesos A 1 , A 2 , ......., A se verifica:
P( A1 A2 An) P( A1) P( A2 | A1) P( A3 | A1 A2) P( An | A1 A2 An 1)

Teorema de la probabilidad total.


Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que

p( Ai ) 0 , i 1,....n , entonces la probabilidad de un suceso B


cualquiera es:
n

p( B) p( Ai ) p( B | Ai)
i 1

p( B) p( A1 ) p( B

A1

) p( A2 ) p( B

A2

) ....... p( An ) p( B

An

Teorema de Bayes.
Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que p( Ai ) 0 ,
i 1,....n , entonces para un suceso B cualquiera se verifica:

104

Mtodos Estadsticos

p( Ai | B)

Dr. Cleto De La Torre Dueas

p( Ai B)
p( Ai ) p( B | Ai)
, i = 1, ...., n.
n
p( B)
p( Ai) p( B | Ai)
i 1

p( Ai | B)

p( Ai ) p( B | Ai)
p( A1 ) p( B ) p( A2 ) p( B ) ....... p( An ) p( B )
A1
A2
An

Problemas Resueltos.

1) SUNAT realiza un estudio respecto a

tres cuentas de una empresa para

confirmar o descartar la presencia de irregularidades en el sistema de cobro de


impuestos.
a) Cual es el espacio muestral.
b) Cual es la probabilidad de que dos de las cuentas

presente

irregularidades.
c) Cual es la probabilidad de que la primera cuenta presente irregularidades y
la ultima no presente irregularidades.
d) Cual es la probabilidad de

que por lo menos una cuenta presente

irregularidades
Solucin.
Denotemos con P, si la cuenta presenta irregularidades y con N, si la cuenta
no presente irregulardades.
a) PP
1 2 N3 , PP
1 2 P3 , PN
1 2 N3 , PN
1 2 P3 , N1P2 P3 , N1P2 N3 , N1 N 2 P3 , N1 N 2 N3
b) Sea el evento A: Se presenta dos irregularidades
A PP
1 2 N3 , PN
1 2 P3 , N1 P2 P3
p( A)

n( A) 3

n() 8

c) Sea el evento B: Primera cuenta presenta irregularidades y el ltimo no


presenta.
C PP
1 2 N3 , PN
1 2 N3

p(C )

n(C ) 2

n() 8

d) Sea el evento D: Por lo menos una cuenta presenta irregularidades.


105

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

D PP
1 2 N3 , PP
1 2 P3 , PN
1 2 N3 , PN
1 2 P3 , N1P2 P3 , N1P2 N3 , N1 N 2 P3

p ( D)

n( D ) 7

n() 8

2) Un administrador de empresas con el propsito de incrementar sus utilidades,


disea tres estrategias de marketing A, B y C. En el 40% de las sucursales, se
aplica la estrategia A , de estas en el 1% de los casos
incrementos en las utilidades, en el 30%

no se presentan

de las sucursales se aplica la

estrategia B y en el 2% no se presentan incrementos en las utilidades. En el


resto de las filiales se utiliza la estrategia C, observndose que en el 3% de las
mismas no se presentan incrementos en las utilidades. Si

se selecciona

aleatoriamente una filial de la empresa. Cual es la probabilidad de que :


a)

No presente incrementos en las utilidades.

b)

No presente incrementos en la utilidad y se haya aplicada la estrategia B.

c)

La filial

haya empleado

la estrategia

C, dado

que no se presento

incremento en su utilidad.
Solucin
No incrementa
1%
99%

Incrementa

A
40%

No incrementa

2%
Estrategia

30%

98%
B

Incrementa
3%

30%

No incrementa

C
97%

Sean los eventos.


A: La filial de la empresa, aplica la estrategia A
B: La filial de la empresa , aplica la estrategia B
C: La filial de la empresa , aplica la estrategia C
106

Incrementa

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

D: No se presenta incrementos en la utilidad.

a) p( D) p( A) p( D ) p( B) p( D ) p(C ) p( D )
A
B
C
p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) 0.019 1.9%

b) p(B D) =p( B) p( D )
B
p(B D) =0.3*(0.02) 0.006 0.6%

c) p(C | D)

p(C D)
p(C ) p( D | C )

p ( D)
p( A) p( D | A) p( B) p( D | B) p(C ) p( D | C )

p(C | D)

0.3*(0.03)
0.473 47.3%
0.4*(0.01) 0.3*(0.02) 0.3*(0.03)

3) Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco


divididos en 3 categoras y clasificados segn el pago de deudas bancarias.

Pago de deudas

CATEGORIAS

bancarias

Al da

12

En mora

Si se elige un comercio al azar cul es la probabilidad de que:


a) est en mora?
b) pertenezca a la categora A o B?
c) pertenezca a la categora C o est en mora?
d) pertenezca a la categora A y est en mora?
e) Dado que el pago de sus deudas bancarias esta al da. Cual es la
probabilidad de que la empresa pertenezca a la categora B?.
Solucion.
Sean los eventos:
A: Comercio pertenece a la categora A.
B: Comercio pertenece a la categora B.
107

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

C: Comercio pertenece a la categora C.


D: Pago deudas bancarias en mora. E: Pago de deudas al da.
a) p( D)

n( D) 25

0.5
n() 50

b) p( A B) p( A) p( B) p( A B)

p ( A B)

n( A) n( B) n( A B)

n() n()
n()

16 14 0 30

0.6
50 50 50 50

c) p(C D) p(C ) p( D) p(C D)

p(C D)

n(C ) n( D) n(C D)

n() n()
n()

20 25 8 37

0.74
50 50 50 50

d) p( A D)

n( A D ) 9

0.18
n()
50

n( B E )
P( B E )
n( B E ) 8
n ( )
e) P( B | E )

n( E )
P( E )
n( E )
25
n ( )

4) Se hizo una auditoria a tres empresas A, B, y C, para tal efecto se analiza 3


cuentas de la empresa A, 2 cuentas de la empresa B y 5 cuentas de la
empresa C. La probabilidad de que se presenten

irregularidades en las

cuentas de la empresa A es de 1/3, que se presente en B es de 2/3 y que se


presente en C es de 1/7. Se analiza una cuenta aleatoriamente y se encuentra
que hay irregularidades. Cul es la probabilidad
empresa C?
Solucin
Sean los eventos
A: Cuentas de la s empresa A.
B: Cuentas de la s empresa B.
C: Cuentas de la s empresa C.
E: La cuenta presenta irregularidades.

108

de que se trate de la

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

1/3

3/10

2/3
2/10

B
D

5/10

1/7

C
D

p(C | E )

p(C E )
p(C ) p( E | C )

p( E )
p( A) p( E | A) p( B) p( E | B) p(C ) p( E | C )

3 1
*
21
10
3
p(C | E )

32.8%
3 1 2 2 5 1 64
* * *
10 3 10 3 10 7

Problemas Propuestos.

1.-Un auditor tiene sobre su mesa dos grupos de 20 facturas cada uno. En el
primer lote hay dos facturas con errores de clculo y en el segundo tres. Una
corriente de aire hace que las facturas caigan de la mesa y, al recogerlas, una
del primer grupo se confunde en el segundo. Cul es la probabilidad de que,
al revisar una factura del segundo grupo tenga un error?

2.- Mara Campos, gerente del departamento de crdito de un banco, sabe que la
compaa utiliza 3 mtodos para conminar a pagar a las personas con cuentas
morosas. De los datos que se tiene registrados, ella sabe que 70% de los
deudores son visitados personalmente, 20% se le sugiere que paguen va
telefnica y al restante 10% se le enva una carta. Las probabilidades de recibir
alguna cantidad de dinero debido a los pagos de una cuenta con estos 3
mtodos son 0,75 0,60; y 0,65 respectivamente. La seorita Campos acaba de
109

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

recibir el pago de una de las cuentas vencidas. Calcular la probabilidad de que


la peticin de pago se haya hecho:
a. Personalmente
b. Por telfono
c. Por correo

3.- Una empresa compra cierto tipo de pieza que es suministrada por 3
proveedores: el 45% de las piezas son compradas al 1er proveedor resultando
defectuoso el 1%, el 2do proveedor suministra 30% de las piezas y de ellas es
defectuoso el 2%. Las restantes piezas provienen del 3er proveedor, siendo
defectuoso el 3% de las mismas.
En un control de recepcin de artculos se selecciona una pieza al azar y es
defectuosa. Calcular la probabilidad de que la haya suministrado el 2 do
proveedor.

4.- Una compaa de ventas por correo tiene tres empleados de almacn
denominados U, V y W quienes toman productos de la bodega y los
ensamblan para la subsiguiente verificacin y empaquetado. U comete un error
en un pedido (toma un producto equivocado o la cantidad equivocada del
producto) una de cada 100 veces, V comete un error en un pedido 5 veces de
cada 100 y W se equivoca tres de cada 100. Si U, V y W cubren
respectivamente el 30%, el 40% y el 30% de todos los pedidos. Cul es la
probabilidad de que si se encuentra un error en un pedido, ste haya sido
cometido por V?

1. En una encuesta entre alumnos de maestra en administracin se obtuvieron


los datos siguientes acerca de el principal motivo del alumno para solicitar su
ingreso a la escuela donde est matriculado.
Motivo
Tipo est.
Tiempo

Calidad de la

Costo o

Otros

escuela

comodidad

421

393

76

890

400

593

46

1039

Totales

completo
Tiempo parcial

110

Mtodos Estadsticos

Totales

821

Dr. Cleto De La Torre Dueas

986

122

1929

a. Si un alumno es de tiempo completo. Cul es la probabilidad de que la


calidad de la institucin sea el principal motivo para elegir su escuela?.
b. Si un alumno es de tiempo parcial. Cul es la probabilidad de que la
calidad de la escuela sea el motivo para elegirla?
c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento
que el alumno menciona que la calidad de la escuela es el 1er motivo de su
solicitud. Son independientes los eventos A y B?. Justifique su respuesta.

2. Antes de que un libro sea lanzado al mercado se recogen las reacciones de un


grupo de personas a las que se les permite leer el libro previamente.
Posteriormente a las ventas del libro se les asigna el calificativo de altas,
moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se
muestran en la siguiente tabla:

Reacciones

Favorables

Neutral

Desfavorables

Altas

173

101

61

Moderadas

88

211

70

Bajas

42

113

141

Ventas

a) Cul es la probabilidad de que las ventas sean altas?


b) Cul es la probabilidad de que las reacciones sean favorables?
c) Si la reaccin del grupo es favorable?. Cul es la probabilidad de que las
ventas sean altas?
d) Si las ventas son bajas Cual es la probabilidad de que las opiniones hayan
sido desfavorables?
e) Cul es la probabilidad de que las opiniones sean favorables y las ventas
sean altas?
f) Cul es la probabilidad de que las ventas sean favorables o desfavorables?.
Son esos sucesos mutuamente excluyentes? Justifique

111

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

g) Son los sucesos Opiniones desfavorables y Ventas Bajas independientes?


Justifique.

7. En un estudio realizado para un supermercado se clasifican los clientes en


aquellos que visitan el establecimiento de una manera frecuente u ocasional y
de acuerdo a la frecuencia en que adquieren cierto alimento. En la siguiente
tabla se presentan las proporciones correspondientes a cada uno de los
grupos.
Compra de
productos

Regular

Ocasional

Nunca

Frecuentes

0,12

0,48

0,19

No Frecuentes

0,07

0,06

0,08

Frecuencia
en las visitas

a) Cual es la probabilidad de que un cliente visite frecuentemente el


supermercado y compre regularmente el producto alimenticio?
b) Cul es la probabilidad de que un cliente que nunca compra el producto visite
el supermercado frecuentemente?
c) Son los sucesos Nunca compra productos alimenticios y Visita el mercado
frecuentemente independientes?. Justifique.
d) Cul es la probabilidad de que un cliente realice compras ocasionales?
e) Cul es la probabilidad de que un cliente no realice nunca compras del
producto?
f) Cul es la probabilidad de que un cliente visite el establecimiento
frecuentemente o compre el producto regularmente?

8. Un proceso se puede ejecutar con uno de tres algoritmos posibles, digamos A,


B y C. En el 20% de los casos se emplea el algoritmo A, mientras que los
algoritmos

B y C son usados el mismo nmero de veces. En algunas

ocasiones en que se realiza el proceso se producen atrasos. Esto ocurre el


10% de las ocasiones en que se usa el algoritmo A, siendo estos porcentajes
del 15% en el caso en que se aplica el algoritmo B y el 5% en el caso en que
se usa el algoritmo C.
112

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

a) En qu porcentaje de las ejecuciones del proceso no se producen


atrasos?
b) Qu porcentaje de los atrasos de las ejecuciones del proceso son
atribuibles al algoritmo B?
c) Elegida, al azar, una ejecucin Qu probabilidad hay que no tenga retraso
en su ejecucin y corresponda al uso del algoritmo A o C?
Entre las ejecuciones que no han sufrido retraso en su ejecucin, Cul es el
porcentaje de las que corresponden al uso de los algoritmos A o C

9.- Las previsiones sobre la inflacin de un determinado pas para el prximo ao


la sitan por debajo del 2% con probabilidad 0,65, entre el 2% y el 3% con
probabilidad 0,25 y por encima del 3% con probabilidad 0,1. Si la probabilidad
de crear ms de 700.000 empleos es de 0,7 con inflacin baja, de 0,4 cuando
sta se sita entre el 2% y el 3% y nula en otro caso, calcule:
a) La probabilidad de que se creen ms de 700.000 empleos.
b) Si antes de conocer el dato de inflacin anual, se sabe que se han creado
ms de 700.000 empleos, cul es la probabilidad de cada uno de los tres
niveles de inflacin considerados?

113

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

CAPITULO VI

VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD.

Definicin.- Una variable aleatoria (v.a) X es cualquier funcin, que transforma


cada elemento del espacio muestral , en un numero real.

X :

Al conjunto de posibles valores de X se le llama rango de X (Rx)


Si Rx es finito o enumerable (rango discreto), entonces X es una v.a
Discreta.
Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.

Funcin de Probabilidad.- Si X es una v.a discreta, la funcin de probabilidad


de X viene dada por:

PX x P X x P / X x , tal que

P ( x) 1

xRx

Funcin de densidad.- Si X es una v.a continua, la funcin de densidad de X es


una aplicacin

fX :

0,

tal que

P a X b f X ( x)dx

,tal que

f X ( x)dx 1

Funcin de distribucin.- La funcin de distribucin de una v.a X esta dada por:


FX ( x) P( X x) P( / X () x)

Propiedades.
F es continua por la derecha y es creciente
114

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Si X es una v.a discreta , entonces P a X b F b F a P X a


Si X es una v.a continua , entonces P a X b F b F a
Si X es una v.a continua , entonces F ' ( x)

dF ( x)
f ( x)
dx

lim x FX ( x) 0 y lim x FX ( x) 1

Definicin.La esperanza o media de una variable aleatoria X, denotada por E ( X ) o X se


define segn sea la variable discreta o continua, mediante:
x.P X x , si X es discreta
xRx
EX
x. f ( x)dx, si X es continua
xRx

Propiedades.
El valor esperado de una constante es dicha constante
E a bX a bE X

Definicin.- La varianza de una variable aleatoria X cuya media o esperanza es

X , se define como
V X X2 E X X E X E X E X E 2 X
2

Propiedades.
La raz cuadrada de la varianza se llama desviacin estndar.
X2 E X X2
2

V aX b a 2V ( X )

Desigualdad de Chebyshev.
Si X es una variable aleatoria, entonces para cualquier k se cumple
P X X k X 1

1
k2

115

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Ejercicio resuelto.

1.- Sea X la variable aleatoria definida como la suma de los valores que aparecen
al lanzar dos dados.
a) Determine la distribucin de probabilidad.
b) Calcule la probabilidad P(5<X<8)
c) La media y su varianza.
Solucin.
a)
Resultados en 1

los dos dados


1

10

10

11

10

11

12

X: Suma de los valores de los dos dados


Rx

P(X)

1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36

b)
c)

10

11

12

p(5 X 8) p(6) p(7) 5/ 36 6 / 36 11/ 36

Media

EX

x.P X x , si X es discreta

xRx

1 2 3 4 5 6 5 4
3
2
1
E X 2 3 4 5 6 7 8 9 10 11 12
36 36 36 36 36 36 36 36
36
36
36
252
EX
36

Varianza.

X2 E X E 2 X
2

116

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

1
2
3
4
5
6
5
4
3
2
1
E X 2 22 32 42 52 62 72 82 92 102 112 122
36
36
36
36
36
36
36
36
36
36
36
1974
EX2
36

DISTRIBUCIONES IMPORTANTES.
Existen, como en el caso de la ltima variable ejemplificada, otras variables cuyas
funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para
una serie de aplicaciones. Nosotros citaremos brevemente algunos de los
modelos de mayor importancia.
DISTRIBUCIONES DISCRETAS.
Un experimento de Bernoulli, es un experimento aleatorio con solo dos
posibles resultados: xito y Fracaso. Sea p = P (xito).

Distribucin Binomial. Notacin: X B(n, p).


X = Nmero de xitos en n experimentos independientes de Bernoulli.
Funcin de Probabilidad:
n x

C xn p x 1 p
PX x

, si x 0,1,2,..., n
, en otro caso.

Valor esperado: X np. Varianza: X2 np1 p .

Distribucin de Pascal o Binomial Negativa. Notacin: X BN(r, p).


X = Nmero de ensayos (experimentos independientes de Bernoulli) hasta
conseguir el r-simo xito.
Funcin de Probabilidad:
x r

C x1 1 p p r
PX x r 1

Valor esperado: X

, si x r , r 1, r 2,...
, en otro caso.

r 1 p
r
.
. Varianza: X2
p
p2
117

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Nota: Si r = 1, X se dice que es una variable aleatoria con distribucin


geomtrica de parmetro p, y se le denota por X G(p).

Distribucin Hipergeomtrica. Notacin: X H(N, M, n).


Considrese una poblacin de N elementos, M de los cuales son de un tipo
A, y supongamos se extraen sin reemplazo una muestra de n elementos de
esta poblacin. Entonces:
X = Nmero de elementos de tipo A en la muestra.
Funcin de Probabilidad:

C xM CnNxM

PX x C nN

Valor esperado: X n

, si x 0,1,2,..., n
, en otro caso.

M
M M N n
. Varianza: X2 n 1
.
N
N N 1
N

Notas:
1. En PX se esta usando la convencin que Cab 0, si a > b.
2. Si la eleccin de la muestra fuera con reemplazamiento, entonces

X B n, p

M
.
N

PROCESO DE POISSON: Un conjunto de eventos discretos se dice que esta


generado por un proceso de Poisson de tasa , si para cualquier intervalo I
(usualmente de tiempo) de longitud suficientemente pequea h > 0, se tiene
que:
i) P (ocurrencia de un evento en I) h.
ii) P (ocurrencia de 2 o ms eventos en I) 0.
iii) La ocurrencia de eventos en intervalos disjuntos del tipo I son
independientes.

Distribucin de Poisson. Notacin: X P( = t).


Si se observa un proceso de Poisson de tasa durante t unidades,
entonces
118

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

X = Nmero de eventos en 0, t generados por el proceso.


Funcin de Probabilidad:

x e

PX x x!

, si x 0,1,2,...
, en otro caso.

Valor esperado: X . Varianza: X2 .


DISTRIBUCIONES CONTINUAS.

Distribucin Uniforme. Notacin: X U a,b.


Esta distribucin se da cuando la variable aleatoria X puede tomar
indistintamente cualquier valor en el intervalo a, b.
Funcin de densidad:

1
, si x a, b

f X x b a

0 , en otro caso.

Valor esperado: X

b a 2
ab
2

. Varianza: X
.
12
2

Distribucin Normal. Notacin: X N(, 2).


Funcin de densidad:
1

2 x
1
f X x
e 2
2

Valor esperado: X . Varianza: X2 2 .


Nota: Cuando = 0 y 2 = 1, a X se le denota por Z y se le llama una
variable aleatoria con distribucin normal estndar; vale decir, Z N (0, 1).
Toda v.a. normal

X N (,2) puede convertirse con una v.a. normal

estndar (estandarizarse) a travs de la transformacin:

119

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

EJERCICIOS RESUELTOS

1.- Un auditor analiza 10 facturas, se sabe que por estudios anteriores que el 25%
de las facturas presentan algn tipo de error. Calcular la probabilidad de que:
a) Exactamente 4 facturas presenten error.
b) Ninguno de las facturas presenten error.
c) Todos presenten error.
d) Por lo menos 8 presenten error.
e) A lo sumo 3 presenten error.
f)

Calcular la Media y varianza

Solucin
Consideremos los sucesos
A = La factura presenta error, P (A) = 0.25

A = La factura no presenta error, P ( A ) = 0.75


Se trata de una distribucin Binomial de parmetros B (10, 0.25 )
Sea X la variable aleatoria que representa el nmero de facturas presenta
error

a) P(Exactamente 4 facturas presenten errores) =


10
PX 4 (0.25) 4 (0.75)6 0.1460
4
10
b ) P (Ninguno presenten errores) = PX 0 (0.25)0 (0.75)10 0.0563
0
10
a) P(Todo presenten errores) = PX 10 (0.25)10 (0.75)0 0
10

b) P(Por lo menos 8 presenten error) =

PX 8 PX 8 PX 9 PX 10

120

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

10
10
(0.25)8 (0.75) 2 (0.25)9 (0.75) 0 0.005
8
9

c) P( A lo sumo 3 presenten error ) =


P X 3 PX 0 PX 1 PX 2 PX 3
10
10
10
10
(0.25)0 (0.75)10 (0.25)1 (0.75)9 (0.25) 2 (0.75)8 (0.25)3 (0.75)7 0.7759
0
1
2
3

d) Media y Varianza

np 10 (0.25) 2.5
2 np(1 p) 10(0.25)(0.75) 1.875
2.-

El treinta por ciento de los administradores de supermercados utilizan


estrategias de marketing. Si se selecciona siete administradores, determinar
la probabilidad de que.
a) Ninguno de los 7 utiliza estrategias de marketing.
b) Todos utilizan estrategias
c) Al menos 2 utilizan marketing
Solucin
Consideremos los sucesos:
A = Utilizan software, P(A) = 0.3

A = No utilizan software, P ( A ) = 0.7


Por tanto se trata de una distribucin Binomial de parmetros B (7, 0.3)
Sea X la variable aleatoria que representa el nmero de administradores que
utilizan estrategias de marketing.
7
a) PX 0 (0.3)0 (0.7)7 0.0824
0
7
b) PX 7 (0.3)7 (0.7)0 0.0002
7
7
7
c) PX 2 1 PX 1 1 PX 0 PX 1 1 (0.3)0 (0.7)7 (0.3)1 (0.7)6 0.6705
0
1

121

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

3.- El Ingreso medio diario de los gerentes de empresas en una ciudad es 60


dlares y la desviacin tpica es $6 . Suponiendo que los ingresos estn
distribuidos normalmente.
a) Cual es la probabilidad de que un gerente tenga ingresos menores a $ 64
b) Cual es la probabilidad de que un gerente tenga ingresos de $57 a ms ?
c) Cual es la probabilidad de que un gerente tenga ingresos mayores de $63?
d) Cual es la probabilidad de que un gerente tenga ingresos entre $57 a $65
?
e) Cual es la probabilidad de que un gerente tenga ingresos menores de $50?
f) Cual es la probabilidad de que un gerente tenga ingresos entre $64 a $70
?
g) Si en total hay 200 gerentes en esa ciudad, .Cuantos cabe esperar que
presenten ingresos mayores a $57 y menores de $64?
Solucin.
X: Ingreso de los gerentes.

60 (Media poblacional)

(Desviacin)

a) P( X 64) P(

64

) P( Z

64 60
) P(Z 0.67)
6

(0.67)

z=0.67

0.5 (0.67) 0.5 0.24857=0.74857=74.857%

b) P( X 57) P(

57

) P( Z

122

57 60
) P( Z 0.5) (0.5) 0.5
6

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

(0.5)

z= 0.5

0.19146+0.5=0.69146=69.146%

c) P( X 63) P(

63

) P( Z

63 60
) P( Z 0.5) 0.5 (0.5)
6

(0.5)

z=0.5

0.5 0.19146=0.30854=30.854%

d) P(57 X 65) P(
P(0.50

57

65

(0.83)

z= 0.50

50

57 60
65 60
Z
)
6
6

0.83) (0.50) (0.83) 0.19146+0.29373=0.48519=48.519%

(0.5)

e) P( X 50) P(

) P(

) P( Z

z=0.83

50 60
) P(Z 0.167)
6

123

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

(0.167)

z= 0.167

0.5 (0.167) 0.5 0.0675=0.4325=43.25%

f) P(64 X 70) P(

P(0.67

64

70

) P(

64 60
70 60
Z
)
6
6

1.67) (1.67) (0.67) 0.45254-0.24857=0.20397=20.397%

z=0.67 z=1.67
(0.67)

(1.67)

g) P(57 X 64) P(

P(0.5

57

64

) P(

57 60
64 60
Z
)
6
6

0.67) (0.5) (0.67) 0.19146+0.24857=0.44003=44.003%

Cabe esperar el 44.003% de los gerentes, es decir 0.44003*200 88

EJERCICIOS PROPUESTOS

1.- La empresa de asuntos financieros Tax Service se especializa en las


devoluciones de importes de impuestos federales. Una reciente auditora de las

124

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

declaraciones indic que se cometi un error en el 10% de las que manifest el


ao pasado. Suponiendo que tal tasa contine en este periodo anual y elabore
60 declaraciones. Cul es la probabilidad de que realice:
a) Ms de 9 errores?
b) Por lo menos 9 errores?

2.- Los salarios de los trabajadores en cierta industria son en promedio $11,9 por
hora y la desviacin estndar de $0,4. Si los salarios tienen una distribucin
normal. Cul es la probabilidad de que un trabajador seleccionado al azar:
a) Reciba salarios entre $10,9 y $11,9?
b) Reciba salarios inferiores a $11?
c) Reciba salarios superiores a $12,95?
d) Cul debe ser el salario menor que gana un trabajador que se encuentra
entre el 10% de los trabajadores que ms ganan?
e) Si el dueo de la industria va a aumentarle el salario al 15% de los
trabajadores que menos ganan. Cul ser el salario mximo que deber
ganar un trabajador para ser beneficiado con el aumento?

3.- El volumen de acciones negociadas en la Bolsa es normal con una media de


646 millones de acciones y una desviacin de 100 millones de acciones.
a) Cul es la probabilidad de que el volumen negociado sea menor de 400
millones?
b) Cul es la probabilidad de que el volumen negociado de acciones oscile
entre las 400 y las 600 acciones?
c) Si la Bolsa quiere emitir un boletn de prensa sobre el 5% de los das ms
activos Qu volumen publicar la prensa?

4.- Se toma una muestra de 12 trabajadores de una gran empresa para estudiar
su actitud frente a un cambio en el mtodo de trabajo. Si el 60% de todos los
trabajadores de la empresa estn a favor del cambio. Cul es la probabilidad de
que menos de 5 de los miembros de la muestra estn a favor?

125

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

5.- La tasa real de desempleo es de 15%. Suponga que se seleccionan al azar 15


personas en posibilidad de trabajar.
a) Cul es la cantidad esperada de desempleados?
b) Cul es la varianza y la desviacin estndar de los desempleados?
c) Cul es la probabilidad de que al menos 3 estn desempleados?
d) Cul es la probabilidad de que haya entre 3 y 5 desempleados?

6.- Se sabe que el 30% de los clientes de una tarjeta de crdito a nivel nacional
dejan en cero sus saldos para no incurrir en intereses morosos. En una
muestra de 8 poseedores de esa tarjeta:
a) Cul es la probabilidad de que de 4 a 6 clientes paguen sus cuentas antes de
incurrir en el pago de intereses?
b) Cul es la probabilidad de que 3 clientes o menos paguen sus cuentas antes
de incurrir en pago de intereses?

7.- Sabiendo que la recaudacin diaria de cierto comercio minorista se distribuye


normalmente con un monto promedio de $830 y un desvo estndar de $125:
a) Cul es la probabilidad de que maana se recaude menos de $885?
b) Cul es la probabilidad de que maana se recaude ms de $600?
c) En qu porcentaje de los das se recauda entre $700 y $800?
d) En qu porcentaje de los das se recauda entre $900 y $1500?
e) Cul es el monto no superado en el 20% de los das?
f) Cul es el monto slo superado en el 30% de los das?

8.- Supngase que se tiene una muestra de 20 casos de mediciones de anlisis


de demanda bioqumica de oxgeno (DBO5) provenientes de un muestreo de
un ro, procedentes de 20 lugares diferentes a lo largo de su trayectoria. Si se
sabe que, la probabilidad de que la concentracin de la demanda bioqumica
de oxgeno de 5 (DBO5) das est dentro de los lmites estipulados por las
leyes ambientales es de p = 0.6 (xito), hacer los siguientes clculos:
a. Calcular el promedio y la desviacin estndar de la variable aleatoria
X binomial.

126

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

b. Calcular la probabilidad de que exactamente 10 casos de DBO estn


dentro del lmite estipulado.
9.- La posibilidad de que una muestra de aire contenga un microorganismo letal
es de 10%. Suponiendo que las muestras son independientes, con respecto a la
presencia del microorganismo, encontrar la probabilidad de que:

a. En las 18 siguientes, exactamente 2 contengan el germen.


b. Al menos 4 muestras contengan el germen.
c. La probabilidad de que menos de 7 muestras de aire contengan el
germen,

127

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

CAPITULO VII

INTRODUCCION AL MUESTREO

INTRODUCCION.
El objetivo de la estadstica es hacer inferencias acerca de una poblacin
con base en la informacin contenida en una muestra. Este mismo
objetivo motiva el estudio del problema de muestreo. Consideraremos el
problema particular del muestreo de una poblacin finita (coleccin finita
de mediciones).
En lo referente al muestreo, la inferencia consiste en la estimacin de un
parmetro de poblacin, tal como una medida, un total o una proporcin
con un lmite para el error de estimacin (precisin).
Para un buen entendimiento del problema de muestreo, introduciremos
enseguida, ciertos aspectos tcnicos comunes a las encuestas de
muestreo.

DEFINICION DE TRMINOS, REVISIN DE CONCEPTOS.

Poblacin (UNIVERSO): Es una coleccin finita o infinita de individuos o


elementos. No necesariamente se refiere a una coleccin de organismos
vivientes. En el muestreo, usualmente se distingue el significado de los
trminos universo y poblacin, indicando con el primero un conjunto de
elementos, individuos, unidades, seres y objetos, y con el segundo un
conjunto de mediciones de los mismos.
Una tarea importante para el investigador es definir cuidadosa y
completamente la poblacin antes de recolectar la muestra. La definicin
debe contener una descripcin de los elementos que sern incluidos y
una especificacin de las mediciones que se van a considerar, ya que
estas dos componentes estn interrelacionadas.

Muestra: Es un subconjunto de la poblacin. Una muestra puede ser


probabilstica (aleatoria) o no probabilstica.
128

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Unidad de Muestreo: Es una coleccin de uno o ms elementos de la


poblacin. Las unidades de muestreo cubren toda la poblacin. Una
unidad de muestreo debe ser claramente definida, identificable y
observable.

Unidad Reportante: Es la que suministra la informacin estadstica


requerida o de la cual la informacin la informacin puede ser
convenientemente averiguada.

Marco de Muestreo: Se presenta en forma de lista o mapa de las


unidades de muestreo que conforman la poblacin. Forma el material
bsico para la seleccin de la muestra.
El marco muestral debe contener todas las unidades de muestreo que
conforman la poblacin bajo estudio, y debe excluir unidades de cualquier
otra poblacin.

Parmetro: Es un valor numrico de la poblacin usualmente


desconocido que representa cierta caracterstica de la poblacin.

Estadistico: Es una funcin real de la muestra aleatoria, usado para


estimar un parmetro, si un parmetro se denota con , el estimador se
denotar con .

Estimacin: Es el valor que toma el estimador en los datos de la


muestra.

Error de Estimacin: Es la diferencia absoluta entre el parmetro y su


estimador, es decir | | . Como se puede apreciar, es imposible
conocer con exactitud el error de estimacin, pero podemos, al menos
aproximadamente encontrar un lmite E tal que:
P(| | E )

129

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Para cualquier entre 0 y 1.


Si tiene distribucin aproximadamente normal, entonces para

E 1.96 V () se cumple:
P(| | E ) 0.95

Limite para el error de estimacin: Denotado por E es dado por

E 1.96 V () . El factor E es llamado tambin precisin. Si E esta


expresado en las mismas unidades de la medida de la variable, se le
llama precisin absoluta. Si E est expresado como un porcentaje del
parmetro que se est estimando, se le llama precisin relativa.
Una ves estimado el lmite E, podemos afirmar que el parmetro se
encuentra en el intervalo E , E

con una confianza del 95%. El

intervalo anterior es llamado intervalo de confianza.

Error de Muestreo: Este error se debe a que una muestra no produce


informacin completa sobre una poblacin. Puede ser controlado por un diseo
cuidadoso de la muestra y es estimado en gran parte por el factor E. Por esta
razn, algunos autores denominan al factor E, error de muestreo.

Error de no Muestreo: Son los errores que se introducen imperceptiblemente a


la encuesta y estos son ms difciles de controlar, infortunadamente estos errores
no se pueden medir fcilmente, y aumentan a medida que aumenta el tamao de
la muestra. Los tipos errores no muestrales que suelen presentarse son:
-

Definicin equivocada del problema.

Definicin defectuosa de la poblacin.

Marco imperfecto o desactualizado.

La no respuesta.

El sesgo de respuesta.

Diseo pobre del instrumento de medicin.

Sin embargo, los errores de no muestreo pueden ser controlados mediante una
atencin cuidadosa en todas las etapas de la encuesta.
130

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

ENCUESTA.
La funcin de la encuesta es la medicin del comportamiento, actitudes o
caractersticas del encuestado, que es un individuo de la poblacin en estudio
seleccionado para la muestra.

Diseo de la encuesta
Pasos a seguir:
Definir los objetivos
Determinar el marco
Disear el procedimiento de muestreo
Disear el cuestionario
Disear y realizar el trabajo de campo
Codificar, depurar y analizar las respuestas
Redactar el informe

Diseo de la muestra
El diseo de la muestra incluye:
La eleccin del procedimiento de muestreo
La determinacin del tamao de la muestra
Existen varios procedimientos de muestreo, entre las principales se tiene
muestreo: aleatorio simple, estratificado y sistemtico.

MUESTREO ALEATORIO SIMPLE


Definicin. Si una muestra de tamao n, es seleccionado de una poblacin de
tamao N de tal manera que cada muestra posible tiene la misma probabilidad de
ser seleccionada, el procedimiento de muestreo se llama Muestreo Aleatorio
Simple (M. A. S.)
El M. A. S. puede ser de 2 formas, sin preposicin (muestreo irrestricto aleatorio)
y con reposicin.
131

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Procedimiento de seleccin.
El procedimiento de seleccin de una Muestra Aleatoria Simple (M.A.S.) consiste
en:
i)

Enumerar las unidades de la poblacin, desde 1 hasta N.

ii)

Usando la tabla de nmeros aleatorios seleccionar la primera unidad para


la muestra.

iii)

Continuar la seleccin excluyendo las unidades repetidas (si es sin


reposicin) o incluyendo las unidades repetidas (si es con reposicin) hasta
completar el tamao de muestra n.

Tamao de la muestra
1.

Tamao de muestra para Estimar


Si se desea estimar , con precisin fijada por el investigador, el tamao
de muestra necesario es dado por:
n

Z (12 / 2) * N 2
Z (12 / 2) * 2 ( N 1)

Poblacin finita.

Z (12 / 2) * 2

, Poblacin infinita.

Donde

2 Es la varianza poblacional
En la practica el valor de 2 estimado por S2 a partir de una encuesta
anterior o de una muestra piloto
2.

Tamao de la muestra para estimar P.


De manera simular, la frmula del tamao de muestra n para la estimacin
de p con error mximo de estimacin de y un nivel de confianza del
100(1 - )%:
n

Z (12 / 2) * N * p(1 p)
Z (12 / 2) * p(1 p) ( N 1)

, Poblacin finita.

y si N :
n

Z (12 / 2) * p(1 p)

132

Poblacin infinita.

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

En este caso el valor de esta entre 0 y 1, el valor de P es desconocido, por lo


que debe ser estimado preliminarmente a partir de una encuesta anterior, o de
una muestra piloto. En ltima instancia el valor de P se puede sustituir por 0.5 y
se obtendr un tamao de muestra mayor que el requerido.

Recomendaciones para el uso del M. A. S.


Generalmente el M. A. S. Esta orientada a encuestas de pequea escala y raras
veces a encuestas de gran escala, debido a que otros diseos proporcionan
mayor o igual precisin a menor costo.
En las encuestas por muestreo a gran escala, el M. A. S. es usado como
parte de un diseo de muestreo mucho ms complejo.
El M. A. S. es muy eficiente cuando la poblacin es homognea.

MUESTREO ESTRATIFICADO.
Una muestra estratificada es la obtenida mediante la separacin de los elementos
de la poblacin en grupos

heterogneos disjuntos, llamados estratos y la

seleccin posterior de una muestra aleatoria simple en cada estrato.


Consideremos una poblacin de tamao N, la cual es dividida en k estratos (sub
poblaciones) de tamaos Ni, i=1,2., k, tal que N N1 N2 ... Nk

Dia
gn
st
ico
De
scri
k
pci
Z (12 / 2) * Ni2 pi (1n
pi ) / wi
i 1
,
n
de
k
2
2
2
N Z (1 / 2) * Nlos
i pi (1 pi )
i 1 snt
om i
es wi el % de observaciones asignados al estrato
as
o
cau
133
sas
El tamao de muestra se estima mediante:

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

El tamao de muestra necesario de cada estrato, se puede obtener por afijacin


proporcional al tamao de cada estrato, es decir:
N
ni n * i
N

n * wi , i 1,..., k

MUESTREO SISTEMATICO
Definicin.- Una muestra obtenida al seleccionar aleatoriamente un elemento de
los primeros k elementos en el marco y despus cada k-simo elemento, se
denomina muestra sistemtica de intervalo de seleccin k.
El muestreo sistemtico puede ser de dos formas, muestreo sistemtico simple y
muestreo sistemtico circular.
Procedimiento de seleccin del muestreo sistemtico simple.
Una muestre sistemtica simple se obtiene cuando el intervalo de seleccin k es
exactamente un numero entero.
El procedimiento de seleccin de una muestra sistemtica simple consiste:
i)

Las unidades del marco deben ser ordenados en magnitud de acuerdo


con algn esquema de ordenacin (poblacin ordenada) es base al orden
se establece la numeracin desde 1 hasta N

ii)

Determinar el intervalo de seleccin

N
(k exactamente un numero
n

entero)
iii)

Seleccionar un numero aleatorio entre 1 y k (arranque aleatorio) sea a el


arranque aleatorio elegido, entonces los elementos de la muestra
sistemtica, son los que ocupan las posiciones en el marco:
a, k+a, 2k+a, 3k+a,......(n-1)k+a

EJERCICIOS RESUELTOS

1.

Un investigador, desea hacer una estimacin del nivel de contaminacin por


plomo en una poblacin de 2500 habitantes, con 99% de confianza,
suponiendo que el mximo error permitido es de 1, adems de una muestra
piloto se obtuvo una varianza de 25. Qu tamao de muestra necesitara
para investigar?
134

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Solucin.

N 2500, 1, 2 25, Z(1 / 2) 2.58


n

2.

Z (12 / 2) * N 2
Z (12 / 2) * 2 ( N 1)

2.582 *2500*25
2.582 *25 (2500 1) 1

156.08 157

Por encargo del Ministerio del Medio Ambiente, un grupo de especialistas


debe realizar un estudio, para determinar el porcentaje de personas
expuestas a radiacin solar en una ciudad. La estimacin debe presentar un
nivel de confianza del 95% y un margen de error de 5%, suponiendo que la
poblacin es de 25000 Cual es el tamao de muestra mnimo para este
estudio?

Solucin.
Consideremos que no se tiene ningn estudio de este tipo, por tanto P 0.5 ,
del problema: N 25000, 0.05, z(1 / 2) 1.96
n

Z (12 / 2) * NP(1 P)
Z (12 / 2) * P(1 P) ( N 1)

1.96 *25000*0.5(1 0.5)


n
1.96 *0.5(1 0.5) (25000 1) 0.05
2

3.

378.361 379

Un funcionario del sector de Salud, desea estimar el porcentaje de personas


que presentan problemas de desnutricin en cierta regin, con un nivel de
confianza del 95% y un error del 5%. Suponiendo que en estudio realizado
hace 10 aos, el porcentaje estimado de personas con desnutricin fue de
15% Cual debe ser el tamao de muestra para este estudio?

Solucin.
La poblacin materia de estudio, no es finita, por tanto la relacin para
estimar el tamao de muestra es:

135

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Z (12 / 2) * P(1 P)

Del problema se tiene los siguientes datos


P 0.15, 0.05, z(1 / 2) 1.96

4.

1.962 *0.15(1 0.15)

0.05

195.92 196

Un grupo de especialistas en Salud, planifican realizar un estudio sobre el


porcentaje de personas que presentan problemas de cncer de piel por
efecto de radiacin ultravioleta, en una regin del Per. Suponiendo que
esta regin se divide en tres ciudades, cuyo tamao poblacional se muestra
en el cuadro siguiente:

Provincia

Tamao de poblacin.

2000

1200

5000

Total

8200

Considere que el tamao de muestra es 245, calcule el tamao de muestra


por cada ciudad, necesario para este estudio.

Solucin.
En este ejemplo, las ciudades forman los estratos:

Ciudad

Ni

wi

2000

=2000/8200=0.24

1200

=1200/8200=0.15

5000

=5000/8200=0.61

Total

N=8200

n=245.
Usando la relacin,
136

Mtodos Estadsticos

N
ni n * i
N

Dr. Cleto De La Torre Dueas

n * wi , i 1,..., k , Se determina el tamao de muestra para cada

ciudad.
N
nA n * A n * wA 0.24*245 59.76 60
N
N
nB n * B n * wB 0.15*245 35.85 36
N
N
nC n * C
N

n * wC 0.61*245 149.39 149

MONITOREO AMBIENTAL
Se define como monitoreo a todas las metodologas diseadas para muestrear,
analizar y procesar en forma continua las concentraciones de (sustancias,
alimentos, agua,) en un lugar establecido y durante un tiempo determinado.
Las principales razones para el establecimiento de programas de monitoreo de
algn proceso tienen que ver con la necesidad de verificar si se cumple con las
condiciones mnimas para los usos requeridos.
El programa de monitoreo contempla las acciones de observacin, Muestreo,
Medicin y el Anlisis de datos tcnicos
OBJETIVOS DEL MONITOREO
Determinar (Determinar la congruencia con las normas y los criterios
legales).
Proporcionar (Proporcionar informacin de fuentes y riesgos de..).
Llevar a cabo (Llevar a cabo evaluaciones de tendencias a largo plazo).
Medir (Medir los efectos de las medidas de control ..).
Estudiar (Estudiar las reacciones..)
Calibrar y evaluar.
ESTRATEGIA DE MONITOREO
Definicin de parmetros a evaluar. Parmetros depender de los
objetivos del estudio u objetivos del monitoreo,

137

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Definicin de nmero y sitios de muestreo(Localizacin de sitios de


muestreo, Densidad o nmero de puntos de muestreo, Requerimientos del
sitio de muestreo)
Determinacin de tiempos de muestreo(Duracin del programa, Frecuencia
de muestreos, Tiempos de toma de muestras
Seleccin de equipos de muestreo y tcnicas de anlisis (Monitores
automticos, Sensores remotos, Bioindicadores)
DISEO DEL MONITOREO
Cada programa de monitoreo, debe elaborarse de manera particular,
debido que el monitoreo es un instrumento para mantener un diagnostico
actualizado de una situacin especfica, por eso es muy importante
asegurar el resultado de las muestras, seleccionando adecuadamente los
parmetros.
El monitoreo es una parte importante de la evaluacin global, los
resultados analticos deben ser los ms exactos posibles, los tcnicos que
participen sercapacitados, actualizados y con experiencia.
En el diseo del programa de monitoreo se ha establecido plantearse
interrogantes para un buen anlisis, tales como:
Cuales son las etapas del proceso.?
Cules son los objetivos del trabajo?
Qu parmetros se deben evaluar?
Qu equipo (s) se deben seleccionar?
Frecuencia de las mediciones?
Mediciones in situ?
Qu mtodos analticos se pueden aprovechar?
Cmo y donde realizar los anlisis de las muestras?
Cmo evaluar los posibles errores?
Tiempo requerido?
Cmo interpretar y reportar los resultados?

138

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

PROTOCOLO DE MONITOREO DE LA CALIDAD SANITARIA DE LOS


RECURSOS HDRICOS SUPERFICIALES
PARMETROS ESTABLECIDOS EN EL MONITOREO
Los

parmetros

antropognicas,

se

seleccionaran

fuentes

en

contaminantes

funcin
y

teniendo

las
en

actividades
cuenta

la

Clasificacin de los Recursos Hdricos del Pas.


Parmetros de medicin en campo: pH, Temperatura, Conductividad,
Oxgeno Disuelto.
Parmetros determinados en laboratorio
Fsicos: Turbiedad, Slidos totales y slidos suspendidos.
Iones principales: (Nitratos, Sulfato, Fosfatos, cianuro WAD y Libre,
cloruros, nitritos, dureza total y clcica, alcalinidad).
Metales (Ba, Cd, Cr, Pb, Zn, Mn, Fe, Cu Hg y As).
Parmetros Biolgicos
Coliformes Totales.
Coliformes Termotolerantes.
Fitoplancton.
Perifiton
Parsitos
Parmetros Orgnicos (depender de las actividades y usos que tenga el
cuerpo de agua)
Aceites y grasas.
Hidrocarburos totales de petrleo
DBO5
PLAN DE MUESTREO
Procedimiento para seleccionar, extraer, conservar, transportar y
preparar las porciones a separar de la poblacin en calidad de
muestras.
El proceso de muestreo debe estar planificado, detallado y escrito y
el plan de muestreo debe incluir:

Donde realizar la toma de la muestra

Quien tiene que realizar la toma de la muestra


139

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Que procedimiento debe seguirse en la toma de la muestra

TIPOS DE MUESTRAS
Representativa: composicin y propiedades similares al conjunto de
la muestra.
Selectiva: obtenida en el muestreo de determinadas zonas.
Sistemtica: obtenida segn un procedimiento sistemtico.
Aleatoria: obtenida al azar.
Compsita : formada por dos o mas submuestras
TIPOS DE MUESTREO
Intuitivo: Basado en la experiencia en algn tipo particular de
muestra
Estadstico: Mediante un modelo estadstico previamente validado
Sistemtico: Siguiendo un protocolo en el que se especifica: tipo, tamao,
frecuencia, periodo del muestreo y lugar
En la planificacin del muestreo , han de considerarse los siguientes
aspectos:
Cuando, donde y como recoger la muestra
Equipos de muestreo : mantenimiento y calibracin
Contenedores de la muestra : limpieza , adicin de estabilizantes y
conservacin
Transporte de la muestra
Pretratamiento de la muestra : secado, homogeneizacin y manejo
de la muestra
Submuestreo
Sistema informativo en el laboratorio
Seleccin de los puntos y tiempos de muestreo :
Se toman incrementos de muestra en puntos preseleccionados al
azar, siguiendo un programa de muestreo, en el que se incluyan
estos puntos.
Representatividad de la muestra
La concentracin de los analitos en la muestra obtenida debe ser
idntica a la concentracin en la muestra real en la posicin y tiempo
140

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

en la que se ha realizado el muestreo y que esta no vare hasta la


ejecucin de los anlisis.
Etiquetado de la muestra
Las muestras se etiquetan en el momento en que son tomadas con
la siguiente informacin:

Persona que realiza el muestreo

Da , hora y lugar

Informacin sobre la metodologa seguida

Incidencias durante el muestreo.

Subdivisin de la muestra
La muestra bruta obtenida resulta de la mezcla de un cierto nmero
de unidades de muestreo (incrementos).
El nmero de unidades de muestreo depende ms de :

Tamao de las partculas

Grado de heterogeneidad del material

Exactitud requerida en los resultados de la cantidad de


muestra sometida al muestreo, por lo que esta se somete a
un proceso de subdivisin.

PRECAUCIONES EN EL TRANSPORTE
Evitar la exposicin a humedades extremas y mantenerlas a 4 C.
Las muestras biolgicas o de alimentos es necesario transportarlas
congeladas
PRECAUCIONES PARA LA CONSERVACION
Reducir los riesgos de alteraciones por contacto con la atmsfera,
absorcin y oxidacin
Evitar su exposicin al aire ya la luz y su manipulacin
Los slidos se mantienen secos eliminando el agua en una estufa
Las muestras biolgicas se congelan en nitrgeno lquido o se
liofilizan
El tratamiento de los lquidos depende del tipo de anlisis
Las muestras se almacenan por dos motivos:
141

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Porque su anlisis no va a ser inmediato


Para guardar un duplicado con el fin de hacer un chequeo de

los

resultados obtenidos en los anlisis iniciales


Para conservar las muestras durante largos periodos de tiempo en sus
recipientes es recomendable:
Que el aire contenido en el espacio libre del recipiente sea mnimo
Que el material sea hidrfobo
Que su superficie sea lisa y no porosa
Los materiales utilizados para almacenar las muestras son de tres tipos :
Polimeros ( tefln, polietileno, polipropileno, plexigls y goma de
silicona )
Vidrios (cuarzo sinttico y borosilicato de vidrio)
Metales (papel de aluminio, platino y titanio de elevada pureza)
Las muestras se etiquetan con la siguiente informacin :
Numeracin de la muestra
Descripcin del material
Lugar de muestreo
Fecha y hora del muestreo
Muestreador y mtodo de muestreo
Informacin adicional (pH, temperatura, etc.)
Esta informacin se registra en el laboratorio junto otra adicional:
Smbolo de la muestra
Naturaleza de la muestra
Anlisis requeridos
Lugar y condiciones de conservacin
Entidad que solicita los anlisis
REQUISITOS DE LOS LUGARES A SELECCIONAR
Representatividad.
Los parmetros en la muestra deben tener el mismo valor que el que se
encuentra en el cuerpo de agua muestreada tanto en el lugar como en el
momento en que se muestreo, y adems, el nmero y tipos de parmetros

142

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

seleccionados deben de representar a las actividades del lugar; para ello, se


recomienda tomar la muestra en el lugares homogneos.
Lugar apropiado para la medicin de flujo
Los puntos de toma de muestras debern en lo posible estar cerca de una
estacin de medicin de caudal, lo ideal sera que la toma de muestra sea en el
mismo lugar de la estacin de medicin de flujo, debido a que, la medicin del
caudal es muy importante para la evaluacin de la calidad del agua; es necesario
tener en cuenta que si el monitor tiene que realizar un largo procedimiento de
medicin de caudal emplear ms tiempo en cada punto de muestreo.
Accesibilidad
Para acceder a los puntos de toma de muestra, normalmente se transporta una
carga apreciable de equipo de muestreo y muestras de agua, la falta de
accesibilidad bajo todas las condiciones meteorolgicas, determina que el monitor
tome un menor nmero de muestras por da de trabajo. La accesibilidad es por lo
tanto una consideracin importante, para ello, si es necesario se deber enviar
previamente un grupo de personal de apoyo que prepare una ruta de acceso
segura (caminos peatonales, trochas, etc.).

143

Mtodos Estadsticos

144

Dr. Cleto De La Torre Duea

Mtodos Estadsticos

145

Dr. Cleto De La Torre Dueas

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

CAPITULO VIII

ESTIMACION POR INTERVALOS Y PRUEBAS DE HIPOTESIS

DISTRIBUCIONES MUESTRALES.
DISTRIBUCION NORMAL.
En este captulo abordaremos el estudio de la distribucin normal y de otras
distribuciones asociadas a funciones de una muestra al azar de esta variable.
El porqu de la importancia de la distribucin normal se ilustra a travs de las
siguientes propiedades y distribuciones.
PROPOSICION
1. Teorema del lmite central (TLC).

Si X 1 , X 2 ,..., X n son n v.a.s

independientes, donde cada Xi tiene la misma distribucin de valor


esperado y varianza 2, entonces para n suficientemente grande (en la
prctica n 30) se cumple que aproximadamente

X i n
Z i 1
n

X
N (0, 1).
/ n

2. Aproximacin de la Binomial por la Normal. Si X B (n, p) y n es


suficientemente grande, entonces aproximadamente:

X np
N (0, 1).
np1 p

Aqu, para el clculo de probabilidades, se recomienda utilizar la llamada


correccin por continuidad: Si a b son dos nmeros naturales, entonces
aproximadamente:

b 12 np
a 12 np
1
1

Fz
.
Pa X b P a X b Fz
np1 p
np1 p
2
2

146

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

LA DISTRIBUCION CHI-CUADRADO.
Una v.a. X tiene distribucin chi-cuadrado con n grados de libertad, y se le
denota por

X 2 (n).

PROPOSICION.
1. Si Z N (0, 1), entonces Z2 2 (1).
2. Propiedad reproductiva. Si 12 22 ... k2

son k variables aleatorias

independientes con distribuciones chi-cuadrado de respectivamente

n1 , n2 ,..., nk grados de libertad, entonces


k

2 i2
i 1

Es tambin una v.a. con distribucin chi-cuadrado de n i 1 ni grados de


k

libertad.
3. Si X 1 , X 2 ,..., X n es una m.a de X N (,2), entonces

n 1S 2

2 (n -1).

LA DISTRIBUCION T DE STUDENT.
Una v.a. X tiene distribucin t de Student con n grados de libertad, y se le
denota por

X t(n).

PROPOSICION.
1. Sea X t(n). Si n es grande, entonces aproximadamente X N (0, 1).
2. Si Z N (0, 1) y 2 2 (n) son v.as independientes, entonces

t(n). En particular, dada una m.a. X 1 , X 2 ,..., X n de X N (,2),

se cumple que:

X
t (n -1).
S/ n

147

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

LA DISTRIBUCION F DE FISHER.
Una v.a. X tiene distribucin F de Fisher con n grados de libertad en el
numerador y m grados de libertad en el denominador, y se le denota por X F
(n, m).
PROPOSICION.
1. Si X F (n, m), entonces

1
X

F (m, n).

2. Si 12 2(n) y 22 2(m) son v.as independientes, entonces


F

12 / n
F (m, n). En particular, si X 1 , X 2 ,..., X n es una v.a. de X N
22 / m

(1,12), e Y1 , Y2 ,..., Ym una m.a de una v.a. Y N (2,22), donde X e Y son


independientes, entonces

S12 22
S 22 12

F (n -1, m - 1),

Siendo S12 y S 22 las varianzas muestrales asociadas a las poblaciones


estadsticas determinadas por X e Y, respectivamente.
Nota: La distribucin normal estndar, t de Student, chi-cuadrado y F de
Fisher poseen todas tablas en la que se tabulan algunos valores de su
funcin de distribucin.
INTERVALOS DE CONFIANZA.
Un problema habitual es el de estimar parmetros que ayuden a caracterizar
una variable.
Existen dos tipos de estimacin Puntual e intervalar o de intervalo, en la
estimacin puntual, se asigna un valor nico a un parmetro poblacional, En la
estimacin por intervalo, en lugar de indicar simplemente un nico valor como
estimacin del parmetro, lo que haremos es ofrecer un intervalo de valores
que sea asumible con cierta probabilidad por el parmetro que queremos
estimar.
-Intervalo de confianza: Es el intervalo de las estimaciones (probables) sobre
el parmetro.

148

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

-Lmites de los intervalos de confianza: Son los dos valores extremos del
intervalo de confianza.

Definicin.
Un intervalo de confianza (IC) al 100(1 - )% para un parmetro poblacional
de una v.a. X es un intervalo con estadsticas L1 y L2 en los extremos (IC =
L1, L2) tal que PL1 L2 1 .
Intervalo de confianza para la media
El IC al 100(1 - )% para , cuando 2 es conocida, se obtiene usando
como pivote a Z

X
N (0, 1) y vienen dado por
/ n
X z1

X z1

Donde z1 denota al valor de la distribucin normal estndar, X es el


2

valor de la media muestral.

Con
trol
del
Pro
nst
ico
Acci
ones
para
supe
Pronsti
rar
co
las
Elcons
IC al 100(1 - )% para , cuando 2 es desconocida seConsecu
obtiene usando
encias
de
ecue
X
los
ncia pivote a T
como
t (n -1) y vienen dado por
problema
S
/
n
s del
s
probl
ema
149

Mtodos Estadsticos

X t(1 , n 1)
2

Dr. Cleto De La Torre Duea

S
S
X t(1 , n 1)
,
2
n
n

Donde t1 n 1 denota al valor de la distribucin t de Student con n 1


2

grados de libertad y la varianza muestral dado por S 2

x x
i 1

n 1

Medicina

Pobla
cin
Muest
ra

Infere
ncias

For
mul
aci
n de
preg
unta
s

Que
tan
reales
es.
No
prese
nta
RAM

Intervalo de confianza para la varianza 2

n 1S 2
El IC al 100(1 - )% para , se obtiene usando como pivote a W
2

2 (n -1) y vienen dado por

n 1 S 2 2 n 1 S 2
12 n 1
2 n 1

Donde 2 n 1 y 12 n 1 denotan a los valores en la distribucin chi2

cuadrado con n 1 grados de libertad y la varianza muestral dado por:


n

S2

x x
i 1

n 1

150

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

2%

3%
No
prese
nta No
RAM prese
nta
40%
RAM
30%

30%
1%
Prese
nta
RAM

Presenta
RAM

Presenta
RAM

Intervalo de confianza para la razn de dos varianzas 12 / 22


El IC al 100(1 - )% para 12 / 22 , se obtiene usando como pivote a
S12 / 12
F 2 2
S2 / 2

F n1 1, n2 1 y vienen dado por

S12
12 S12
f / 2,n2 1, n1 1 2 2 f1 / 2,n2 1, n1 1
S22
2 S2
Donde

f / 2,n2 1, n1 1

distribucin F.

f1 / 2,n2 1, n1 1

denotan

a los

valores en la

S12 y S 22 son las varianzas de dos muestras aleatorias

independientes de tamaos n1 y n2
Intervalo de confianza para la diferencia entre dos medias. 1 2
El IC al 100(1 - )% para 1 2 , cuando 12 y 22 es conocida se obtiene
usando como pivote a z

X 1 X 2 ( 1 2 )

12
n1

22
n2

151

y vienen dado por:

Mtodos Estadsticos

12

( X1 X 2 ) z(1 / 2) *

n1

22
n2

Dr. Cleto De La Torre Duea

1 2 ( X1 X 2 ) z(1 / 2) *

12
n1

22
n2

Intervalo de confianza para la proporcin p


El IC al 100(1 - )% para p , se obtiene usando como pivote a

p p
p 1 p
n

N (0, 1),

y vienen dado por:


p 1 p
n

p z1

p p z1

p 1 p
n

Intervalo de confianza para la diferencia entre dos proporciones p1 p2


El IC al 100(1 - )% para p1 p2 , se obtiene usando como pivote a

( p1 p2 ) ( p1 p2)
p1 1 p1
n1

N (0, 1),

p2 1 p2
n2

y vienen dado por:

( p1 p2 ) z1 *
2

p1 1 p1
n1

p2 1 p2
n2

( p1 p2 ) ( p1 p2 ) z1 *
2

p1 1 p1
n1

EJERCICIOS RESUELTOS
1.- En una muestra de 250 empresas se estimo el monto de recaudacin en un
da, obtenindose un monto medio de 5900 soles y una desviacin tpica de
94 soles. Obtener un intervalo de confianza (al 95%) para el monto medio de
recaudacin diaria.
Solucin.

n 250, X 5900, 94, z1 1.96


2

Reemplazando en la relacin
X z1

X z1

152

p2 1 p2
n2

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

1
/2

/2

Z(1/2
5900 1.96

Z(1/2

94
94
5900 1.96
250
250

5888.34 5911.65

8.

Se realizo un estudio en 30 minimercados sobre el pago por derecho de


impuestos, obtenindose un pago medio de 256 soles y un desvo de 32
soles. Encontrar el intervalo de confianza para el 95%.
Solucin.

n 30, X 256, s 32, t(1 ,n1) 2.045


2

Reemplazando en la relacin
S
S
X t(1 , n 1)
,
2
n
n
32
32
256 2.045
256 2.045
30
30
X t(1 , n 1)
2

244.05 267.9

9.

Un investigador entrevisto a 200 profesionales sobre el conocimiento que


estas tienen de la inversin en la bolsa de valores de Lima, de los cuales 140
afirman que conocen adecuadamente. Construir un intervalo de confianza
del 95% para la proporcin de profesionales que conocen aspectos de
inversin de BVL.
Solucin.

140
0.7 , z1 1.96 , n=200
2
200

153

Mtodos Estadsticos

p z1

p 1 p
n

0.7 1.96
10.

p 1 p
n

p p z1

0.7(10.7)
200

Dr. Cleto De La Torre Duea

p 0.7 1.96

0.7(10.7)
200

SUNAT con el propsito de incrementar la recaudacin fiscal, disea dos


sistemas (A y B) de control para cumplimiento de entrega de facturas o
boletas. El sistema A, se utiliza para controlar a 250 empresas, el sistema
B a 200 empresas. Despus de un periodo de vigilancia de los sistemas se
observo que 75 empresas vigiladas con el sistema A no entregan boletas o
facturas A y 80 vigiladas con el sistema B tambin incumplieron con la
entrega de facturas. Utilizando un intervalo de confianza del 95% Se puede
aceptar que los dos sistemas presentan similar eficiencia ?

Solucin.
Sistema A

p1

75
0.3 , n1 250
250

Sistema B

p2

80
0.4
200

, n1 200

z1 1.96
2

( p1 p2 ) z1 *

p1 1 p1
n1

(0.3 0.4) 1.96*

0.310.3
250

p2 1 p2
n2

0.410.4
200

( p1 p2 ) ( p1 p2 ) z1 *
2

( p1 p2 ) (0.3 0.4) 1.96*

p1 1 p1
n1

0.310.3
250

-0.18 ( p1 p2 ) -0.011
El intervalo contiene solo valores negativos, entonces.

( p1 p2 ) 0 p1 p2
De la relacin anterior se concluye que el sistema de control A presenta
menor nivel de eficiencia que el sistema B.
154

p2 1 p2
n2

0.410.4
200

Mtodos Estadsticos

11.

Dr. Cleto De La Torre Dueas

Se realizo un estudio sobre las utilidades que presenta una empresa en


dos provincias del Per ,con tal fin se selecciona aleatoriamente un grupo de
50

cuentas de la provincia A y 40 c de cuentas de la provincia

B,

observndose que en promedio en la ciudad A se genera una utilidad de


13

miles de soles y 15 miles de soles en la ciudad B y las desviaciones

estndar de la ciudad A y B respectivamente son 3 y 4 miles de soles.


Utilizando un intervalo de confianza del 95% para la diferencia de medias
Podemos concluir que las utilidades de la empresa en la ciudad

B es

mayor que la de A?
Solucin.
Ciudad A
x1 13, 1 3, n1 50

Ciudad B
x2 15, 2 4, n2 40

z1 1.96
2

( X1 X 2 ) z(1 / 2) *

(13 15) 1.96*

12
n1

22
n2

1 2 ( X1 X 2 ) z(1 / 2) *

12
n1

22
n2

9 16
9 16

1 2 (13 15) 1.96*

50 40
50 40

3.49 1 2 0.50

Como 1 2 0 , entonces 1 2 .

EJERCICIOS PROPUESTOS
1.

Los desechos industriales y la basura que se descargan en los ros


absorben oxgeno y por lo tanto reducen la cantidad de oxgeno disuelto
disponible para los peces y otras formas de vida acutica. Segn
investigadores de la Escuela de Biologa de una universidad estatal se
requiere un mnimo de 5 ppm de oxgeno disuelto para que el contenido de
oxgeno sea suficiente para la vida acutica. Durante los meses de
diciembre y enero se tomaron 45 muestras de agua, dando como resultado
155

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

una media aritmtica de 4.352 ppm y una desviacin estndar de 1.261


ppm. Hay suficiente evidencia en los datos que indique que el contenido
de oxgeno disuelto es menor que 5 ppm?. =0.025.

2. Un experimento para reducir el consumo de gasolina (para que se contamine


menos el medio ambiente, especialmente, con CO2 que est calentando la tierra
y cambiando el clima) se hizo un estudio para comparar dos tipos de mquinas A
y B. El rendimiento, en kilmetros por litro se midi. Para esto se seleccion una
muestra de 50 unidades del tipo mquina A y otra muestra de 50 unidades tipo
mquina B. El promedio de gasolina consumida para la mquina A fue de
Km. por litro y el promedio para la mquina B fue de

= 36

= 42. Las desviaciones

estndar fueron de 6 y 8 Km. para las mquinas A y B, respectivamente. Hacer lo


siguiente:
(a) Encontrar el 95% de intervalo de confianza para (

).

(b) Hacer una prueba de hiptesis para decidir si hay diferencia entre los dos
promedios poblacionales.

3.- Un grupo ambiental afirma que los incidentes de las aves que chocan con los
aviones son muy raros, es decir, como para justificar la matanza de aves en los
aeropuertos. Sin embargo, un grupo de pilotos aviadores afirman que, en el
despegue de los aviones, en el 10% de los casos, las aves chocan contra el
avin. Usar = 0.05 para probar esta afirmacin. La muestra es de 150
despegues abortados de aviones, de los cuales 5 se debieron a choque contra las
aves.

4.- Se realiza un estudio Presencia de material particulado (PM10) en dos distritos


de Lima
Ate

120

90

110

105

95

60

70

San

70

53

65

62

56

65

76

Borja

156

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

En base a la informacin cual es su conclusin al 95% de confianza respecto


a la presencia de material particulado (PM10) en ambos distritos.
5.- Una psicloga afirma que los hombres, son menos variables en agresividad
hacia sus hijos cuando tienen conflictos con su pareja que las mujeres.
Para contrastar dicha afirmacin selecciona una muestra aleatoria de 150
parejas casadas con conflictos con su pareja y se mide su agresividad,
obtenindose que 100 mujeres y 70 hombres son ms agresivos con sus
hijos. Con 99% de confianza que se puede decir respecto a la informacin de
la psicloga.

6.- De acuerdo con un mtodo de anlisis del contenido de plomo en el agua, el


promedio aritmtico y desviacin estndar del agua son 20.2 y 10.8 g/L,
respectivamente. Un estudio de 40 muestras de agua produce una media de
24.75 g/L. Halle el intervalo de confianza del 93% para la media.

7.- Un activista del medio ambiente afirma que, menos de la mitad de las
industrias, cumplen con los lmites ambientales. Probar esta aseveracin, si un
sondeo dice que 48% de 1998 industrias si cumplen, satisfactoriamente, con
los reglamentos ambientales. Usar un nivel de = 0.05
8.- Una especie vegetal que aparece en solana y umbra aparenta crecer de
manera distinta en ambas ubicaciones. Para ello tomamos muestras de la altura
de dicha planta en centmetros. Los resultados obtenidos para solana y umbria
aparecen en la tabla.
Altura en Solana
(cm)
Altura en Umbra
(cm)

39
43

36
45

35
42

37
35

157

40
37

39
38

40
33

38
38

35
41

39
43

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

PRUEBAS DE HIPOTESIS

En muchas situaciones el investigador tiene alguna idea o conjetura sobre el


comportamiento de una o ms variables en la poblacin.
El diseo de la investigacin debe permitir probar la veracidad de sus ideas sobre
la poblacin en estudio, en base a los datos de la muestra.
La idea o conjetura es una hiptesis y el procedimiento de toma de decisin
sobre la hiptesis se conoce como prueba de hiptesis.
Una hiptesis estadstica es una conjetura sobre el comportamiento
probabilstica de una poblacin.
Si la hiptesis estadstica identifica por completo la distribucin, recibe el nombre
de hiptesis simple, y si no la especifica recibe el nombre de

hiptesis

compuesta. El contraste de hiptesis tiene por finalidad decidir si una conjetura


puede considerarse cierta, o debe rechazarse, basndonos en la informacin
suministrada por una muestra.
Hiptesis nula (denotada como H0). Esta hiptesis nula es la que se somete a
comprobacin, y es la que se acepta o rechaza, como la conclusin final de un
contraste.

Hiptesis alternativa (denotada como Ha). Se denomina hiptesis alternativa


aquella hiptesis contra la cual queremos contrastar la hiptesis nula. Esta
hiptesis puede ser simple o compuesta.
Podemos cometer dos tipos de error: rechazar la hiptesis nula siendo
sta cierta (error de tipo I) y aceptar la hiptesis nula cuando esta es falsa
(error de tipo II).
Aceptar Ho

Rechazar Ho

verdadera

Decisin correcta

Error Tipo I

Ho falsa

Error Tipo II

Decisin correcta

Ho

158

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Denominamos nivel de significacin ( ) de un contraste a la mxima


probabilidad de cometer un error del tipo I que estamos dispuestos a sumir.
La decisin de rechazar, o no, la hiptesis nula la tomamos a partir de la
informacin proporcionada por la muestra (estadstico de prueba). Realizamos
una particin del espacio muestral en dos regiones, la regin crtica en la que se
rechaza la hiptesis nula (tiene probabilidad si H 0 es cierta) y la regin de
aceptacin, en la que se acepta la hiptesis nula.
A continuacin se dan una serie de regiones de aceptacin para ciertos
contrastes de hiptesis con nivel de significacin .
Antes de definir los pasos de una prueba de hiptesis se define algunos
conceptos bsicos.

1. Nivel de significacin del contraste es la probabilidad de cometer un error


del tipo I, es decir, de rechazar la hiptesis nula siendo cierta, y se
acostumbra a denotar por

2. El contraste de hiptesis, es pues, un mecanismo mediante el cual se rechaza


la hiptesis nula cuando existan diferencias significativas entre los valores
muestrales y los valores tericos, y se acepte en caso contrario. Estas
variables se medirn mediante una variable denominada estadgrafo de
contraste, que sigue una distribucin determinada conocida, y que para cada
muestra tomar un valor particular

3. La regin crtica es el conjunto de valores del estadstico de contraste que


nos induce a rechazar la hiptesis nula

PASOS DE UNA PRUEBA DE HIPOTESIS.


Los pasos que son convenientes seguir para realizar el contraste de hiptesis
son:
1. Determinar, la hiptesis nula Ho y la hiptesis alternativa Ha.
2. Elegir el nivel de significacin.
3. Seleccionar un estadstico de prueba cuya distribucin muestral sea conocida
en el caso de que la hiptesis nula sea cierta.
159

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

4. Determinar la regin crtica.


Determinar las conclusiones estadsticas del contraste (aceptar o rechazar
Ho).

A continuacin se presentan las pruebas de hiptesis en forma de resumeN

160

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

PRUEBAS DE HIPOTESIS

Pruebas de Hiptesis.
Hiptesis Nula

Estadstica de Prueba

Regin crtica

Hiptesis
Alternativa

Z c z1

Prueba de Medias
H0: = 0 vs:

Ha: 0

Si 2 conocido

Ha: > 0

Zc

Zc

-Nota: Si la poblacin no es normal pero Ha: < 0


n 30
Prueba de Medias

Ha: 0

H0: = 0 vs

Ha: > 0

Si se asume que :

Ha: < 0

X 0

N (0, 1)

/ n

X 0

s / n N (0, 1)

Tc

Zc z1
Tc t1 n 1
2

X 0
S/

Z c z1

t (n -1)

2 es desconocido

Tc t1 n 1
Tc t1 n 1

Prueba de diferencias de Medias

Ha: 1 2

H0: 1 = 2 vs:

Ha: 1 > 2

Asumiendo

Ha: 1 < 2

Zc

X1 X 2
12
n1

12 y 22 Conocidos

n2
2

Zc z1

N (0, 1)

Zc z1
Zc z1

--Nota: Si las poblaciones no son normales

161

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

pero n1 30 y n2 30

Prueba de diferencia de Medias

Ha: 1 2

H0: 1 = 2 vs

Ha: 1 > 2

Asumiendo que:

12

22

Ha: 1 2

H0: 1 = 2 vs

Ha: 1 > 2

Asumiendo que:

Ha: 1 < 2

12 22 y desconocidos

H0: 2 = 02 vs

Sp

Prueba de diferencia de Medias

s12 s22

n1 n2

Tc S X1 1X21

Ha: 1 < 2

desconocidos

Prueba de varianzas

X1 X 2

Zc

Tc t1 n1 n2 2
2

t (n1 + n2 -2)

Tc t1 n1 n2 2

X1 X 2

Tc t1 v

Sp

S12 S22

n1 n2

T (v)

S12 S12 2
n )
n1
1
( S12 / n1 ) 2 ( S 22 / n2 ) 2
n 1
n1 1
2

Ha:

02

Ha: 2 02

162


2
c

n1S 2
02

Tc t1 v

Tc t1 v
c2 2 n 1 c2 12 n 1

Ha: 2 02
2

Tc t1 n1 n2 2

n1 1S12 n2 1S22
n1 n2 2

Tc
v

n1 n2

N (0, 1)

(n - 1)

c2 1 n 1
c2 n 1

Mtodos Estadsticos

Prueba de razn de varianzas.


H0: 12 22 vs

Dr. Cleto De La Torre Dueas

Fc F n1 1, n2 1 Fc F1

Ha: 12 22

Fc

Ha: 12 22
Ha: 12 22

S12
S22

F (n1 1, n2 - 1)

Fc F1 n1 1, n2 1
Fc F n1 1, n2 1

Prueba de proporciones

Ha: p p0

Zc

Ha: p > p0
H0: p =p0 Vs

p p0
p (1 p )/ n N (0, 1)

Ha: p < p0

Zc z1

Zc z1

Zc z1
Prueba de diferencia de proporciones

Ha: p1 p2

Zc

Ha: p1 > p2
H0: p1 =p2 Vs

Ha: p1 < p2

pc

163

p1 p2
pc (1 pc ) pc (1 pc ) N(0,1)

n1
n2

n1 p1 n2 p2
n1 n2

Z c z1

Zc z1

Zc z1

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

EJERCICIOS RESUELTOS
1.-El pago en promedio por concepto de impuestos de los establecimientos
comerciales en una ciudad es de 355 soles. Se Sospecha que estos
establecimientos evaden el pago de impuestos, pagando menos del debido. Para
contrastar esta hiptesis se analiza

las ventas de 60 establecimientos

comerciales. Resulto una media muestral de 580 soles por concepto de


impuestos. Proporcionan estos datos suficiente evidencia estadstica, al nivel de
95% de confianza, a favor de la hiptesis de que el pago de impuestos es mayor
al contribuido actualmente? . Use 180
Solucin
Formulacin de hiptesis.
H0: = 355
Ha: > 355
Nivel de significancia, 5%
Estadstica de prueba.

Zc

X 0

/ n

180 , z1 1.645 , n 60, x1 580


580 355
Zc 180
9.68
/ 60

Regin critica

=5%
Z0=1.645 Zc =9.68
Regin
Aceptacin

Regin
Crtica

Conclusin.
Como Zc Zo
Se rechaza la hiptesis nula, por lo tanto se debe pagar ms de lo que
actualmente se contribuye.
2- Se aplico una estrategia diferenciadora para colocar un producto en el mercado.
En el cuadro siguiente se muestra las utilidades antes y despus de aplicar la
estrategia en miles de dlares.
164

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Antes

25

25

27

44

30

67

53

53

52

Despus

27

29

37

56

46

82

57

80

61

10

12

16

15

27

Diferencia 2

Hay suficiente evidencia estadstica (al nivel de significacin 0,05) a favor de que
la estrategia presenta un efecto positivo?.
Solucin
Formulacin de hiptesis.
H0: d = 0
Ha: d 0
Nivel de significancia, 5%
Estadstica de prueba.
Tc

X 0
S/ n

s 7.76 , t(1 / 2,n1) 2.262


n 9, x1 11

Tc

11 0
4.25
7.76 / 9

Regin critica

t0=2.26
R.R. H0

R.A. H0

t0=2.26 tc=4.25
R.R. H0

Conclusin.
Como tc 2.262 se rechaza la hiptesis nula.
3.- Se desea comparar el nivel de posicionamiento de dos empresas A y B en una
ciudad, para tal efecto se recopilo informacin de las recaudaciones diarias de
las dos empresas. Los resultados del estudio se muestran a continuacin.
Empresa A
Empresa B

n1 13 , x1 138.6 , S12 29.16

n2 16 , x2 125.8 , S22 26.7

165

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

En base a la informacin, cual es su conclusin al 95% de confianza.


Solucin.
Formulacin de hiptesis.
H0: 1 = 2
Ha: 1 2
Nivel de significancia, 5%
Estadstica de prueba.
Supongamos que las varianzas poblacionales son iguales, entonces el
estadstico de prueba es:

Tc

X1 X 2
Sp

1 1
n1 n2

t (n1 + n2 -2)

De la informacin se tiene:
n1 13 , x1 138.6 , S12 29.16

Empresa A

n2 16 , x2 125.8 , S22 26.7

Empresa B

Sp

n1 1 S12 n2 1 S22

Tc

X1 X 2

n1 n2 2

Sp

1 1
n1 n2

131*29.16161*26.7
1316 2

5.27

138.6 125.8
6.50
1
1
5.27* 13 16

Regin critica
T0 t1 n1 n2 2 t0.975 13 16 2 t0.975 27 2.052
2

t0=2.052
R.R. H0

t0=2.052
R.A. H0

tc=6.50

R.R. H0

Conclusin.
Como Tc T0 , entonces se rechaza H0.
4- El Ministerio de Economa viene desarrollando programas

destinados a la

poblacin, con la finalidad de que exijan la entrega de Boletas o facturas por todo
166

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

servicio en dos regiones (A y B) del pas. Se selecciona a pobladores de ambas


regiones que no presentaban esta cultura y se observo que de 600 residentes de
la Regin A, 20% en la actualidad exige boleta o factura, en cambio de 600
residentes de la Regin B , 15 % en la actualidad exige la entrega de boletas. Es
posible concluir con 95% de confianza que el programa a tenido similar resultado
en las provincias A y B ?

Solucin.
Formulacin de hiptesis.
H0: p1 =p2
Ha: p1 p2
Nivel de significancia, 5%
Estadstica de prueba.

Zc

p1 p2
pc (1 pc ) pc (1 pc )

n1
n2

Provincia A.

p1 0.2 , n1 600
Provincia B.

p2 0.15 , n2 600
pc

n1 p1 n2 p2 600*0.2 600*0.15

0.175
n1 n2
600 600

Zc

p1 p2
pc (1 pc ) pc (1 pc )

n1
n2

0.200.15
0.175(10.175) 0.175(10.175)

600
600

2.279

Regin critica

=5%
Z0=1.96
Regin
Aceptacin

167

Zc =2.279
Regin
Crtica

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Conclusin.
Como

Zc Zo , se rechaza la hiptesis nula, por tanto

p1 p2

EJERCICIOS PROPUESTOS
1)

Queremos saber si la humedad del suelo en un determinado lugar vara en


funcin de la cubierta vegetal del mismo (tomillar o suelo desnudo), pues
suponemos que la cubierta vegetal contribuye a aumentar la humedad del suelo
por disminucin de la evaporacin. Para ello se ha realizado un muestreo en el
que se ha medido la humedad de suelo (en % del volumen) en seis muestras
distribuidas al azar bajo tomillares y en 8 muestras tambin distribuidas al azar
en la misma zona, pero en condiciones de suelo desnudo.
Cobertura

Humedad de suelo (%)

Media

tomillar
suelo
desnudo

73.0 74.2 75.0 75.3 75.5 75.8


71.0 71.5 72.0 72.4 73.5 74.0 74.3
75.2

6
8

74.8
72.9

2) Se quiere estudiar si el nmero de especies de caros edficos se ve influido por


un incendio de baja intensidad. Para ello se simul un incendio de baja
intensidad en una parcela de un territorio homogneo, y se tomaron 6 muestras
al azar de la zona incendiada y 7 muestras tambin al azar de la zona no
incendiada, contndose el nmero de especies de caros edficos en cada
muestra.
Los datos obtenidos en el muestreo son los siguientes:

Parcela

Nmero de especies de caros edficos

quemada

no quemada

10

9
13

12

12
16

16

15

16

17

19

20

3) Un auditor quiere estimar el monto promedio de las cuentas por cobrar de la


compaa A. Una muestra de 10 cuentas por cobrar seleccionadas al azar de un
total de 400 cuentas que tiene esta compaa revela los siguientes datos.
500, 600, 750, 480, 900, 790, 860, 900, 500, 760.
168

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Estime la media de toda las cuentas cobrar utilizando un intervalo de confianza


del 98%.Interprete el resultado brevemente.
4) La reaccin de un pequeo inversionistas con respecto a un cambio de poltica
que modifique las reglas de juego de la economa es : retirar su inversin (A) o
continuar con la inversin inicial(B). Un investigador quiere estimar la proporcin
de inversionistas que reaccionan de manera A.
a) Que tan grande debera ser la muestra si se desea que el estimado del
porcentaje de inversionistas de la poblacin que retiran su inversin tenga error
de estimacin menor que 0.04 con un nivel de confianza del 95%, adems de
una prueba piloto se obtuvo que 90% retirara su inversin
b) El investigador realiza la encuesta con una m.a de pequeos inversionistas de
tamao igual al que obtuvo en a) y obtiene que 300 inversionistas reaccin de
manera A. Desarrolla el intervalo de confianza del 97% para el porcentaje de
inversionistas que retiraran su inversin.
5) El gerente de una cadena muy conocida de tiendas sospecha que su principal
competidor esta intentando vender los mismos productos a precios ms bajos.
Anteriormente las dos tiendas haban mantenido un balance en los precios de
forma tal que la mitad de los artculos de una eran ligeramente ms caros que los
de la otra y viceversa, para investigar esta posibilidad, envi un comprador a la
otra tienda para ver los precios de 50 artculos seleccionados al azar,
observndose:
1,1,1,0,1,0,1,1,1,0,1,1,0,0,0,1,0,1,0,1,1,1,0,0,1,1,1,0,0,1,0,0,0,1,1,0,1,0,1,0,1,0,0,0,1,
1,1,0,1,1.
Donde 1 indica precios ms bajos y 0 indica que los precios se mantienen igual
que antes. Se confirma la sospecha del gerente?
12. Cuando Eastern Airlines se acogi a la proteccin de las leyes de
bancarrota en 1989 en virtud del captulo 11, se hizo evidente que muchas
de las mayores empresas de la nacin estaban en dificultades financieras.
Durante una sesin de un subcomit del Senado, el senador Kennedy
estim que las empresas que buscan liberarse de las presiones de los
acreedores deban, de media, ms de 2200 millones de dlares. Una
comprobacin de 17 juicios recientes en virtud del captulo 11 revel que
las empresas implicadas deban 2430 millones de dlares, con una

169

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

desviacin tpica de 900 millones de dlares. Est respaldada la


afirmacin de Kennedy al nivel del 10%?.
13. De una muestra de 361 propietarios de pequeos comercios que
quebraron en un perodo determinado, 105 no tuvieron asesoramiento
profesional antes de abrir el negocio. Por experiencia se sabe que lo que
ha venido ocurriendo es que a lo sumo el 25% de los comercios que no
reciben asesoramiento quiebran. Analice si estos resultados prueban que
ha habido un aumento en el porcentaje de quiebras. Utilice un nivel del
90%.
14. Un investigador de marketing quiere determinar si existe alguna diferencia
en la proporcin de hombres que responden favorablemente a un
determinado anuncio y la proporcin de mujeres que lo hacen. De 875
hombres, 412 informan que tienen una impresin positiva; de las 910
mujeres encuestadas, slo 309 estn a favor. Contrastar las hiptesis a
nivel de significancia del 5%
15. Una corporacin bancaria quiere comparar el nivel medio de las cuentas
de ahorro abiertas en bancos comerciales del Lima con las de Cusco.
Muestras de 230 agencias bancarias del Lima y 302 en Cusco, tienen
medias de 1512 dlares y 1317 dlares, respectivamente. Se sabe que la
desviacin tpica en las cuentas para cada estado son 517 dlares para el
Lima y 485 dlares para Cusco. Contrastar la hiptesis de que no hay
diferencia de ahorros medios al nivel del 5%.
16. Muchos estudios econmicos se ocupan de sectores en los cuales una
gran parte del dominio del mercado se concentra en manos de unas pocas
empresas. Se teme que las empresas poderosas en sectores de tan alta
concentracin dominen el mercado con fines egostas. Se emparejaron las
empresas de nueve sectores concentrados con las de un nmero igual de
sectores en los cuales el poder econmico estaba ms disperso. Se
hicieron coincidir las empresas de cada grupo en cuanto a competencia
extranjera, estructuras de costo y todos los dems factores que pueden
afectar a los precios industriales. A continuacin se indican los
incrementos medios del precio en porcentajes de cada sector. Al nivel del
5%, parece que los sectores concentrados presentan una presin
inflacionaria ms pronunciada que los sectores menos concentrados?
170

Mtodos Estadsticos

Pareados de sectores

Dr. Cleto De La Torre Dueas

Sectores

Sectores menos concentrados

concentrados
1

3.7

3.2

4.1

3.7

2.1

2.6

-0.9

0.1

4.6

4.1

5.2

4.8

6.7

5.2

3.8

3.9

4.9

4.6

17. En un estudio ambiental hecho en varios lagos de Noruega, acerca del pH


del agua, en respuesta a la preocupacin de los efectos de la precipitacin
pluvial cida, se hicieron dos muestreos hechos en los aos de 1976 y
1981. Se quiere saber si hubo diferencias en las dos mediciones de pH de
esos aos 1976 y 1981. Los datos se dan en la tabla de abajo. Asumir que
las varianzas de las dos poblaciones son iguales.Usar un nivel de
significacin de 0.05 y calcular el valor de la probabilidad p en la toma de
decisiones. (Statistics for Environmental Sciences and Management, por
Bryan Manly, p. 8).

Tabla mostrando las mediciones de pH para 1975 y 1981.


No. de lago

pH (1975)

pH (1981)

4.97

4.98

4.32

4.49

4.97

5.21

4.98

5
171

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

4.58

4.94

4.72

4.9

4.53

4.54

4.96

5.69

10

4.96

5.75

11

5.31

5.43

12

5.42

5.19

13

5.6

5.7

14

5.37

5.38

15

4.87

4.9

16

5.87

6.02

17

6.2

6.25

18

6.67

6.67

19

6.06

6.09

20

5.38

5.51

21

5.6

5.98

22

5.6

5.66

23

5.37

5.67

24

5.07

5.18

25

6.23

6.29

26

6.24

6.37

27

5.15

5.68

28

4.82

5.45

29

5.42

5.54

30

4.99

5.25

31

5.31

5.55

32

5.99

6.13

33

4.63

4.92

34

4.47

4.5

35

4.6

4.66

36

4.88

4.92

37

4.6

4.84

38

4.85

4.86
172

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

39

5.06

5.11

40

5.97

6.17

41

5.47

5.82

(Fuente: Statistics for Environmental Science and Management. Manly, 2001)


Sugerencia: Usar la funcin estadstica para pruebas de hiptesis para las
diferencias de dos promedios.

18. Para comparar la efectividad de 3 muestreadores de gases, es decir,


usando mtodos A, B y C se seleccionaron muestras de tamao cuatro y
se registraron los siguientes resultados en ppm.

Tabla mostrando la informacin requerida. (Elaboracin propia)

Mtodo A

Mtodo B

Mtodo C

71

90

72

75

80

77

65

86

76

69

84

79

Probar la hiptesis de que no hay diferencias entre los tres promedios Poblacionales
con = 0.05.

CAPITULO IX
173

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

PRUEBA DE CHI-CUADRADO
Las pruebas de hiptesis desarrolladas anteriormente, estn basadas en el supuesto
de que la muestra pertenezca a una poblacin con distribucin conocida.
Muchas de las investigaciones cientficas
Aqu abordaremos dos problemas muy interesantes dentro de lo que se conoce con
el nombre de estadstica no paramtrica. La prueba de homogeneidad y la prueba
de independencia.
La justificacin de estos problemas es comparar las frecuencias esperadas y las
observadas.

9.1

TABLA DE CONTINGENCIA
Es relativamente frecuente encontrarse con informacin referida a la
observacin de dos caractersticas de una poblacin, en las que se establecen
modalidades o categoras, mediante las cuales se clasifican los individuos o
elementos que constituyen una muestra de la misma. Este tipo de distribucin
bidimensional de frecuencias suele presentarse en forma de tabla de doble
entrada, tambin llamada tabla de contingencia.

La informacin obtenida del estudio generalmente se presenta en una tabla de


contingencias, en esta se tiene un conjunto de n elementos clasificados de
acuerdo a dos criterios, X e Y, cada uno de los cuales tiene una serie de
categoras mutuamente excluyentes:

Total

Y1

Y2

...Y j ...

Yc

X1

o11

o12

o1 j

o1c

n1.

X2

o21

o22

o2 j

o2c

n2.

...

...

...

...

...

...

Xi

oi1

oi 2

oij

oic

ni.

...

...

...

...

...

...

Xr

or1

or 2

orj

orc

nc.

n.1

n.2

n. j

n.c

Total

174

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

En esta tabla, oij representa la frecuencia observada, es decir, el nmero de


individuos que pertenecen simultneamente a las categoras X i e Y j .
r

i 1

j 1

o. j nij y oi. nij

En

esta

seccin

se

vern

las

pruebas

de

homogeneidad

de

independencia. Si bien ambas pruebas presentan el mismo procedimiento


de clculo, las hiptesis a probar son diferentes y por lo tanto las
conclusiones obtenidas tambin.

9.2

PRUEBA DE HOMOGENEIDAD.
En ocasiones ocurre que tenemos a varias poblaciones clasificadas de acuerdo
con las categoras definidas para una determinada variable. La pregunta que se
sugiere inmediatamente es si la proporcin de individuos pertenecientes a cada
una de las clases es la misma en todas las poblaciones. Si, con la informacin
suministrada por las muestras obtenidas, se puede aceptar que esto es as,
diremos que las poblaciones son homogneas con respecto a la variable de
clasificacin utilizada.
Existen r poblaciones y una muestra aleatoria es extrada desde cada
poblacin. Sea ni. el tamao de la muestra extrada de la i-sima poblacin.
Cada observacin de cada muestra puede ser clasificada en una de c
categoras diferentes. Los datos son arreglados en la siguiente tabla de
contingencia r c:

Categora Categora
Poblacin 1 1 O 11
2 O 12
Poblacin 2
O22
O 21

Poblacin r
Total

O r2
n.1

...
.. .
.
..
.

.
....

O r2
n.2

Categora Total
n 1.
O
c 1c
O2c
n2

o rc
n.c

n r.
n..
nr-

En la tabla, oij es el nmero de observaciones de la muestra i clasificadas en la


categora j; n.j es el nmero total de observaciones en la categora j extradas
175

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

desde las r poblaciones y n.. es el total de observaciones extradas desde las


r poblaciones.

Hiptesis:
Sea ij la probabilidad de que una observacin seleccionada de la
poblacin i sea clasificada en la categora j. Entonces las hiptesis son:
Ho: 1j =... =

rj para todo j = 1, 2,c

H1: Al menos una igualdad no se cumple.


Las hiptesis pueden expresarse equivalentemente de la siguiente manera:
H0: La variable aleatoria tiene la misma distribucin de probabilidades en las r
poblaciones.
H1: La variable aleatoria tiene una distribucin de probabilidades diferente en
al menos una de las poblaciones.
La estadstica de prueba esta dado por:
r

xc2
j 1

(oij eij )

j 1

eij

x 2 (r 1)(c 1)

donde eij ni .x

n. j
n..

Regla de decisin:
La hiptesis nula se rechaza con un nivel de significacin a si el x c2 resulta
mayor que el valor de tabla x 21 ,( r 1)( c 1)

9.3 PRUEBA DE INDEPENDENCIA


Esta prueba permite analizar si dos variables aleatorias son o no
independientes.
Dado una muestra aleatoria de tamao n.. es extrada, y cada observacin
de la muestra es clasificada de acuerdo a dos criterios (variables X y Y).
Usando el primer criterio cada observacin es clasificada en una de r filas
y usando el segundo criterio en una de c columnas. Los datos son arreglados
en la siguiente tabla de contingencia rxc:

Fila 1
Fila 2

Columna 1 Columna ...


0 11
.
.
2 0 12
0 21
0 22
... .
176

Columna c Total
O ic
ni.
0 2c
n2.

Mtodos Estadsticos

Fila r
Total

O r2
n .i

O r2
n .2

Dr. Cleto De La Torre Dueas

.
.

.
..

0 rc
n. ,

n ro
n..

.
En la tabla, ojj es el nmero de observaciones clasificadas en la fila i
columna j, n i . es el nmero total de observaciones en la fila i y n. j es el
nmero total de observaciones en la columna j.
Hiptesis:
Sea ij la probabilidad de que una observacin sea clasificada en la fila i
columna j, i. la probabilidad de que una observacin sea clasificada en
la fila i y . j la probabilidad de que una observacin sea clasificada en la
columna j. Entonces las hiptesis son:
Ho: ij i. . j para todo i = 1, ... r, j = 1, ... c.
H1: Al menos una igualdad no se cumple.
Las hiptesis pueden expresarse, en forma equivalente de la siguiente manera:
Ho: Las variables X y Y son independientes.
HI: Las variables X y Y no son independientes.
Estadstico de prueba:
r

xc2
j 1

(oij eij )

j 1

eij

x 2 (r 1)(c 1) donde eij ni .x

n. j
n..

Regla de decisin:
Se adopta la siguiente regla de decisin:

Si c2 (2r 1)( c 1) entonces se acepta la hipotes H 0

Si c2 (2r 1)( c 1) entonces se rechaza la hipotes H 0


Como puede observarse el procedimiento es muy similar al de la prueba de
homogeneidad, y a veces suelen confundirse.

EJERCICIOS RESUELTOS

8.1.1 En una investigacin realizada sobre las preferencias de 3 marcas, se obtuvo


los siguientes resultados.
177

Mtodos Estadsticos

Dr. Cleto De La Torre Duea

Marcas
Preferencias

Total

Si

70

100

150

320

No

130

100

50

280

Total

200

200

200

600

Podemos concluir con 95% de confianza que las preferencias de las marcas
es similar?
Solucin.
H0: Las preferencias de las tres marcas son similares.
H1: Las preferencias de los tres marcas no son similares

2
c

e11

320*200
320*200
320*200
106.67 , e12
106.67 , e13
106.67
600
600
600

e21

280*200
280*200
280*200
93.33 , e22
93.33 , e23
93.33
600
600
600

70 106.67

106.67

100 106.67

106.67

150 106.67

106.67

130 93.33

93.33

100 93.33

93.33

50 93.33

93.33

c2 65.625
De la tabla de chi-cuadrado , 02 5.991

o2=5.99
R.A. H0

o2=65.625
R.R. H0

Como c2 02 , se rechaza la hiptesis nula


Las preferencias de los tres marcas no son similares.

2.- En un estudio sobre el uso de tres tcnicas de valorizacin de empresas


de distinto tamao, se obtuvo los siguientes resultados.

178

Mtodos Estadsticos

Dr. Cleto De La Torre Dueas

Tcnicas de
valorizacin

Tamao de la empresa
Alto

Medio

Bajo

Total

Actualmente

51

22

43

116

En el pasado

92

21

28

141

Nunca

68

22

99

211

52

93

356

Total

El uso de tcnicas de valorizacin es independiente del tamao de la


empresa? Solucin.
Ho: El uso de tcnicas de valorizacin es independiente del tamao de
empresa.
HI: El uso de tcnicas de valorizacin es dependiente del tamao de la
empresa..
Las frecuencias observadas y esperadas (frecuencias esperadas entre
parntesis) se presentan en la siguiente tabla:

Tamao de la empresa
Uso de software
Alto

Medio

Bajo

Total

51
Actualmente

(68.75) 22(16.94) 43(30.30)

116

En el pasado

92(83.57) 21(20.60) 28(36.83)

141

Nunca

68(58.68)

Total

9(14.46) 22(25.86)

211

Con estos datos el estadstico de prueba es:

179

52

93

99
356

Mtodos Estadsticos

.
3

x
2
c

Dr. Cleto De La Torre Duea

ij

eij
eij

i 1 j 1

18.510

Los grados de libertad para el estadstico de prueba son (3 -1)(3-1) = 4. El


2
valor de tabla para un nivel de significacin del 5% es x(0.95,4)
9.488 . Como el

valor calculado es mayor que el valor de tabla se rechaza H o y se concluye


que existe suficiente evidencia estadstica para aceptar que el uso de
tcnicas de valorizacin depende del tamao de la empresa .

3.- Un asesor financiero quiere conocer las diferencias en la estructura de capital de


varios tamaos de empresa en cierta industria. Hace una encuesta en un grupo
de firmas que tienen distintas cantidades de activos y las dividen tres grupos.
Clasifica cada una segn que su deuda sea mayor que el capital contable de
las acciones o que su deuda total sea menor. A continuacin se dan los
resultados de la encuesta:

Deuda con respecto Tamao de activos de la firma( en miles)

Total

al capital social

< $ 500

$500-2000

>$2000

Menor

12

13

29

Mayor

15

13

33

Total

17

28

17

62

Tienen idntica estructura de capital los 3 tamaos de empresa?

Solucin
Ho: La Estructura de capital es similar en los distintos tipos de empresa.
(Independientes)
HI: La Estructura de capital es similar en los distintos tipos de empresa
(Dependientes)

180

Mtodos Estadsticos

Estructura
de capital
Menor
May or
Total

Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje

Chi-cuadrado=7.563

Dr. Cleto De La Torre Dueas

Tamao de activ os de la f irma


< $ 500
$500-2000
>$2000
12
13
4
70.6%
46.4%
23.5%
5
15
13
29.4%
53.6%
76.5%
17
28
17
100.0%
100.0%
100.0%

Total
29
46.8%
33
53.2%
62
100.0%

, P-v alor=0.023

EL p-valor, juega un papel muy importante en la decisin de las hiptesis. Si pvalor < 0.05 se acepta la hiptesis alterna con un nivel de confianza del 95%,
en este caso influye el factor; en el caso que p > 0.05 la decisin es aceptar la
hiptesis nula, no influye el factor.
En nuestro ejemplo p-valor<0.05, se rechaza la hiptesis nula.

La estructura

de capital es similar en los distintos tipos de empresa.

EJERCICIOS PROPUESTOS

1) Supongamos, por ejemplo, que queremos saber si existe asociacin entre la


presencia de la especie A (un invertebrado acutico) y el tramo del ro (alto, medio y
bajo) para el caso de un ro. Para ello hemos hecho un muestreo a lo largo del ro y
en cada tramo hemos registrado la presencia (+) o ausencia (- ) de la especie en 15
muestras de agua tomadas al azar. Los resultados obtenidos son:

181

Tramo
Alto

Tramo
Medio

Tramo
Bajo

+
+
+
+
+
+
+
+

+
+
-

+
-

+
+
+

A partir de estos datos realizar el anlisis correspondiente


2) Un investigadoTomamos una muestra de una determinada especie vegetal en
una vaguada que, por su situacin, presenta una ladera en solana y otra en umbra.
Los resultados sobre 100 observaciones realizadas aparecen resumidos en la tabla
de frecuencias observadas. Existe alguna preferencia de la especie por alguna de
las dos situaciones?.
Observadas
Presencia
(+)
Ausencia (-)
Totales
El estudio se realiza en base

Umbra (U) Solana (S)


Totales
20
10
30
20
50
70
40
60
N = 100
a una variable cualitativa, ya que se est estudiando la

cualidad de presencia en solana o umbra, y la muestra no es ms que un recuento


de individuos que presentan la variable a estudiar.
Por tanto, lo que se pretende estudiar es si esta especie se distribuye de forma
homogenea tanto en umbra como en solana, o lo que es lo mismo si su presencia
es independiente de la ladera de la vaguada en la que estemos.

182

CLETO DE LA TORRE

3) El departamento de tarjetas de crdito bancarias del California Bank sabe que por
su larga experiencia, que 5% de los tarjeta habientes han tenido algunos estudios de
bachillerato, 15% han terminado dicho nivel escolar, 25% han tenido ciertos estudios
universitarios, y 55% han concluido la instruccin en universidad. De los 500 tarjeta
habientes que fueron reportados por falta de pago en este mes, 50 tenan estudios
de bachillerato, 100 terminaron tal nivel escolar, 190 tenan cierta preparacin
universitaria y 160 concluyeron la instruccin en la universidad. Se puede concluir
que la distribucin de tarjeta habientes que no han pagado sus cuentas es diferente
de la de los dems?. Aplique el nivel de significancia de 0,01

4) Doscientos hombres de diversos niveles de gerenciales, seleccionados al azar,


fueron entrevistados con respecto a su inters o preocupacin acerca de asuntos
ambientales. La respuesta de cada persona se registr en una de tres categoras:
inters nulo, algo de inters y gran preocupacin. Los resultados fueron:
Nivel de gerencial

Preocupacin
Sin inters

Algo de inters

Gran preocupacin

Gerencia alta

15

13

12

Gerencia media

20

19

21

Supervisor

Jefe de grupo

28

21

31

Utilice el nivel de significancia de 0,01 para determinar si existe relacin entre el


nivel directivo o gerencial y el inters en asuntos ambientales.

5) Un administrador de marca est preocupado porque su producto puede estar mal


distribuido a lo largo de todo el pas. En una encuesta en la que el pas fue dividido
en 4 regiones geogrficas, se investig una muestra aleatoria de 100 consumidores
de cada regin, obtenindose los siguientes resultados:
Adquisiciones

Adquirieron la

Regin
NE

NO

SE

SO

40

55

45

50

60

45

55

50

marca
No la adquirieron

183

ESTADISTICA

Si el nivel de significancia es de 0,05. Cul es su conclusin?

6) Se encuest a varios directores generales de empresas y se les pidi que


valoraran la dependencia entre el rendimiento financiero de su empresa y la
estrategia de la misma, siendo los resultados los siguientes:
Estrategia

Rendimiento financiero
Bajo

Medio

Alto

Baja

15

25

18

Media

30

52

23

Alta

23

49

61

A qu conclusin llega usted? Utilice un nivel de confianza del 90% para su prueba.

7)

Se clasific una muestra de agencias inmobiliarias segn su nmero de

empleados y por si tenan o no un plan de marketing, para estudiar si haba o no


dependencia entre ambas variables
Nmero de empleados

Con plan de Marketing

Sin plan de Marketing

Menos de 100

13

10

Entre 100 y 500

18

12

Ms de 500

32

Utilizando un nivel de significacin del 1% realice la prueba correspondiente.

8) El incluir en las etiquetas de los productos alimenticios el precio unitario del


producto tiene por objeto el facilitar a los compradores la eleccin. Sin embargo, un
experto en estudios sobre el comportamiento de los consumidores , han encontrado
que aquellos de nivel soioeconmico bajo no estn usando la ventaja que representa
el tener exhibido en la etiqueta el precio unitario.
En un estudio posterior, y a manera de corroboracin de los resultados reportados,
un economista observ el proceso de seleccin de 1000 compradores en tres
supermercados. Estos se encontraban ubicados en tres reas distintas de la ciudad,
y correspondan a clases sociales de nivel bajo, medio y alto respectivamente. Se
haban puesto paquetes de productos de la misma marca pero conprecios unitarios
distintos. Los datos sobre los 1000 compradores, clasificados de acuerdo a su clase

184

CLETO DE LA TORRE

socioeconmica y al hecho de haber comprado con base en los precios unitarios o


no, fueron:
BAJA
Us pp.uu.
No us pp.uu.

MEDIA

ALTA

249

494

201

26

26

Muestran los datos al nivel 0.05 evedencia que respalde los reportes del experto ?

9) Con el objeto de asesorar correctamente a sus clientes, un banco pidi la opinin


de 50 analistas en inversin de cada una de tres firmas consultoras distintas, todas
miembros de la bolsa . A cada uno le fu preguntado especficamente cual de los
tres tipos de inversin, bonos, acciones o bonos convertibles recomendara. Las
respuestas se presentan en la siguiente tabla:
FIRMAS

CONSULTORAS

Acciones

13

16

Bonos

31

24

10

Bonos convertibles

35
18

Proporcionan stos datos evidencia al nivel 0.10 de que las tres firmas consultoras
opinan distinto?

10) En un da dado, el gerente de un supermercado observ el nmero de clientes


que escogieron cada una de las 6 cajas de pago distintas de la salida. Los
resultados fueron:
Caja nmero

Frecuencia

84

110

146

152

61

47

Presentan los datos suficiente evidencia de que hay cajas preferidas al nivel 0.05?

11) Se ha realizado un estudio sobre la utilizacin de ciertas fuentes de financiacin


externas para las pequeas y medianas empresas (PYMES). Para ello se han
seleccionado aleatoriamente 500 PYMES de una regin. Las empresas se clasifican
segn su tamao en tres categoras (micros, pequeas y medianas) y segn hayan
utilizado o no alguna de las fuentes de financiacin especificadas en el cuestionario.
Los datos obtenidos son:
185

ESTADISTICA

Si utiliza financiacin

No utiliza financiacin

Micros

115

325

Pequeas

20

20

Medianas

15

Existe alguna relacin entre el tamao de la empresa y el hecho de recurrir o no a las


fuentes de financiacin indicadas?. Utilice un nivel de significacin del 5%.

CAPITULO X

DISEO EXPERIMENTAL

El diseo de experimentos es en la actualidad una de las herramientas principales


utilizados en la investigacin estadstica, el objetivo que se tiene es estudiar el efecto
de un factor sobre una variable respuesta.
Disear un experimento, simplemente significa planear un experimento de modo que se
rena la informacin que sea pertinente al problema bajo investigacin. Muy a menudo
se coleccionan datos que pueden tener muy poco o ningn valor, en la solucin del
problema.
El diseo de un experimento, es entonces, la secuencia completa de pasos
tomados de antemano para asegurar que los datos apropiados se obtendrn de modo
que permitan un anlisis objetivo que conduzca a deducciones vlidas con respecto al
problema establecido.

FACTOR.
Son todas aquellas variables cuyo efecto se desea medir, en algunos casos se les
llama tratamiento.

NIVEL
Es el conjunto de valores que tiene la variable independiente o factor en el
186

CLETO DE LA TORRE

experimento.

UNIDAD EXPERIMENTAL
Es la entidad ms pequea a lo que se aplica el tratamiento, es decir; es el elemento
donde se realiza la medicin.

ERROR EXPERIMENTAL
Es la medida de la variacin, existente entre observaciones de las unidades
experimentales.
En un Diseo Experimental se tiene variabilidad inherente a la unidad experimental y
otra variabilidad debida a los tratamientos.
Para reducir el error experimental se siguen algunos pasos:

Repetir el experimento

Adicionar ms tratamientos

Introducir variables o bloques

El proceso o sistema bajo estudio puede representarse por medio del modelo:

Podemos pensar que el proceso es una combinacin de maquinarias, personas y otros


recursos que transforman alguna entrada, en una salida que tienen una o ms
respuestas observadas

OBJETIVOS DEL DISEO EXPERIMENTAL


Determinar las variables con mayor influencia en la respuesta
Determinar el mejor valor de las variables que influyen en la respuesta de
187

ESTADISTICA

manera que:
La respuesta se aproxime al valor deseado
La variabilidad de la respuesta sea pequea
Se minimiza el efecto de las variables incontrolables

DISEO UNIFACTORIAL (Diseo completamente aleatorio)


Es el Diseo Experimental ms simple.
En este Diseo los tratamientos (niveles) se distribuyen al azar en todas las
unidades experimentales. Este diseo es muy til cuando las unidades
experimentales tienen variabilidad uniformemente repartidos (homogeneidad)

VENTAJAS Y DESVENTAJAS
VENTAJAS
Este Diseo es fcil de planear y es flexible en cuanto al nmero de
repeticiones y unidades experimentales del tratamiento
DESVENTAJAS
Solo es aplicable, cuando el material experimental es homogneo
Los resultados del experimento se pueden agrupar de la siguiente forma:

factor variedad

A
B
niveles

C
D

yij
AY11

CY31

BY23

CY33

BY22

AY12

BY21

DY41

AY13

DY43

DY42 CY32

AY14 DY44 CY34

BY24

Donde ( yij ) es el resultado de la medicin del i-simo tratamiento en la j-sima


repeticin.
En resumen:

188

CLETO DE LA TORRE

Y11

Y21

Yi1

Ya1

Y12

Y22

Yi 2

Ya 2

Y1 j

Y2 j

Y1n

Y2 n

Tratam

Yij

Yaj

Yin

Yan
TOTAL

TOTALES

Y1.

Y2. Yi .

Ya .

Y..

Medias

Y1.

Y2.

Yan

Y..

sa2.

s..2

Varianzas

s12.

Yi.

s22. si2.

Donde:
n

Yi. Yij , Total del i-simo tratamiento


j 1

Yi . Yij
j 1

Yi .
, Media del i-simo tratamiento
n

189

ESTADISTICA

Y.. Yi. Yij , Total


i 1

Y..

i 1 j 1

Y..
, Media total
an

En esta parte desarrollaremos el Anlisis de Varianza para el modelo de Efectos fijos


del Diseo Completamente al Azar. (DCA).

ANALISIS DE VARIANZA
Es la tcnica mediante el cual se mide los efectos de los tratamientos puesto que
descompone la Varianza Total en diferentes fuentes de variabilidad definida por el
modelo.
Para el cual se siguen los siguientes pasos:

H0 : 1 2 a

H1: i j , para algn par (i,j)


La frmula asumida para calcular la suma de los cuadrados es la siguiente:

SCT yij y..


a

i 1 j 1

y..2
yij
N
i 1 j 1
a

yi2. y..2
SCA
N
i 1 ni
a

, N an

N an

SCE SCT SCA


Los cuadrados medios son los estimadores de las varianzas y son obtenidos de
la siguiente forma:

CMA

SCA
a 1

CME

SCE
V ( ij ) 2
a(n 1)

varianza del error.

Por otra parte el cociente de 2 variables 2 se distribuye mediante la distribucin de


Fisher

190

CLETO DE LA TORRE

SCA
Fc a 1
SCE
a(n 1)

f a 1, a n1 gl

f 0 f a 1, a n1 gl

Anlisis de la varianza.
Fuentes de

g.l

SC

CM

FCAL

Tratamiento a-1

SCA

CMA

CMA
CME

Error

a(n-1)

SCE

CME

Total

an-1

STT

Varianza

Conclusiones:
Si Fc F0 Se rechaza H0
Si Fc F0 Se acepta H0

DISEO EXPERIMENTAL DE DOS FACTORES


El anlisis de la varianza de dos factores esta formado como su nombre

indica por

dos factores que a su vez tienen la misma importancia en este tipo de anlisis existen
a niveles del factor A y b niveles de factor B.
Este tipo de anlisis se determinan segn el numero de observaciones; si cada unidad
experimental tiene una observacin, el modelo del anlisis univariado de la varianza de
191

ESTADISTICA

dos factores se denomina sin replica, en este caso no existe interaccin entre los dos
factores. En este tipo de anlisis el control local (unidad experimental) por el factor A l
cual esta constituido por todo los del factor B o variantes repetidas una sola vez siendo
el factor A una repeticin con la condicin de que los del factor B estn dentro del
factor A . de donde se puede afirmar que cada factor A contiene los elementos del
factor B el cual disminuye el error experimental.
TABLA DE ANALISIS DE VARIANZA
Fuentes de

g.l

SC

CM

FCAL

Factor A

a-1

SCA

CMA

CMA
CME

Factor B

b-1

SCB

CMB

CMB
CME

Interaccin

(a-1)(b-1)

SCAB

CMAB

CMAB
CME

Error

ab(n-1)

SCE

CME

Total

abn-1

Varianza

AB

Donde:
2

SCT Y Y ,
abn
a

ijk

i 1 j 1 k 1
a

SCAB
i 1

j 1

...

2
ij .

SCA Y
a

i 1

2
i ..

bn

2
...

abn

2
...

abn

SCA SCB

SCE = SCT-(SCA+SCB+SCAB)
El cuadrado medio, se obtiene:
Para el factor A

: CMA

SCA
a 1

Para el factor B

: CMB

SCB
b 1

Para la interaccin AB

: CMAB

Para el error

: CME

SCAB
(a 1)(b 1)

SCAB
ab(n 1)

192

SCB
j 1

2
. j.

an

2
...

abn

CLETO DE LA TORRE

INTERACCIN. En estadstica, la idea de una interaccin, es medir el efecto de una

variable (factor), manteniendo constante los dems.


Figura: Interaccin de factores.
De la grfica anterior se concluye que geomtricamente existe interaccin
cuando las lneas no son paralelas, en cambio no existe interaccin, cuando las lneas
son paralelas.

APLICACIONES.
1.- Puesto que el hgado es el principal lugar para el metabolismo de los frmacos, se
espera que los pacientes con enfermedades de hgado tengan dificultades en la
eliminacin de frmacos. Uno de tales frmacos es la fenilbutazona. Se realiza un
estudio de la respuesta del sistema a este frmaco. Se estudian tres grupos:
controles normales, pacientes con cirrosis heptica, pacientes con hepatitis activa
crnica. A cada individuo se les suministra oralmente 19 mg de fenilbutazona/Kg. de
peso. Basndose en los anlisis de sangre se determina para cada uno el tiempo de
mxima concentracin en plasma (en horas). Se obtienen estos datos:

Normal

Cirrsis

Hepattis

35

22,6

16,6

30,6

14,4

12,1

26,8

26,3

7,2

37,9

13,8

6,6

13,7

17,4

12,5

193

ESTADISTICA

49

18.5

15,1

Se puede concluir que las tres poblaciones difieren respecto del tiempo de mxima
concentracin en plasma de fenilbutazona?

Solucin
La hiptesis estadstica esta dado por:

H0 : 1 2 a

H1: i j
Normal

Totales
n

Cirrsis

Hepattis

35

36

37

30.6

30.7

30.8

26.8

26.9

26.10

37.9

37.10

37.11

13.7

13.8

13.9

49

50

51

y1. 84

y2. 86

y3. 88

y.. 258

N=18

y1. =14 y2. =14.3333333 y3. =14.6666667 y.. =14.3333333

Media

y..2
2582
2
2
2
2
SCT yij
35 30.6 26.8 .... 51
2194.57
N
18
i 1 j 1
a

SCA
i 1

yi. y..2 842 862 882 2582

0.7059
ni N
6
18

SCE SCT SCA 2193.87


Anlisis de la varianza.
Fuentes de

g.l

SC

CM

FC

0.7059

0.35295

0.00220775

Varianza
Tratamiento 2

194

CLETO DE LA TORRE

Error

15

2193.87

Total

17

2194.57

146.258

D el tabla FO=3.68, Se acepta HO.


2.- Un investigador analiza el efecto de un extracto a 4 dosis (EE1, EE2,EE3, EE4) y
un medicamento comercial (Naproxeno en la actividad antiinflamatoria. Los
resultados de la disminucin real (eliminado el efecto del grupo control) se miden
cada 30 minutos. La informacin obtenida del estudio se muestra en el cuadro
siguiente.

Disminucin
Tiempo

Tratamiento de Volumen

Disminucin
Tiempo

Tratamiento de Volumen

30 EE1

-0.085

90 EE3

0.09

30 EE1

0.045

120 EE3

0.2

60 EE1

-0.1

120 EE3

0.25

60 EE1

0.02

150 EE3

0.26

90 EE1

-0.075

150 EE3

0.34

90 EE1

0.085

30 EE4

120 EE1

-0.073

30 EE4

0.07

120 EE1

0.087

60 EE4

0.03

150 EE1

0.25

60 EE4

0.1

150 EE1

0.17

90 EE4

0.09

30 EE2

-0.11

90 EE4

0.17

30 EE2

0.03

120 EE4

0.21

60 EE2

-0.1

120 EE4

0.2

60 EE2

0.02

150 EE4

0.35

90 EE2

-0.08

150 EE4

0.42

90 EE2

0.07

30 Naproxeno

0.03

120 EE2

-0.05

30 Naproxeno

0.06

120 EE2

0.11

60 Naproxeno

0.11

150 EE2

0.12

60 Naproxeno

0.1

150 EE2

0.25

90 Naproxeno

0.17

195

ESTADISTICA

30 EE3

-0.06

90 Naproxeno

0.15

30 EE3

120 Naproxeno

0.21

60 EE3

-0.04

120 Naproxeno

0.32

60 EE3

0.02

150 Naproxeno

0.44

90 EE3

0.02

150 Naproxeno

0.42

Con 95% cual es su conclusin de este estudio.

ANALISIS DE VARIANZA
Fuentes de variacin Suma de

gl

cuadrados

Cuadrado

Fc

P-Value

medio

Factores
A:Tratamiento

0.242096

0.0605239

12.4 0.0000
0

B:Tiempo

0.611808

0.152952

31.3 0.0000
4

Interaccion
AB

0.0524227

16

0.00327642 0.67 0.7941

Error

0.122

25

0.00488

Total

1.02833

49

Del anlisis de varianza que se muestra en el cuadro anterior se puede concluir con
95% de confianza que los tratamientos considerados en el estudio (diferentes tipo de
de extracto ms el estndar que es naproxeno) influyen en la disminucin del volumen
196

CLETO DE LA TORRE

de la inflamacin. (P-valor < 0.05), es decir algunos de estos tipos de tratamiento


genera mejor efecto en la actividad antiinflamatoria en comparacin de los otros
tratamientos.
Tambin del mismo cuadro se puede desprender que el factor tiempo influye (p-valor <
0.05) es decir que en determinado tiempo tiene mejor efecto los tratamientos.
Para determinar que tratamiento tiene mejor efecto se aplica las pruebas de
comparacin de mltiples que se ilustra grficamente.

Means and 95.0 Percent LSD Intervals

Disminucion de Volumen

0.24
0.19
0.14
0.09
0.04
-0.01
EE1

EE2

EE3

EE4

Naproxeno

Tratamiento

De este grafico se observa que los tratamientos naproxeno, EE4 estadsticamente


tienen similares efectos en la desinflamacin y este grupo presenta mejor efecto en
comparacin de los tratamientos EE3, EE2, EE1.
Por otra parte el Extracto EE1 tiene el menor efecto de todos los tratamientos.

197

ESTADISTICA

Means and 95.0 Percent LSD Intervals

Disminucion de Volumen

0.36

0.26

0.16

0.06

-0.04
30

60

90

120

150

Tiempo

El efecto de los distintos tratamientos es creciente de 60 a 150 minutos .Por otra parte
tambin se puede observar que los distintos tratamientos tiene efectos similares de 30

Disminucion de Volumen

a 60 min. En cambio de 120 a 150 presentan mejor efecto (mayor desinflamacin)

0.45

Tratamiento
EE1

0.35

EE2
EE3
EE4

0.25

Naproxeno

0.15
0.05
-0.05
30

60

90

120

150

Tiempo

De este anlisis se puede concluir que todos los tratamientos presentan mejor efecto a
los 150 minutos.

EJERCICIOS

198

CLETO DE LA TORRE

1. En un estudio de contaminacin de corrientes, con el objeto de revisar que no


hubiera descargas industriales, previo a un proyecto de dilucin, se analiz la demanda
bioqumica de oxgenos de 5 das (DBO)5 en mg/L y se obtuvieron los siguientes datos
(mostrados en la tabla de abajo) del muestreo que se hizo a lo largo de la corriente, es
decir, en 4 lugares diferentes. Hacer un anlisis de varianza usando un nivel de
significancia de 0.05. Ver si hay diferencias entre las concentraciones de DBO de los
cuatro lugares muestreados (De acuerdo a estudios de contaminacin de corrientes,
con qu objeto se tendra que hacer esto?) Adems, usar la prueba de comparaciones
mltiples para ver cuales sitios de muestreo son iguales y cuales son desiguales, si es
que esto es as. Sugerencia:
Usar el paquete de EXCEL o el programa MINITAB para resolver este problema.
Tabla mostrando los resultados del muestreo del DBO en mg/L. (Elaboracin propia).

Sitio #1

Sitio #2

Sitio #3

Sitio #4

20

25

28

31

17

25

31

15

18

26

34

12

10

14

17

24

2. Se hace un estudio entre el nivel de acidez en trminos de pH (Factor A) y la


concentracin de cloro (factor B) en el agua. Aqu se asume un anlisis de varianza de
dos vas con un diseo aleatorio completamente aleatorizado. Los datos se dan en la
tabla de abajo. Hacer una tabla de anlisis de varianza y sacar las conclusiones
debidas.
Tabla mostrando los datos de este problema del pH y la concentracin de cloro.

Nivel del PH
Nivel de concentracin de
cloro

pH = 7.0 pH = 7.2
199

pH = 7.4

pH = 7.6

ESTADISTICA

Baja

22

17

Mediana

11

Alta

3.-Para realizar un estudio de contaminacin por plomo en especimenes que habitan


en cuatro sectores costeros diferentes, se selecciona muestras aleatorias de
especimenes en los cuatro sectores y se miden los porcentajes de plomo
observados en ellos. Los resultados se muestran en la tabla siguiente:
Sector A 0.027

0.025

0.029

0.026

Sector B 0.025

0.028

0.030

0.027

0.024

Sector C 0.034

0.029

0.032

0.031

0.036

Sector D 0.030

0.033

0.031

a) Pruebe la hiptesis de no diferencia en los porcentajes medios de plomo entre


los sectores Use 0.01.
b) Compare las medias por pares, al 5% de significacin.

4.-Se quiere saber si el tipo de cobertura de suelo (suelo desnudo, piedras, hojarasca y
pastizal) influye sobre la densidad de hormigueros. Para ello se ha realizado un
muestreo en el que se ha medido el nmero de hormigueros en diez muestras
distribuidas al azar dentro de cada una de las zonas con diferente cobertura:
Cobertura
suelo desnudo
piedras
hojarasca
pastizal
Total

Densidad de hormigueros
78 88 87 88 83 82 81 80 80 89
78 78 83 81 78 81 81 82 76 76
79 73 79 75 77 78 80 78 83 84
77 69 75 70 74 83 80 75 76 75

n
10
10
10
10
40

Media
83.6
79.4
78.6
75.4

5.- Los siguientes datos representan los tiempos de reaccin (en segundos) a tres tipos
de estmulos:
Estmulo A: 4.9 6.1 4.3 4.6 5.3
Estmulo B: 5.5 5.4 6.2 5.8 5.6 5.2 4.8
Estmulo C: 6.4 6.8 5.7 6.5 6.3 6.6
200

CLETO DE LA TORRE

a) Pruebe si el tiempo de reaccin al tipo de estmulo B es superior al tipo de


estmulo A. Use 0.05.
b) Pruebe utilizando la prueba adecuada, si el tiempo de reaccin es diferente a los
tres tipos de estmulos. Use un nivel de significacin de 1%.
6.- La tabla siguiente muestra los niveles de residuo pesticida (PPB) en muestras de
sangre de 4 grupos de personas. Contrastar a un nivel de confianza de 0.05, la
hiptesis nula de que no existe diferencia en los niveles de PPB en los cuatro grupos
considerados.
Niveles de PPB
Grupo I

10

37

12

31

11

23

Grupo II

35

32

19

33

18

Grupo III

15

10

12

15

Grupo IV

11

7.- Se sospecha que las aguas de un lago estn contaminadas por los compuestos
fosforados procedentes de una industria. Para tratar de verificar esta sospecha, se
midieron los niveles de fsforo en distintos puntos del lago, obtenindose los
siguientes valores:
Lago 1: 7.1 8.5 6.2 7.3 7.9
Despus, se tomaron medidas de los niveles de fsforo en varios puntos de otros
tres lagos, que no estaban contaminados, obtenindose:
Lago 2: 7.2 6.5 5.9 7.8
Lago 3: 5.6 7.1 6.3 6.7 6.5
Lago 4: 7.2 6.6 6.3 7.4
Los valores obtenidos en lago bajo sospecha parecen ser algo superiores a los
obtenidos en los otros tres. Es suficientemente importante esta diferencia como para
poder concluir que el nivel de fsforo en el lago 1 es diferente que el que tienen los
dems, y por tanto est contaminado?

201

ESTADISTICA

202

CLETO DE LA TORRE

Tabla Normal Estndar

Z
0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392

0.0279 0.03188 0.03586

0.1

0.03983 0.04395 0.04776 0.05172 0.05567 0.05962 0.06356

0.0675 0.07124 0.07534

0.2

0.07926 0.08617 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409

0.3

0.11781 0.12172 0.12552

0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173

0.4

0.15542

0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793

0.5

0.19146 0.19497 0.19847 0.20194

0.2054 0.20884 0.21226 0.21566 0.21904

0.2224

0.6

0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175

0.2549

0.7

0.25804 0.26115 0.26424

0.8

0.28814 0.29103 0.29389 0.29373 0.29955 0.30234

0.9

0.31594 0.31859 0.32124 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891

0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214

0.1591 0.16276

0.2673 0.27035 0.27337 0.27637 0.27935

0.2823 0.28524

0.3051 0.30785 0.31057 0.31327

1.1

0.36433

1.2

0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39616 0.39796 0.39973 0.40147

1.3

0.4032

0.3665 0.36864 0.37076 0.37286 0.37923 0.37698

0.379

0.381 0.38298

0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774

1.4

0.41924 0.42073

1.5

0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408

1.6

0.4452

0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189

0.4463 0.44738 0.44845

0.4495 0.45053 0.45154 0.45254 0.45352 0.45449

1.7

0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46079 0.46164 0.46246 0.46327

1.8

0.46407 0.46485 0.46562 0.46637 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062

1.9

0.47128 0.47193 0.47257

0.4732 0.47381 0.47441

0.47725 0.47778 0.47831 0.47882 0.47932 0.47982

0.475 0.47558 0.47615

0.4803 0.48077 0.48124 0.48169

2.1

0.48214 0.48257 0.48299 0.48341 0.48382 0.48422 0.48461

2.2

0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809

2.3

0.48928 0.48956 0.48983 0.49001 0.49036 0.49061 0.49086

2.4

0.485 0.48537 0.48574


0.4884

0.4887 0.48899

0.4911 0.49134 0.49158

0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361

2.5

0.49379 0.49396 0.49413

2.6

0.49534 0.49547

2.7

0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711

2.8

0.49744 0.49752

2.9

0.49813 0.49819 0.49825

0.4767

0.4943 0.49446 0.49461 0.49477 0.49491 0.49506

0.4952

0.4956 0.49573 0.49585 0.49597 0.49609 0.49621 0.49632 0.49643


0.4972 0.49728 0.49736

0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807


0.4983 0.49836 0.49841 0.49846 0.49851 0.49856

0.4986

0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897

0.499

3.1

0.49903 0.49906

3.2

0.49931 0.49934 0.49936 0.49938

3.3

0.49952 0.49953 0.49955 0.49957 0.49958

3.4

0.49956 0.49968 0.49969

3.5

0.49977 0.49978 0.49978 0.49979

3.6

0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989

3.7

0.49989

3.8

0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995

3.9

0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997

0.4999

0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929

0.4999

0.4994 0.49942 0.49944 0.49946 0.49948

0.4995

0.4996 0.49961 0.49962 0.49964 0.49965

0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976


0.4998 0.49981 0.49981 0.49982 0.49983 0.49983

0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992

203

ESTADISTICA

TABLA DE LA DISTRIBUCION T-STUDENT

p x c 1

gl

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

0.75

0.80

0.85

0.9

0.95

1
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.7
0.697
0.695
0.694
0.692
0.691
0.69
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.679
0.677
0.674

1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.851
0.848
0.845
0.842

1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.050
1.046
1.041
1.036

3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
1.282

204

0.975

0.99

0.995

6.314 12.706 31.821 63.657


2.920 4.303 6.965 9.925
2.353 3.182 4.541 5.841
2.132 2.776 3.747 4.604
2.015 2.571 3.365 4.032
1.943 2.447 3.143 3.707
1.895 2.365 2.998 3.499
1.860 2.306 2.896 3.355
1.833 2.262 2.821 3.250
1.812 2.228 2.764 3.169
1.796 2.201 2.718 3.106
1.782 2.179 2.681 3.055
1.771 2.160 2.650 3.012
1.761 2.145 2.624 2.977
1.753 2.131 2.602 2.947
1.746 2.120 2.583 2.921
1.740 2.110 2.567 2.898
1.734 2.101 2.552 2.878
1.729 2.093 2.539 2.861
1.725 2.086 2.528 2.845
1.721 2.080 2.518 2.831
1.717 2.074 2.508 2.819
1.714 2.069 2.500 2.807
1.711 2.064 2.492 2.797
1.708 2.060 2.485 2.787
1.706 2.056 2.479 2.779
1.703 2.052 2.473 2.771
1.701 2.048 2.467 2.763
1.699 2.045 2.462 2.756
1.697 2.042 2.457 2.750
1.684 2.021 2.423 2.704
1.671 2.000 2.390 2.660
1.658 1.980 2.358 2.617
1.645 1.960 2.326 2.576

CLETO DE LA TORRE

TABLA DE LA DISTRIBUCION CHI CUADRADO ( p x c 1 )


gl
1

0.01 0.01 0.025


0

0.05

0.1

0.2

0.4

0.6

0.8

0.9

0.95

0.975

0.99 0.995

0.02

0.06

0.27

0.71

1.64

2.71

3.84

5.02

6.63

7.88
10.6

0.01 0.02 0.05

0.1

0.21

0.45

1.02

1.83

3.22

4.61

5.99

7.38

9.21

0.07 0.11 0.22

0.35

0.58

1.01

1.87

2.95

4.64

6.25

7.81

9.35

11.34 12.84

0.21

0.48

0.71

1.06

1.65

2.75

4.04

5.99

7.78

9.49

11.14 13.28 14.86

0.41 0.55 0.83

1.15

1.61

2.34

3.66

5.13

7.29

9.24

11.07

12.83 15.09 16.75

0.68 0.87 1.24

1.64

2.2

3.07

4.57

6.21

8.56

10.64

12.59

14.45 16.81 18.55

0.99 1.24 1.69

2.17

2.83

3.82

5.49

7.28

9.8

12.02

14.07

16.01 18.48 20.28

1.34 1.65 2.18

2.73

3.49

4.59

6.42

8.35

11.03

13.36

15.51

17.53 20.09 21.95

1.73 2.09

3.33

4.17

5.38

7.36

9.41

12.24

14.68

16.92

19.02 21.67 23.59

10

2.16 2.56 3.25

3.94

4.87

6.18

8.3

10.47

13.44

15.99

18.31

20.48 23.21 25.19

11

2.6

4.57

5.58

6.99

9.24

11.53

14.63

17.28

19.68

21.92 24.73 26.76

12

3.07 3.57

5.23

6.3

7.81

10.18 12.58

15.81

18.55

21.03

23.34 26.22 28.3

13

3.57 4.11 5.01

5.89

7.04

8.63

11.13 13.64

16.98

19.81

22.36

24.74 27.69 29.82

14

4.07 4.66 5.63

6.57

7.79

9.47

12.08 14.69

18.15

21.06

23.68

26.12 29.14 31.32

15

4.6

5.23 6.26

7.26

8.55

10.31 13.03 15.73

19.31

22.31

25

27.49 30.58 32.8

16

5.14 5.81 6.91

7.96

9.31

11.15 13.98 16.78

20.47

23.54

26.3

28.85

17

5.7

6.41 7.56

8.67

10.09

14.94 17.82

21.61

24.77

27.59

30.19 33.41 35.72

18

6.26 7.01 8.23

9.39

10.86 12.86 15.89 18.87

22.76

25.99

28.87

31.53 34.81 37.16

19

6.84 7.63 8.91

10.12 11.65 13.72 16.85 19.91

23.9

27.2

30.14

32.85 36.19 38.58

20

7.43 8.26 9.59

10.85 12.44 14.58 17.81 20.95

25.04

28.41

31.41

34.17 37.57

21

8.03

8.9 10.28 11.59 13.24 15.44 18.77 21.99

26.17

29.62

32.67

35.48 38.93 41.4

22

8.64 9.54 10.98 12.34 14.04 16.31 19.73 23.03

27.3

30.81

33.92

36.78 40.29 42.8

23

9.26 10.2 11.69 13.09 14.85 17.19 20.69 24.07

28.43

32.01

35.17

38.08 41.64 44.18

24

9.89 10.9 12.4

13.85 15.66 18.06 21.65 25.11

29.55

33.2

36.42

39.36 42.98 45.56

25

10.5 11.5 13.12 14.61 16.47 18.94 22.62 26.14

30.68

34.38

37.65

40.65 44.31 46.93

30

13.8

16.79 18.49

20.6

23.36 27.44 31.32

36.25

40.26

43.77

46.98 50.89 53.67

35

17.2 18.5 20.57 22.47

24.8

27.84 32.28 36.47

41.78

46.06

49.8

53.2

40

20.7 22.2 24.43 26.51 29.05 32.34 37.13 41.62

47.27

51.81

55.76

59.34 63.69 66.77

45

24.3 25.9 28.37 30.61 33.35 36.88

46.76

52.73

57.51

61.66

65.41 69.96 73.17

29.7 32.36 34.76 37.69 41.45 46.86 51.89

58.16

63.17

67.5

71.42 76.15 79.49

68.8

73.31

77.38 82.29 85.75

50

28

0.3

2.7

3.05 3.82

15

4.4

12

42

32

34.27

40

57.34 60.27

55

31.7 33.6 36.4

38.96 42.06 46.04 51.74 57.02

63.58

60

35.5 37.5 40.48 43.19 46.46 50.64 56.62 62.13

68.97

74.4

79.08

83.3

65

39.4 41.4 44.6

74.35

79.97

84.82

89.18 94.42 98.1

70

43.3 45.4 48.76 51.74 55.33

72.36

79.71

85.53

90.53

95.02 100.4 104.2

75

47.2 49.5 52.94 56.05 59.79 64.55 71.29 77.46

85.07

91.06

96.22

100.8 106.4 110.3

80

51.2 53.5 57.15 60.39 64.28 69.21 76.19 82.57

90.41

96.58 101.88 106.6 112.3 116.3

85

55.2 57.6 61.39 64.75 68.78 73.88 81.09 87.67

95.73

102.1 107.52 112.4 118.2 122.3

90

59.2 61.8 65.65 69.13 73.29 78.56 85.99 92.76 101.05 107.6 113.15 118.1 124.1 128.3

95

63.3 65.9 69.92 73.52 77.82 83.25

47.45 50.88 55.26 61.51 67.25


59.9

66.4

90.9

97.85 106.36

205

113

118.75 123.9

88.38 91.95

130

134.3

ESTADISTICA

PRUEBAS DE HIPTESIS

SI
1
grupo

Prueba Z para la media


n20

SI
NO

Prueba T para la media

Distribucin
Normal
NO

SI

SI

Nmero
de
Grupos

2
grupos

i
n
d
e
p
e
n
d
i
e
n
t
e
s

Prueba del signo para la mediana

Prueba Z para la diferencia de medias

n30

SI

Varianzas
iguales

SI Prueba T para la
diferencia de medias
Prueba T para la diferencia
de medias con ajuste de
NO grados de libertad.

Distribucin
normal

NO

NO

SI

Prueba de Mann Whintney para


comparacin de poblaciones

Prueba Z para la media de la diferencia en


datos apareados

n30
SI
NO

Prueba T para la media de la


diferencia en datos apareados

NODistribucin

normal

3 o ms
grupos

i
n
d
e
p
e
n
d
i
e
n
t
e
s

NO

SI

Distribucin normal
SI
con varianzas
semejantes

Prueba del signo o de Wilcoxon


para datos apareados

ANOVA comparacin de tratamientos

Prueba de Krusskal Wallis


comparacin de tratamientos.
NO
SI

Distribucin normal
con varianzas
NO
semejantes
NO

206

ANOVA en bloque - comparacin de


tratamientos.
Prueba de Friedman - comparacin de
tratamientos.

CLETO DE LA TORRE

PRUEBAS DE HIPTESIS
SI
Prueba Z para la proporcin poblacional
1
grupo

Muestra grande
nP y n(1-P) > 5
Prueba Binomial para la proporcin poblacional

NO
SI

SI

2
grupos

Nmero
de
Grupos

i
n
d
e
p
e
n
d
i
e
n
t
e
s

SI

Frecuencias
esperadas
pequeas

No

3 o ms
grupos

Prueba Z o Ji-Cuadrado para comparacin de


proporciones
NO

NO

Prueba de McNeman
Comparacin de proporciones

SI

i
n
d
e
p
e
n
d
i
e
n
t
e
s

Prueba exacta de Fisher comparacin de


proporciones

SI

Prueba Ji - Cuadrado (reunir categoras)


Para comparacin de proporciones

Frecuencias
esperadas
pequeas

No

Prueba Ji-Cuadrado para comparacin de


proporciones
NO

NO

Prueba Q de Cockran
Comparacin de proporciones

207

ESTADISTICA

PRUEBAS DE HIPTESIS
Coeficiente de correlacin lineal de pearson

Continua

Coeficiente de correlacin por rangos de


Spearman

Ordinal y/o
cardinal

Escala de
medicin
para
ambas
variables.
SI

-Prueba de chi-cuadrado (Coeficiente de


contingencia)
-Riesgos relativos( Estudios Cohorte).
-Odds Ratio( Estudios caso-control)
-Coeficiente de correlacin

Nominal

Cada variable
tiene dos
categoras
(Tabla 2x2)

NO

208

Prueba de chi-cuadrado para


independencia de variables (Coeficiente
de contingencia)

CLETO DE LA TORRE

MTODOS ESTADSTICOS DE ACUERDO AL TIPO DE VARIABLES y NIVEL DE


INVESTIGACION.

Tipo de

Tipo de variable

Descripcin

Nivel de

Mtodo o Tcnica

investigacin

Estadstica.

DESCRIPTIVA

Tabla de Frecuencias,

Variables

Cualitativa

individuales

(Nominal y

proporciones, o

Ordinal)

porcentajes.
Representados por
grafico de barras,
sectores o pictogramas.

Escala de actitud

Intervalo de confianza y

de Likert)

prueba de hiptesis de la
proporcin.

Variables

Cuantitativa

DESCRIPTIVA

-Distribucin de

individuales

(Intervalo o

frecuencias por

razn)

intervalos.
-Medias, desviacin , ,
varianza, percentiles.
-Intervalo de confianza y
prueba de hiptesis de la
media.
-Anlisis factorial, anlisis
de compontes
principales.

Asociacin

V. Ind: Cualitativa

EXPLICATIVA

-Tablas de contingencia.

entre

con V.Dep:

-Calculo de riesgos.

variables

Cualitativa

-Pruebas de chicuadrado: independencia


-Grafico de barras de
doble entrada.
-Pruebas de Kendall, de
Spearman.
209

ESTADISTICA

-Anlisis de
correspondencias
Asociacin

V. Ind: :

COMPARATIVA,

-Tablas con clasificacin

entre

Cualitativa(s)

categrica, con

variables

(Grupos)

promedios, desviaciones,

con V.Dep:

etc.

Cuantitativa

-prueba t-student

(Rpta)

Asociacin

V. Ind: :

EXPERIMENTAL,

Diseo experimental

entre

Cualitativa(s)

CUASI

(ANOVA)

variables

(factores)

EXPERIMENTAL

-Prueba de comparacin

con V.Dep:

de medias.

Cuantitativa(Rpta)

Asociacin

V. Ind: :

RELACIONAL,

-Grafico de dispersin.

entre

Cuantitativa(s)

CORRELACIONAL

- Anlisis de regresin.

variables

con V.Dep:

-coeficiente de

Cuantitativa

correlacin de pearson.

Asociacin

V. Ind: :

entre

Cuantitativa(s),

variables

cualitativa(s)

EXPLICATIVA

-Regresin Logstica.
-Anlisis Discriminante.

Con V.Dep:
Cualitativa

210

CLETO DE LA TORRE

PRUEBAS ESTADSTICAS DE ACUERDO A LA ESCALA DE MEDICIN DE LA


VARIABLE.
Tipo de

Escala de la

Descripcin

variable

Variables

Nominal

individuales

Mtodo o Tcnica Estadstica.

-Prueba Z para una proporcin


poblacional.
-Prueba de chi-cuadrado para varias
proporciones en una sola poblacin.
-Intervalos de confianza para
proporciones.
-Prueba de McNemar,
-Prueba de Mantel Haenzel

Variables

Ordinales

-Prueba de signos o binomial para la

individuales o

media poblacional.

ms de una

-Pruebas de wilcoxon para rangos.

variable

Prueba de U Mann Whitney( dos o ms


poblaciones)
-Prueba de Kruskal Wallis.
-Prueba de Friedman.

Variables

Intercalar o de

-Prueba de t para una media poblacional.

individuales

razn.

-intervalos de confianza.

Mas de una

Intercalar o de

-Prueba de hipotes e intervalos de

variables

razn

confianza para diferencia de medias.


-Prueba de varianzas

211

You might also like