You are on page 1of 13

3. TEORIA DE LA ESTIMACION.

3.1 Introduccin.

"La imaginacin, impaciente por remontarse a las causas, se complace en crear hiptesis y a menudo deforma los hechos para plegarlos a su labor: en tales casos, las hiptesis son peligrosas. Pero cuando slo se las considera como medios para conectar entre s los fenmenos a fin de descubrir sus leyes, cuando, procurando no atribuirles realidad, se las rectifica continuamente con ayuda de nuevas observaciones, entonces pueden llevarnos a las causas verdaderas o, por lo menos, ponernos en condiciones de inferir de los fenmenos observados aquellos que, dadas las circunstancias, han debido originarlos Pierre Simon de Laplace Ensayo filosfico sobre las probabilidades (de las diversas formas de acercarse a la certeza) 1795

Podemos decir que la inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia experimental basndose en informacin incompleta. En la terminologa estadstica, el procedimiento inductivo implica el hacer inferencias acerca de una poblacin adecuada universo a la luz de lo averiguado en un subconjunto aparte o muestra. La inferencia estadstica se refiere a los procedimientos mediante los cuales se pueden hacer tales generalizaciones inducciones. Es importante por todo lo dicho anteriormente, que el proceso de la inferencia cientfica, implica el grado ms elevado de cooperacin entre la estadstica y el estudio experimental.

En la informtica es importante tener las herramientas necesarias para hacer inferencias, de la informacin recabada, y as poder dimensionar el problema al que nos enfrentamos al realizar un sistema, o poder en determinado momento realizar una auditora informtica. La inferencia estadstica se puede dividir en dos reas principales: Estimacin Pruebas de Hiptesis Trataremos estas dos reas por separado una en este captulo, 3.2Estimacin y propiedades de los estimadores El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el estudio de una muestra de una poblacin queremos generalizar nuestras conclusiones al total de la misma. Estimadores puntuales Una Estimacin puntual de algn parmetro de la poblacin es un valor estimado de , no esperamos que un estimador realice la estimacin del parmetro poblacional sin errores, en realidad esperamos que no est muy alejado. Para una muestra especfica es posible obtener un estimado ms cercano de utilizando la media de X como un estimador. Para saber si un estimador es eficiente deberemos imponer ciertas propiedades para identificarlos estos criterios son: Estimador insesgado: Se dice que un estadstico es un estimador insesgado del parmetro si: =E[] =

Varianza mnima: Entre todos los estimadores de que son insesgado, se selecciona el que tenga la varianza mnima V()=0 Convergente: Si el estimador de , tiende a , se dice que es un estimador convergente Si un estimador cumple con las propiedades anteriores se dice que es un buen estimador de .

3.3Estimacin por intervalo. Se llama intervalo de confianza en estadstica a un intervalo de valores alrededor de un parmetro muestral en los que, con una probabilidad o nivel de confianza determinado, se situar el parmetro poblacional a estimar. Si es el error aleatorio que se quiere cometer, la probabilidad ser de 1 . A menor nivel de confianza el intervalo ser ms preciso, pero se cometer un mayor error. Para comprender las siguientes frmulas, es necesario conocer los conceptos de variabilidad del parmetro, error, nivel de confianza, valor crtico y valor . Un intervalo de confianza es, pues, una expresin del tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al parmetro estimado con una determinada certeza o nivel de confianza 1-. Al ofrecer un intervalo de confianza se da por supuesto que los datos poblacionales se distribuyen de un modo determinado. Es habitual que lo hagan mediante la distribucin normal. 3.4Intervalo de confianza para la media con varianza conocida y desconocida.

Para construir un intervalo de confianza recurriremos a la siguiente definicin: Intervalo nde confianza de 1- cuando la es conocida y el tamao de muestra (n) es mayor a 30
x-Z /n x+Z /n

Como se menciona en la definicin este intervalo se usara cuando una muestra es grande (n>=30), y se conoce su , pero en algunos casos la muestra es pequea y se desconoce su desviacin por lo cual tendremos que recurrir a la siguiente definicin de intervalo:

Intervalo de confianza de 1- cuando la es desconocida y el tamao de muestra (n) es menor a 30


x-t/2sn x+t/2 s/n

Con grados de libertad (n-1)

Ahora apliquemos estos dos intervalos a nuestro caso en estudio la canasta Nochebuena como recordamos en el captulo 1. Tenemos que el tiempo estndar es =9.58 y la desviacin estndar es =1.1919 Tomando la maquina 13 y construyamos su intervalo de confianza con la muestra que a continuacin se muestra:
TIEMPO PRODUCCION

10.13 9.84 8.54 8.78 8.77 8.12 8.57

8.02 7.76 8.51 8.02 7.97 7.96 8.04

7.91 7.68 8.04 9.23 8.98 8.39 9.9

9.12 9.49 8.89 9.25 9.89 9.35 10.36

9.65 10.32 9.25 12.63 8.57 8.04 9.49

Su para metros son: n=35


x=8.956

s=1.0129 Como es una muestra grande ms de 30 tomaremos la frmula para grandes muestras, y con una confiabilidad del 99% partiendo del supuesto que no conocemos el proceso. Para una confiabilidad del 99% el valor Z/2=2.576, entonces (este valor como se recordara de su curso anterior se obtiene de las tabla, unas tablas similares a las que se vieron en el curso anterior se encuentran en el anexo, tabla a ). Entonces el intervalo se encuentra as:
8.956-2.576*1.19191358.956+2.376*1.1919135

Realizando los clculos el resultado es el siguiente: 8.437053159.47494685

Estos valores si los graficramos nos quedaran de la siguiente manera

Como se observa en el peor de los casos el tiempo de produccin de la maquina es mejor que el tiempo estndar por lo que podemos decir que es una buena eleccin si se programa.

Tomemos otra mquina pero ahora con una muestra pequea esto es menor a 30, tomemos la maquina 14. Y construyamos su intervalo de confianza con la muestra que a continuacin se muestra:
TIEMPO PRODUCCI ON

9.64 10.26 10.52 10.14 9.56 11.01 10.36 10.38 10.37

Sus parmetros son: n= 9


x=10.249

s= 0.441 Utilizaremos una confiabilidad del 99% partiendo del supuesto que no conocemos el proceso.

Para una confiabilidad del 99% y con =9-1=8 el valor t/2= 3.3554, entonces (este valor como se recordara de su curso anterior se obtiene de las tabla, unas tablas similares a las que se vieron en el curso anterior se encuentran en el anexo, tabla b), entonces el intervalo se encuentra as:
10.249-3.3554*0.441910.249+3.3554*0.4419

Realizando los clculos el resultado es el siguiente: 9.755756210.7422438 Estos valores si los graficramos nos quedaran de la siguiente manera Como se observa en la grafica el mejor de los casos el tiempo de produccin de la maquina es mayor que el tiempo estndar por lo que podemos decir que es una mala eleccin si se programa.

3.5 Intervalo de confianza para una proporcin. En muchos anlisis debemos obtener proporciones, probabilidades, ndices, tasas, tales como la proporcin de unidades defectuosas de un proceso, la probabilidad de que un artculo falle, o algn elemento se descomponga. En estos casos es razonable suponer que el anlisis de cada elemento es similar a la realizacin de un experimento de Bernoulli, o que el total de eventos sigue una distribucin binomial. El problema que queremos resolver es encontrar un intervalo de confianza para el parmetro q de la distribucin binomial,

que representa la verdadera proporcin de cierto tipo de eventos. El estimador de la proporcin poblacional p es la proporcin muestral definida como P = X/n, donde X se distribuye binomial con los parmetros (n,p). Entonces el intervalo de confianza para una proporcin es: Si P es la proporcin de observaciones que pertenecen a una clase de inters en una muestra aleatoria de tamao n, entonces un intervalo de confianza para una confiabilidad de 1- , para la verdadera proporcin P de la poblacin que pertenece a esta clase es:
p-Z/2*(p*(1-p))/nP p+ Z/2*(p*(1-p))/n

Recordemos que en el capitulo anterior, determinamos que el tiempo promedio de produccin es de 9.5838, y la proporcin que encontramos fue de .4545. Para este tema tomaremos la maquina 15, cuya muestra a continuacin se presenta:
TIEMPO PRODUCCION

9.64 10.26 10.52 10.14 9.56 11.01 10.36 10.38 10.37 12.86

11.77 11.19 10.38 11.59 10.59 9.64 10.13 10.29 9.8 10.13

10.19 10.23 10.13 11.97 10.13 9.84 8.54 8.78 8.77 8.12

8.57 8.02 7.76 8.51 8.02 7.97 7.96 8.04 7.91 7.68

Si contamos cuantas veces se produjo por debajo del tiempo promedio de 9.5838, encontramos que: X=15 y que en total se tuvieron 40 mediciones, lo nos permite encontrar p como sigue
p=1540=0.375

Con estos datos podremos construir un intervalo de confianza para la proporcin, y escogiendo una confiabilidad del 99%. Para poder construirlo necesitaremos el valor de Z/2=2.576 (como se recordara de su curso anterior este valor se obtiene de las tablas normal estndar inversa, tablas que se encuentran en el anexo, tabla a), aplicando la formula encontramos:
0.375-2.576*0.375*(1-.0375)/40p0.375+2.576*0.375*(1-0.375)/40

Realizando las operaciones el intervalo nos resulta:


0.1778p0.5721

Con estos resultados y observando que la proporcin poblacional, que se obtuvo en el capitulo anterior, podemos concluir que es una maquina regular porque la proporcin muestral es menor a la proporcin poblacional, aunque esta ltima proporcin esta dentro del intervalo de confianza.

3.2 Intervalo

de confianza para una varianza.

Recordando lo que se comento en el capitulo anterior en la seccin 2.7, sabemos que la distribucin muestral de la varianza es una distribucin chi cuadrada, con parmetro:
2= n-1 S2 2

Y con =n-1 grados de libertad Por lo que: El intervalo de confianza para una varianza, con una confiabilidad de 1- es :
n-1s2222n-1s21-22

Retomemos los datos de la maquina 14, de la seccin 3.4, en donde tenamos una muestra de tamao n=35, y una desviacin muestral de s=1.0129 y por lo tanto una varianza muestral de s2=1.026 que provena de una poblacin con varianza 2=1.421. Para realizar el clculo necesitamos los valores de chi cuadrada de cada lado que como usted vio en el curso de Probabilidad se obtiene de tablas (tablas similares encontrar en el anexo, tabla c), si tomamos una confiabilidad del 99% dado que desconocemos el proceso entonces tendremos y =35-1=34 entonces:
1-22=16.50

22=58.96

Por lo que el intervalo de confianza de la varianza, con un nivel de confiabilidad del 99% resultara:

0.59222.114

Como se puede usted dar cuenta como la varianza poblacional se encuentra dentro del intervalo podemos decir que es una buena mquina para trabajar dado que su varianza si pertenece a la poblacin en estudio. En muchos casos esto intervalos nos podrn permitir estudiar al proceso desde diferentes puntos de vista, tanto desde la media como parmetro dimensional, lo que nos permitir saber que tanto se deba ajustar el proceso para que est bajo control , como de la varianza como para averiguar el grado de homogeneidad de los datos alrededor de la media, este parmetro nos permitir hacer suposiciones sobre el estado del proceso, si requiere mantenimiento o una supervisin ms estricta o no, y finalmente las proporciones la cual nos permitir analizar desde el punto de vista de a productividad si algn elemento del proceso es ms productivo que otro o simplemente que tan productivo es cada elemento. En la practica un Lic. En informtica tendr que recurrir a estos intervalos para estudios los elementos del sistema, y as poder desarrollarlo ms eficientemente o si se encuentra en una rea de soporte tcnico le da la posibilidad de determinar los parmetros de control de todos los elementos del sistema.

You might also like