You are on page 1of 65

NORMA TCNICA COLOMBIANA

NTC 2062-1
2008-05-28

ESTADSTICA. VOCABULARIO Y SMBOLOS. PARTE 1: TRMINOS ESTADSTICOS GENERALES Y TRMINOS UTILIZADOS EN EL CLCULO DE PROBABILIDADES

E:

STATISTICS. VOCABULARY AND SYMBOLS. PART 1: GENERAL STATISTIC TERMS AND TERMS USED IN PROBABILITY.

CORRESPONDENCIA:

esta norma es idntica por traduccin (IDT) de la ISO 3534-1:2006. estadstica - vocabulario; estadstica terminologa; estadstica - probabilidad.

DESCRIPTORES:

I.C.S.: 03.120.30
Editada por el Instituto Colombiano de Normas Tcnicas y Certificacin (ICONTEC) Apartado 14237 Bogot, D.C. - Tel. (571) 6078888 - Fax (571) 2221435

Prohibida su reproduccin

Segunda actualizacin Editada 2008-06-10

PRLOGO

El Instituto Colombiano de Normas Tcnicas y Certificacin, ICONTEC, es el organismo nacional de normalizacin, segn el Decreto 2269 de 1993. ICONTEC es una entidad de carcter privado, sin nimo de lucro, cuya Misin es fundamental para brindar soporte y desarrollo al productor y proteccin al consumidor. Colabora con el sector gubernamental y apoya al sector privado del pas, para lograr ventajas competitivas en los mercados interno y externo. La representacin de todos los sectores involucrados en el proceso de Normalizacin Tcnica est garantizada por los Comits Tcnicos y el perodo de Consulta Pblica, este ltimo caracterizado por la participacin del pblico en general. La NTC 2062-1 (Segunda actualizacin) fue ratificada por el Consejo Directivo de 2008-05-28. Esta norma est sujeta a ser actualizada permanentemente con el objeto de que responda en todo momento a las necesidades y exigencias actuales. A continuacin se relacionan las empresas que colaboraron en el estudio de esta norma a travs de su participacin en el Comit Tcnico 4 Aplicacin de mtodos estadsticos. CHALLENGER S.A. COMPAA COLOMBIANA DE CERMICAS S.A. -COLCERMICACOMPAA NACIONAL DE CHOCOLATES S.A. GLOBAL PLASTIK S.A. INDUSTRIA DE ALIMENTOS ZEN S.A. INDUSTRIAS HUMCAR LTDA. SIKA COLOMBIA S.A. UNIVERSIDAD PEDAGGICA NACIONAL

Adems de las anteriores, en Consulta Pblica el Proyecto se puso a consideracin de las siguientes empresas: ACERAS DE CALDAS S.A. -ACASAACERAS PAZ DEL RO S.A. ALPINA PRODUCTOS ALIMENTICIOS S.A. ALMACENAMIENTO Y TRANSPORTE ESPECIALIZADO LTDA. -ALTE LTDAANHDRIDOS Y DERIVADOS DE COLOMBIA S.A. -ANDERCOLASEO TCNICO S.A. ASOCOLCAUCHOS ASOCRETO ATLANTIC MINERALS AND PRODUCTS CORPORATION ATOFINA COLOMBIA S.A. BAVARIA S.A. CABLES DE ENERGA Y DE TELECOMUNICACIONES S.A. -CENTELSACALZADO ATLAS S.A. CARBOQUMICA S.A. CENTRO TECNOLGICO PARA LAS INDUSTRIAS DEL CALZADO, CUERO Y AFINES -CEINNOVACEMENTOS DEL VALLE S.A. CODENSA S.A. ESP COLOMBIANA DE AUTO PARTES S.A. COLOMBIANA DE EXTRUSIN S.A. -EXTRUCOLCOMPAA COLOMBIANA DE TABACO S.A. -COLTABACOCOMPAA DE GALLETAS NOEL S.A. COMPAA NACIONAL DE LEVADURAS -LEVAPN S.A.CONCONCRETO S.A. CORPACERO- CORPORACIN DE ACERO COTECMAR - CORPORACIN DE CIENCIA Y TECNOLOGA PARA EL DESARROLLO DE LA INDUSTRIA NAVAL, MARTIMA Y FLUVIAL

CRISTALERA PELDAR S.A. CYGA DOCTOR CALDERN ASISTENCIA TCNICA AGRCOLA LTDA. EMPRESA COLOMBIANA DE PETRLEOS S.A.-ECOPETROLECSI S.A. EDITORIAL VOLUNTAD S.A. ELECTROMANUFACTURAS S.A. ELGMA SISTEMAS DE COLOMBIA LTDAEMPRESA DE ACUEDUCTO Y ALCANTARILLADO DE BOGOT ESP EMPRESAS PBLICAS DE MEDELLN S.A. ESP ENZIPAN DE COLOMBIA LTDA. ESCOBAR Y MARTNEZ S.A. ESCUELA COLOMBIANA DE INGENIERA ETERNA S.A. EXXON MBIL DE COLOMBIA S.A. FINCA S.A. FRIGORFICO GUADALUPE S.A. FRIGORFICO SUIZO S.A. FUNDACIN CENTRO DE CALIDAD Y METROLOGA GAS NATURAL S.A. ESP INALCEC - CORPORACIN INSTITUTO NACIONAL DE CONSULTORA EN CALIDAD INDEPENDIENTE FERNANDO NGEL INDEPENDIENTE HERNN DARO LZATE INDEPENDIENTE JAIRO NGEL INDEPENDIENTE JULIO GARCA SAMPEDRO INDUSTRIA COLOMBIANA DE ELECTRNICOS Y ELECTRODOMSTICOS S.A. -INCELT S.A.INDUSTRIA COLOMBIANA DE LLANTAS S.A. -ICOLLANTASINDUSTRIA FARMACUTICA SYNTOFARMA S.A. INDUSTRIAS ALIADAS S.A. INGENIERA DE DESARROLLO Y TECNOLOGA -IDT LTDAINGENIO PICHICH S.A. INSTITUTO COLOMBIANO AGROPECUARIO -ICAINSTITUTO COLOMBIANO DE PRODUCTORES DE CEMENTO -ICPCINSTITUTO NACIONAL DE SALUD -INSINVESA S.A. IVONNE BERNIER LABORATORIO LTDA

LARKIN LTDA. LHAURAVET LTDA. MATRICES, TROQUELES Y MOLDES CA LTDA. MERCADEO DE ALIMENTOS DE COLOMBIA S.A. -MEALS S.A.METALRGICA CONSTRUCEL COLOMBIA S.A. -METACOLMINERALES INDUSTRIALES S.A. MOLINO EL LOBO LTDA MONMEROS COLOMBO VENEZOLANOS E.M.A. NUTRIANLISIS LTDA. PAPELERA MNACO LTDA. PARABOR COLOMBIA LTDA. PETROQUMICA COLOMBIANA S.A. POSTOBN S.A. PRODUCTORES DE ENVASES FARMACUTICOS S.A. -PROENFARPROFICOL S.A. QUIMIA LTDA. RAZA S.A. RENTASISTEMAS LTDA. RONELLY S.A. SCHNEIDER ELECTRIC DE COLOMBIA S.A. SENA CENTRO NACIONAL TEXTIL SENA CENTRO NACIONAL DE LA MADERA SENA REGIONAL BOGOT SIEMENS S.A. SOCIEDAD DE ACUEDUCTO ALCANTARILLADO Y ASEO DE B/QUILLA E.S.P. - TRIPLE A SYNGENTA S.A. TECNOLOGA EMPRESARIAL DE ALIMENTOS S.A. THOMAS GREG & SONS DE COLOMBIA S.A. IMPRESOR DE VALORES TRANSPORTES VIGA S.A. UNIVERSIDAD DE ANTIOQUIA UNIVERSIDAD DE BOYAC -UNIBOYACUNIVERSIDAD DEL VALLE UNIVERSIDAD JORGE TADEO LOZANO UNIVERSIDAD MANUELA BELTRN UNIVERSIDAD NACIONAL DE COLOMBIA SEDE-MEDELLIN UNIVERSIDAD NACIONAL DE COLOMBIA, BOGOT - REVISTA COLOMBIANA DE ESTADSTICA

ICONTEC cuenta con un Centro de Informacin que pone a disposicin de los interesados normas internacionales, regionales y nacionales y otros documentos relacionados.

DIRECCIN DE NORMALIZACIN

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

CONTENIDO

Pgina 0. INTRODUCCIN ..........................................................................................................1

1.

OBJETO .......................................................................................................................2

2.

TRMINOS ESTADSTICOS GENERALES ................................................................2

3.

TRMINOS USADOS EN PROBABILIDAD ..............................................................20

DOCUMENTO DE REFERENCIA..........................................................................................60

ANEXOS ANEXO A (Informativo) SMBOLOS.............................................................................................................................45 ANEXO B (Informativo) DIAGRAMA DE CONCEPTOS ESTADSTICOS...................................................................46 ANEXO C (Informativo) DIAGRAMA DE CONCEPTOS DE PROBABILIDAD............................................................52 ANEXO D (Informativo) METODOLOGA USADA EN EL DESARROLLO DEL VOCABULARIO .............................56

TABLAS Tabla 1. Resultados para el ejemplo 1..................................................................................9 Tabla 2. Ejemplo de distribucin binomial.........................................................................26 Tabla 3. Ejemplo de distribucin normal estandarizada...................................................26 Tabla 4. Ejemplo de distribucin hipergeomtrica............................................................37

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

ESTADSTICA. VOCABULARIO Y SMBOLOS. PARTE 1: TRMINOS ESTADSTICOS GENERALES Y TRMINOS UTILIZADOS EN EL CLCULO DE PROBABILIDADES

0.

INTRODUCCIN

Las versiones vigentes de la NTC 2062-1 (ISO 3534-1) y de la NTC 2062-2 (ISO 3534-2) estn propuestas para ser compatibles. Ellas comparten el objetivo comn de restringir sus niveles matemticos respectivos a los mnimos necesarios para alcanzar definiciones concisas, coherentes y correctas. La Parte 1 sobre los trminos usados en probabilidad y estadstica es fundamental, tambin por necesidad, que est presentada en un nivel matemtico un poco complejo. Reconociendo que los usuarios de la NTC 2062-2 (ISO 3534-2) o de otras normas de estadstica aplicada pueden consultar ocasionalmente esta primera parte de la NTC 2062 (ISO 3534) para la definicin de ciertos trminos, algunos de stos son descritos de una manera menos tcnica en las notas y son ilustrados con ejemplos. Aunque estas descripciones informales no substituyen las definiciones formales, pueden suministrar una definicin tcnica de conceptos para un principiante, sirviendo a las necesidades de los mltiples usuarios de estas normas de terminologa. Para hacer esta primera parte de la NTC 2062 (ISO 3534) ms accesible al usuario aplicado, quien normalmente estara involucrado con normas tales como la NTC 2062-2 (ISO 3534-2) o la serie NTC 3529 (ISO 5725), se ofrecen, por ejemplo, notas y ejemplos adicionales. Para el desarrollo y uso efectivo de normas de estadstica es esencial una serie bien definida y razonablemente completa de trminos de probabilidad y estadstica. Las definiciones suministradas aqu deben ser suficientemente precisas y de complejidad matemtica para que los desarrolladores de normas de estadstica sean capaces de evitar ambigedades. De hecho, se pueden encontrar en libros de texto de estadstica y de probabilidad explicaciones ms detalladas de conceptos, de sus contextos y de sus campos de aplicacin. En un anexo informativo se suministran los diagramas de concepto para cada grupo de trminos: 1) trminos estadsticos generales (en el Anexo B), y 2) trminos usados en probabilidad (en el Anexo C). Hay seis diagramas de concepto para trminos estadsticos y cuatro diagramas de concepto para trminos relacionados con probabilidad. Algunos trminos aparecen en diagramas mltiples que suministran una relacin entre una serie y otra de conceptos. El Anexo D suministra una introduccin breve sobre los Diagramas de Concepto y su interpretacin. Estos diagramas fueron herramientas en la construccin de esta revisin ya que ayudaron en el delineamiento de las interrelaciones de varios trminos. Estos diagramas son tambin tiles en la traduccin de la norma a otros idiomas. 1 de 60

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Como comentario general con respecto a gran parte de la norma, a menos que se indique de otra manera, las definiciones relacionan el caso unidimensional (de una variable). Se admite esta disposicin para eliminar la necesidad de mencionar repetitivamente el objeto unidimensional para la mayora de las definiciones.

1.

OBJETO

Esta norma define trminos estadsticos generales y trminos usados en el clculo de probabilidades, que se pueden usar para la redaccin de otras normas. Adems, define los smbolos para un nmero limitado de estos trminos. Los trminos estn clasificados bajo los siguientes ttulos: Trminos estadsticos generales (vase el numeral 2). Trminos usados en clculo de probabilidades (vase el numeral 3).

El Anexo A suministra una lista de smbolos y abreviaturas recomendados para uso con esta norma. Las entradas de esta primera parte de la NTC 2062 (ISO 3534) estn organizadas en asociacin con los diagramas de conceptos presentados en los Anexos B y C.

2.

TRMINOS ESTADSTICOS GENERALES

2.1 Poblacin (Population). Totalidad de los elementos bajo consideracin.


NOTA 1 Una poblacin puede ser real y finita, real e infinita o completamente hipottica. Algunas veces el trmino "poblacin finita", especialmente en muestreo de muestreo por encuestas. Igualmente, el trmino "poblacin infinita" se usa en el contexto de muestreo continuo. En el numeral 2 la poblacin se considerar en un contexto probabilstico como el espacio muestral (vase el numeral 3.1). NOTA 2 Una poblacin hipottica permite imaginar la naturaleza de datos futuros con base en diferentes hiptesis. En consecuencia, las poblaciones hipotticas son tiles en la etapa de diseo de las investigaciones estadsticas, particularmente para determinar tamaos de muestra apropiados. Una poblacin hipottica puede tener un nmero finito o infinito. Es un concepto particularmente til en estadstica inferencial para ayudar a evaluar la solidez de la evidencia en una investigacin estadstica. NOTA 3 El contexto de una investigacin puede determinar la naturaleza de la poblacin. Por ejemplo, si se seleccionan tres poblaciones para un estudio demogrfico o de salud, entonces la poblacin consiste en los residentes de estos poblaciones en particular. Como alternativa, si las tres poblaciones fueron seleccionadas aleatoriamente de los poblaciones de una regin especfica, entonces la poblacin estara compuesta de todos los residentes de la regin.

2.2 Unidad de muestreo (Sampling Unit). Una de las partes individuales en las que est dividida una poblacin (vase el numeral 2.1).
NOTA Dependiendo de las circunstancias, la parte de inters ms pequea puede ser un individuo, una familia, un distrito escolar, una unidad administrativa, etc.

2.3 Muestra (Sample). Subconjunto de una poblacin (vase el numeral 2.1) compuesto de una o ms unidades de muestreo (vase el numeral 2.2).
NOTA 1 Las unidades de muestreo pueden ser elementos, valores numricos o incluso entidades abstractas que dependen de la poblacin de inters.

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 2 La definicin de muestra de la NTC 2062-2 (ISO 3534-2) incluye un ejemplo de base de muestreo que es esencial al tomar una muestra aleatoria de una poblacin finita.

2.4 Valor observado (Observed Value). Valor obtenido de una propiedad asociada con un elemento de una muestra (vase el numeral 2.3).
NOTA 1 Los sinnimos comunes son "resultado" y "dato".

NOTA 2 La definicin no especifica el origen ni la forma en la que se ha obtenido este valor. El valor puede representar un resultado de una variable aleatoria (vase el numeral 2.10), pero no de manera exclusiva. Puede ser uno de varios de estos valores que sern sometidos posteriormente a anlisis estadstico. Aunque las inferencias apropiadas requieren alguna sustentacin estadstica, no hay nada que impida elaborar resmenes o descripciones grficas de los valores observados. Slo en el caso de aspectos concomitantes, tales como la determinacin de la probabilidad de observar un conjunto especfico de realizaciones, los mecanismos estadsticos llegan a ser tanto pertinentes como esenciales. La etapa preliminar de un anlisis de valores observados se denomina comnmente anlisis de datos.

2.5 Estadstica descriptiva (Descriptive Statistics). Descripcin grfica, numrica u otro anlisis de sntesis de los valores observados (vase el numeral 2.4).
EJEMPLO 1 Los resmenes numricos incluyen el promedio (vase el numeral 2.15), rango (vase el numeral 2.10), desviacin estndar de la muestra (vase el numeral 2.17), entre otros. EJEMPLO 2 Los ejemplos de resmenes grficos incluyen grficos de cajas, diagramas, grficos Q-Q, diagramas de cuantila normal, diagramas de dispersin mltiple e histogramas.

2.6 Muestra aleatoria (Random Sample). Muestra (vase el numeral 2.3) que ha sido seleccionada usando un mtodo de seleccin aleatoria.
NOTA 1 infinitas. Esta definicin es menos limitante que la presentada en la NTC 2062-2 (ISO 3534-2) y prev poblaciones

NOTA 2 Cuando la muestra de n unidades de muestreo se selecciona de un espacio muestral (vase el numeral 2.1) finito, cada uno de cuyas combinaciones posibles de n unidades de muestreo tendr una probabilidad particular (vase el numeral 3.5) de ser tomada. Para los planes de muestreo por encuesta, la probabilidad particular para cada combinacin posible se puede calcular por adelantado. NOTA 3 Para muestreo por encuesta de un espacio muestral finito, se puede seleccionar una muestra aleatoria mediante diferentes planes de muestreo tales como muestreo aleatorio estratificado, muestreo aleatorio sistemtico, muestreo por etapas mltiples, muestreo con probabilidad de muestreo proporcional al tamao de una variable auxiliar y muchas otras posibilidades. NOTA 4 La definicin generalmente hace referencia a valores observados reales (vase el numeral 2.4). Estos valores observados se consideran como resultados de variables aleatorias (vase el numeral 2.10), en donde cada valor observado corresponde a una variable aleatoria. Cuando los estimadores (vase el numeral 2.12), las estadsticas de ensayo para pruebas estadsticas (vase el numeral 2.48) o intervalos de confianza (vase el numeral 2.28) se obtienen de una muestra aleatoria, la definicin hace referencia a las variables aleatorias que surgen de entidades abstractas en la muestra, y no a los valores reales observados de estas variables aleatorias. NOTA 5 Las muestras aleatorias de poblaciones infinitas se generan con frecuencia mediante tomas repetidas del espacio muestral, lo que conduce a una muestra compuesta de variables aleatorias distribuidas en forma idntica usando la interpretacin de esta definicin mencionada en la Nota 4.

2.7 Muestra aleatoria simple (Simple Random Sample). <Poblacin finita> muestra aleatoria (vase el numeral 2.6), tal que cada subconjunto de un tamao dado tiene la misma probabilidad de seleccin.
NOTA Esta definicin concuerda con la definicin dada en la NTC 2062-2 (ISO 3534-2), aunque la redaccin aqu es ligeramente diferente.

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

2.8 Estadstico (Statistic). Funcin completamente especificada de variables aleatorias (vase el numeral 3.10).
NOTA 1 Un estadstico es una funcin con variables aleatorias en una muestra aleatoria (vase el numeral 2.6), en el sentido indicado en la Nota 4 del numeral 2.6. NOTA 2 Con referencia a la Nota 1, si {X1, X2, ..., Xn} es una muestra aleatoria de una distribucin normal (vase el numeral 3.50) con una media desconocida (vase el numeral 3.35) y la desviacin estndar desconocida (vase el numeral 3.37) , entonces la expresin (X1 +, X2 + ... + Xn)/n es una funcin estadstica, la media de la muestra (vase el numeral 2.15), mientras que [(X1 + X2, .+.., Xn)/n] - no es un estadstico, ya que involucra el valor desconocido del parmetro (vase el numeral 3.9) . NOTA 3 La definicin dada aqu es tcnica, corresponde al tratamiento encontrado en estadstica matemtica. En aplicaciones, la palabra estadstica puede hacer referencia a la disciplina tcnica que involucra las actividades de anlisis descritas en las normas internacionales del comit ISO/TC 69.

2.9 Estadstico de orden (Order Statistic). Estadstico (vase el numeral 2.8) determinado por su jerarquizacin en un orden no decreciente de variables aleatorias (vase el numeral 3.10).
EJEMPLO Sean los valores observados de una muestra 9, 13, 7, 6, 13, 7, 19, 6, 10 y 7. Los valores observados del estadstico de orden son 6, 6, 7, 7, 7, 9, 10, 13, 13, 19. Estos valores constituyen resultados de X(1) a X(10). NOTA 1 Sean los valores observados (vase el numeral 2.4) de una muestra aleatoria (vase el numeral 2.6) {X1, X2, ..., Xn}, clasificados en un orden no decreciente designado como x(1) ... x(k) ... x(n). Entonces (x(1) , x(k), ... x(n) ) es el valor observado del estadstico de orden (X(1), ... X(k), ..., X(nk) ) y x(k) es el valor observado de la estadstica de orden (X(1), ... , X(k), ..., X(n) y x(k) es el valor observado del estadstico de orden ksimo. NOTA 2 En trminos prcticos, el estadstico de orden para un conjunto de datos se obtiene ordenando los datos como se describe formalmente en la Nota 1. La forma ordenada del conjunto de datos permite obtener estadsticas resumidas tiles como se describe en las siguientes definiciones. NOTA 3 Los estadsticos de orden involucran valores de muestra identificados por su posicin despus de jerarquizar en orden no decreciente. Como en el ejemplo, es ms fcil entender la clasificacin de los valores de muestra (resultados de variables aleatorias) que la clasificacin de las variables aleatorias no observadas. Sin embargo, es posible concebir variables aleatorias de una muestra aleatoria (vase el numeral 2.6), dispuestas en un orden no decreciente. Por ejemplo, el mximo de n variables aleatorias se puede estudiar antes de su valor resultante. NOTA 4 Un estadstico de orden individual es un estadstico que es una funcin completamente especificada de una variable aleatoria. Esta funcin es simplemente la funcin de identidad con la identificacin de la posicin o rango en el conjunto ordenado de variables aleatorias. NOTA 5 Los valores ligados presentan un problema potencial, especialmente para variables discretas aleatorias y para resultados que se expresan con una resolucin baja. La palabra "no decreciente" se usa en vez de "ascendente" como un enfoque sutil del problema. Se debe enfatizar que los valores ligados se conservan y no se agrupan en un solo valor ligado. En el ejemplo anterior, los dos resultados de 6 y 6 son valores ligados. NOTA 6 El ordenamiento ocurre con referencia a la lnea real y no a los valores absolutos de las variables aleatorias. NOTA 7 El conjunto completo de estadsticos de orden consta de una variable aleatoria dimensional n, en donde n es el nmero de observaciones en la muestra. NOTA 8 Los componentes del estadstico de orden tambin se designan como estadsticos de orden, pero con un calificativo que da el nmero de la secuencia de los valores ordenados de la muestra. NOTA 9 El tamao mnimo de muestra, el mximo, y para los tamaos de muestra impares, la mediana de la muestra (vase el numeral 2.13), son casos especiales de estadsticos de orden. Por ejemplo, para un tamao de muestra 11, X(1) es el mnimo, X(11) es el mximo y X(6) es la mediana de la muestra.

2.10 Rango de la muestra (Sample Range). El mayor estadstico de orden (vase el numeral 2.9) menos el estadstico de menor orden.
EJEMPLO Retomando el ejemplo del numeral 2.9, el rango de la muestra observado es 19 - 6 = 13.

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA En control estadstico de procesos, el rango de la muestra se usa con frecuencia para monitorear la dispersin durante el tiempo de un proceso, particularmente cuando los tamaos de muestra son relativamente pequeos.

2.11 Rango medio (Mid-Range). Promedio (vase el numeral 2.15) de los estadsticos de orden (vase el numeral 2.9) menor y mayor.
EJEMPLO El rango medio observado para los valores del ejemplo en 2.9 es (6 + 19)/2 = 12,5. NOTA El rango medio brinda una evaluacin rpida y simple de la mitad de un pequeo conjunto de datos.

2.12 Estimador (Estimator) . Estadstico (vase el numeral 2.8) usado en la estimacin (vase el numeral 2.36) del parmetro .
NOTA 1 Un estimador puede ser la media de la muestra (vase el numeral 2.15) prevista para estimar la media de la poblacin (vase el numeral 3.35), que se puede denotar mediante . Para una distribucin (vase el numeral 2.11) tal como la distribucin normal (vase el numeral 2.50), el estimador "natural" de la media de la poblacin es la media de la muestra. NOTA 2 Para estimar una propiedad de la poblacin [por ejemplo, la moda (vase el numeral 2.27) para una distribucin con una variable (vase el numeral 2.16)], un estimador apropiado puede estar en funcin del (los) estimador(es) del (los) parmetro(s) de una distribucin o pueden ser una funcin compleja de una muestra aleatoria (vase el numeral 2.6). NOTA 3 El trmino "estimador" se usa aqu en un sentido amplio. Incluye el estimador puntual de un parmetro, al igual que el estimador por intervalos, utilizado eventualmente para prediccin (algunas veces se denomina predictor). El estimador tambin puede incluir funciones tales como los estimadores tipo ncleo y otras funciones estadsticas con propsito especial. En las notas del numeral 2.36 se suministran comentarios adicionales.

2.13 Mediana de la muestra (Sample Median). Estadstico de orden [(n+1)/2]-simo (vase el numeral 2.9) si el tamao de la muestra (vase la NTC 2062-2 (ISO 3534-2), numeral 2.2.26) n es impar; la suma del estadstico de orden (n/2)-simo y [(n/2) + 1]-simo dividido por 2, si el tamao de la muestra n es par.
EJEMPLO Continuando con el ejemplo del numeral 2.9, el valor de 8 es el resultado de la mediana de la muestra. En este caso (tamao de muestra par de 10), los valores quinto y sexto fueron 7 y 9, cuyo promedio es igual a 8. En la prctica, esto se reportara como "la mediana de la muestra es 8", aunque estrictamente hablando, la mediana de la muestra se define como una variable aleatoria. NOTA 1 Para una muestra aleatoria (vase el numeral 2.6) de tamao de muestra n cuyas variables aleatorias (numeral 2.10) estn dispuestas en orden no descendente desde 1 hasta n, la mediana de la muestra es la variable aleatoria (n+1)/2-sima si el tamao de la muestra es impar. Si el tamao de la muestra n es par, entonces la mediana de la muestra es el promedio de las variables aleatorias (n/2)-sima y (n+1)/2-sima. NOTA 2 Conceptualmente, puede parecer imposible realizar un ordenamiento de variables aleatorias que no han sido observadas an. No obstante, la estructura para comprender los estadsticos de orden se puede establecer de manera que al llevar a cabo la observacin es posible realizar el anlisis. En la prctica se obtienen los valores observados y mediante la clasificacin de los valores se obtienen los resultados del estadstico de orden. Estos resultados se pueden interpretar entonces a partir de la estructura de los estadsticos de orden de una muestra aleatoria. NOTA 3 La mediana de la muestra suministra un estimador de la mitad de una distribucin, con la mitad de la muestra a cada lado de ella. NOTA 4 En la prctica, la mediana de la muestra es til para brindar un estimador que sea insensible a valores muy extremos en un conjunto de datos. Por ejemplo, los ingresos medianos y los precios medianos de las viviendas se reportan con frecuencia como valores resumidos.

2.14 Momento de la muestra de orden k (Sample Moment of Order k). E(Xk). Suma de la potencia ksima de las variables aleatorias (vase el numeral 2.10) en una muestra aleatoria (vase el numeral 2.6) dividida por el nmero de observaciones en la muestra (vase el numeral 2.3). 5

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 1 Para una muestra aleatoria del tamao de la muestra n, es decir, {X1, X2,... Xn}, el momento de la muestra k de orden k, E(X ) es

1 n K Xi n i =1
NOTA 2 cero. Adems, este concepto se puede describir como el momento de la muestra de orden k en relacin con

NOTA 3 El momento de la muestra de orden 1 se ver en la definicin siguiente como la media de la muestra (vase el numeral 2.15). NOTA 4 Aunque la definicin se da para k arbitrario, los ejemplos usados comnmente en la prctica involucran a k = 1 [media de la muestra (vase el numeral 2.15)], k= 2 [asociado con la varianza de la muestra] (vase el numeral 2.16) y la desviacin estndar de la muestra (vase el numeral 2.17)], k= 3 (relacionado con el coeficiente de asimetra de la muestra (vase el numeral 2.20)] y k = 4 [relacionado con el coeficiente de curtosis de la muestra (vase el numeral 2.21)]. NOTA 5 La "E" en E (Xk) proviene del "valor esperado" o "expectativa" de la variable aleatoria X.

2.15 Media de la muestra, promedio, media aritmtica (Sample Mean, Average, Arithmetic Mean). Suma de las variables aleatorias (vase el numeral 3.10) en una muestra aleatoria (vase el numeral 2.6), dividida por el nmero de trminos de la suma.
EJEMPLO Continuando con el ejemplo del numeral 2.9, el resultado de la media de la muestra es 9,7 ya que la suma de los valores observados es 97 y el tamao de la muestra es 10. NOTA 1 Considerada como un estadstico, la media de la muestra es una funcin de las variables aleatorias de una muestra aleatoria en el sentido dado en la Nota 3 del numeral 2.8. Se debe diferenciar este estimador del valor numrico de la media de la muestra calculada de los valores observados (vase el numeral 2.4) en la muestra aleatoria. NOTA 2 La media de la muestra considerada como un estadstico se usa con frecuencia como un estimador de la media (vase el numeral 3.35) de la poblacin. Un sinnimo comn es media aritmtica. NOTA 3 Para una muestra aleatoria de un tamao de muestra n, es decir, {X1, X2,..., X n}, la media de la muestra es: X NOTA 4 1 n K X n i =1 i

La media de la muestra se puede reconocer como el momento de la muestra de orden 1.

NOTA 5 Para un tamao de muestra 2, la media de la muestra, la mediana de la muestra (vase el numeral 2.13) y el rango medio (vase el numeral 2.11) son los mismos.

2.16 Varianza de la muestra (Sample Variance), S2. Suma de las desviaciones al cuadrado de variables aleatorias (vase el numeral 3.10) en una muestra aleatoria (vase el numeral 2.6) respecto a su media de la muestra (vase el numeral 2.15), dividida por el nmero de trminos en la suma, menos uno.
EJEMPLO Continuando con el ejemplo numrico del numeral 2.9, la varianza de la muestra se puede calcular como 17,57. La suma de los cuadrados en relacin con la media de la muestra observada es 158,10 y el tamao de la muestra 10 menos 1 es 9, lo que da un denominador apropiado. NOTA 1 Considerada como un estadstico (vase el numeral 2.8), la varianza de la muestra S2 es una funcin de las variables aleatorias de una muestra aleatoria. Es necesario diferenciar este estimador (vase el numeral 2.12) del valor numrico de la varianza de la muestra calculada de los valores observados (vase el numeral 2.4) en la muestra aleatoria. El valor numrico se 2 denomina varianza emprica de la muestra o varianza observada de la muestra y se designa usualmente por s . NOTA 2 Para una muestra aleatoria de tamao de muestra, n, es decir, {X1, X2, ..., Xn,) con la media de la muestra X , la varianza de la muestra es:

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

S2 =

1 n 1

i =1

(X

X )2

NOTA 3 La varianza de la muestra es una funcin estadstica que es "casi" el promedio de los cuadrados de las desviaciones de las variables aleatorias (vase el numeral 3.10) respecto a su media de muestra (solo "casi", ya que n - 1 se usa en vez de n en el denominador). Al utilizar n - 1 se obtiene un estimador sin sesgo (vase el numeral 2.34) de la varianza de la poblacin (vase el numeral 3.36). NOTA 4 La cantidad n - 1 se conoce como los grados de libertad (vase el numeral 3.54).

NOTA 5 La varianza de la muestra se puede reconocer como el segundo momento de la muestra de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19).

2.17 Desviacin estndar de la muestra, S. (Sample Standard Deviation, S). Raz cuadrada no negativa de la varianza de la muestra (vase el numeral 2.16).
EJEMPLO Continuando con el ejemplo numrico del numeral 2.9, la desviacin estndar de la muestra observada es 4,192, ya que la varianza de la muestra observada es 17,57. NOTA 1 En la prctica, la desviacin estndar de la muestra se usa para estimar la desviacin estndar (vase el numeral 3.37). De nuevo, es conveniente hacer nfasis en que S tambin es una variable aleatoria (vase el numeral 3.10) y no un resultado de una muestra aleatoria (vase el numeral 2.6). NOTA 2 La desviacin estndar de la muestra es una medida de la dispersin de una distribucin (vase el numeral 3.11).

2.18 Coeficiente de variacin de la muestra (Sample Coefficient of Variation). Desviacin estndar de la muestra (vase el numeral 2.17) dividida por la media de la muestra (vase el numeral 2.15).
NOTA Al igual que con el coeficiente de variacin (vase el numeral 3.38), la utilidad de esta funcin estadstica est limitada a poblaciones que se valoran positivamente. El coeficiente de variacin se reporta comnmente como un porcentaje.

2.19 Variable aleatoria normalizada de la muestra (Standardized Sample Random Variable). Variable aleatoria (vase el numeral 3.10) menos su media de la muestra (vase el numeral 2.15), dividida por la desviacin estndar de la muestra (vase el numeral 2.17).
EJEMPLO Para el ejemplo del numeral 2.9, la media de la muestra observada es 9,7 y la desviacin estndar de la muestra observada es 4,192. En consecuencia, las variables aleatorias normalizadas (a dos lugares decimales) son: -0,17; 0,79; -0,64; -0,88; 0,79; -0,64; 2,22; - 0,88; 0,07; - 0,62. NOTA 1 La variable aleatoria normalizada de la muestra se diferencia de su contraparte terica la variable aleatoria normalizada (vase el numeral 3.33). La intencin de la normalizacin es transformar variables aleatorias con el fin de obtener medias iguales a cero y desviaciones estndar unitarias, y facilitar la interpretacin y la comparacin. NOTA 2 Los valores observados normalizados tienen una media observada de cero y una desviacin estndar observada de 1.

2.20 Coeficiente de asimetra de la muestra (Sample Coefficient of Skewness). Media aritmtica de la tercera potencia de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19) de una muestra aleatoria (vase el numeral 2.6).
EJEMPLO Continuando con el ejemplo del numeral 2.9, el coeficiente de asimetra observado de la muestra se puede calcular como 0,971 88. Para un tamao de muestra de 10 en este ejemplo, el coeficiente de asimetra de la muestra es considerablemente variable, de manera que se debe usar con precaucin. Al usar la frmula alternativa de la Nota 1, el valor calculado es 1,349 83.

NORMA TCNICA COLOMBIANA


NOTA 1

NTC 2062-1 (Segunda actualizacin)

La frmula correspondiente a la definicin es 1 n

i =1

Xi X S

Algunos paquetes estadsticos utilizan la siguiente frmula para el coeficiente de asimetra de la muestra para corregir el sesgo (vase el numeral 2.33):
n ( n 1) ( n 2 )
en donde
Xi X Zi = S

Z
i =1

3 i

Para una muestra tamao grande, la diferencia entre los dos estimados es insignificante. La relacin del estimado sin sesgo al estimado con sesgo es 1,389 para n = 10, 1,031 para n = 100 y 1,003 para n = 1 000.
NOTA 2 Asimetra designa la falta de simetra. Los valores de esta funcin estadstica cercanos a cero sugieren que la distribucin subyacente es aproximadamente simtrica, mientras que los valores diferentes de cero corresponderan a una distribucin con valores extremos ocasionales a un lado del centro de la distribucin. Los datos asimtricos tambin se reflejaran en valores de la media de la muestra (vase el numeral 2.15) y la mediana de la muestra (vase el numeral 2.13) que son distintos. Los datos con asimetra positiva (asimetra hacia la derecha) indican la presencia posible de algunos valores extremos altos. En forma similar, los datos con asimetra negativa (asimetra a la izquierda) indican la presencia posible de algunos valores extremos bajos. NOTA 3 El coeficiente de asimetra de la muestra se puede reconocer como el tercer momento de la muestra de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19).

2.21 Coeficiente de curtosis de la muestra (Sample Coefficient of Kurtosis). La media aritmtica de la cuarta potencia de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19) de una muestra aleatoria (vase el numeral 2.6).
EJEMPLO Continuando con el ejemplo del numeral 2.9, el coeficiente de curtosis observado de la muestra se puede calcular como 2,674 19. Para un tamao de muestra de 10 en este ejemplo, el coeficiente de curtosis de la muestra es considerablemente variable, de manera que se debe usar con precaucin. Los paquetes estadsticos usan diversos ajustes para calcular el coeficiente de curtosis de la muestra (vase la Nota 3 del numeral 3.40). Usando la frmula alterna dada en la Nota 1, el valor calculado es 0,436 05. Los dos valores 2,674 19 y 0,436 05 no son comparables directamente. Para hacerlo, tome 2,674 19 - 3 (para relacionarlo con la curtosis de la distribucin normal, que es 3) que es igual a -0,325 81 y ahora se puede comparar apropiadamente con 0,436 05. NOTA 1 La frmula correspondiente a la definicin es:

1 n

i =1

Xi X S

Algunos paquetes estadsticos usan la frmula siguiente para el coeficiente de curtosis de la muestra para hacer la correccin de sesgo (vase el numeral 2.33) y para indicar la desviacin de la curtosis en relacin con la distribucin normal (que es igual a 3):

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

n( n + 1) ( n 1) ( n 2 ) ( n 3)

i =1

Z i4

3 ( n 1 )2 ( n 2 ) ( n 3)

en donde
Xi X S

Zi =

El segundo trmino de la expresin es aproximadamente 3 para un n grande. Algunas veces la curtosis es reportada como un valor tal como se define en el numeral 3.40, menos 3, para hacer nfasis en las comparaciones con la distribucin normal. Obviamente, el profesional necesita conocer estos ajustes, si los hay, en los clculos de paquetes estadsticos.
NOTA 2 La curtosis designa la mayor ponderacin de las colas de una distribucin (unimodal). Para la distribucin normal (vase el numeral 3.50), el coeficiente de curtosis es aproximadamente 3, sujeto a la variabilidad de la muestra. En la prctica, la curtosis de la distribucin normal brinda un valor de referencia. Las distribuciones (vase el numeral 3.11) con valores menores de 3 tienen colas con menor ponderacin que la distribucin normal; las distribuciones con valores mayores de 3 tienen ponderaciones mayores que la distribucin normal. NOTA 3 Para los valores de curtosis observados mucho mayores de 3, existe la posibilidad de que la distribucin subyacente tenga colas con ponderacin mayor que la distribucin normal. Otra posibilidad por investigar es la presencia de datos atpicos potenciales. NOTA 4 El coeficiente de curtosis de la muestra se puede reconocer como el cuarto momento de la muestra de las variables aleatorias centradas de la muestra reducida.

2.22 Covarianza de la muestra, SXY. (Sample Covariance, SXY.). Suma de los productos de las desviaciones de pares de variables aleatorias (vase el numeral 3.10) en una muestra aleatoria (vase el numeral 2.6) respecto a su media de la muestra (vase el numeral 2.15), dividida por el nmero de trminos en la suma, menos uno.
EJEMPLO 1 Sea la representacin numrica siguiente utilizando 10 valores observados en tres tripletas de valores. Para este ejemplo considere solamente x y y. Tabla 1. Resultados para el Ejemplo 1 i x y z 1 38 73 34 2 41 74 31 3 24 43 40 4 60 107 28 5 41 65 35 6 51 73 28 7 58 99 32 8 50 72 27 9 65 100 27 10 33 48 31

La media de la muestra observada para X es 46,1 y para Y es 75,4. La covarianza de la muestra es igual a:
[(38 - 46,1) x (73 - 75,4) + (41 - 46,1) x (74 - 75,4) + ...+ (33 - 46,1) x (48 - 75,4)]/9 = 257,178 EJEMPLO 2 En la tabla del ejemplo anterior, considere solamente y y z. La media de la muestra observada para Z es 31,3. La covarianza de la muestra es igual a: [(73 - 75,4) x (34 - 31,3) + (74 - 75,4) x (74 - 31,3) + (48 - 75,4) x (31-31,3)]/9 = 54,356 NOTA 1 Considerado como un estadstico (vase el numeral 2.8), la covarianza de la muestra es una funcin de pares de variables aleatorias [(X1, Y1), (X2, Y2), ..., (Xn, Yn)] de una muestra aleatoria de tamao n en el sentido dado en la Nota 3 del numeral 2.6. Este estimador (2.12) necesita diferenciarse del valor numrico de la covarianza de la muestra calculada de los pares de valores observados de las unidades de muestra (vase el numeral 2.2) [(x1, y1), (x2 , y2), ... , (xn, yn)] en la muestra aleatoria. Este valor numrico se denomina covarianza de la muestra emprica o covarianza de la muestra observada.

NORMA TCNICA COLOMBIANA


NOTA 2

NTC 2062-1 (Segunda actualizacin)

La covarianza de la muestra SXY est dada como:


1 n

( X i X ) (Y i

Y )

i =1

NOTA 3 La utilizacin de n - 1 proporciona un estimador sin sesgo (vase el numeral 2.34) de la covarianza de la poblacin (vase el numeral 3.43). NOTA 4 El ejemplo de la Tabla 1 consta de tres variables, en donde la definicin hace referencia a un par de variables. En la prctica, es comn encontrar situaciones con mltiples variables.

2.23 Coeficiente de correlacin de la muestra rxy. (Sample Correlation Coefficient, rxy). Covarianza de la muestra (vase el numeral 2.22) dividida por el producto de las desviaciones estndar de la muestra (vase el numeral 2.17) correspondientes.
EJEMPLO 1 Continuando con el Ejemplo 1 del numeral 2.22, la desviacin estndar observada es 12,495 para X y 21,329 para Y. En consecuencia, el coeficiente de correlacin de la muestra observada (para X y Y) est dado por: 257,118/(12,948 x 21,329) = 0,931 2 EJEMPLO 2 Continuando con el Ejemplo 2 del numeral 2.22, la desviacin estndar observada es 21,329 para Y y 4,165 para Z. En consecuencia, el coeficiente de correlacin de la muestra observada (para Y y Z) est dado por: -54,356/(21,329 x 4,165) = -0,612 NOTA 1 En trminos de notacin, el coeficiente de correlacin de la muestra se calcula como:

i = 1

X i X Yi Y 2

i =

Xi X 1

i =

Yi Y 1

Esta expresin es equivalente a la relacin de la covarianza de la muestra con la raz cuadrada del producto de las desviaciones estndar. Algunas veces el smbolo rxy se usa para designar el coeficiente de correlacin de la muestra. El coeficiente de correlacin de la muestra observada se basa en los datos (x1, y1), (x2, y2), ..., (xn, yn).
NOTA 2 El coeficiente de correlacin de la muestra observada puede tomar valores dentro de [-1, 1], en donde los valores cercanos a 1 indican una correlacin positiva fuerte y los valores cercanos a -1 indican una correlacin negativa fuerte. Los valores cercanos a 1 -1 indican que los puntos estn prcticamente alineados.

2.24 Error estndar, (Standard Error, ). Desviacin estndar (vase el numeral 2.37) ) de un estimador, (vase el numeral 2.12).
EJEMPLO Si la media de la muestra (vase el numeral 2.15) es el estimador de la media de la poblacin (vase el numera 3.35) y la desviacin estndar de una variable aleatoria simple (vase el numeral 3.10) es entonces el error estndar de la media de la muestra es / n , donde n es el nmero de observaciones en la muestra. Un estimador del error estndar es S / n , donde S es la desviacin estndar de la muestra (vase el numeral 2.17) NOTA 1 En la prctica, el error estndar proporciona un estimado natural de la desviacin estndar de un estimador. NOTA 2 No hay un trmino complementario (apropiado) para "error no estndar". El error estndar se puede considerar como una abreviatura de la expresin "desviacin estndar de un estimador" Comnmente, en la prctica error estndar hace referencia implcitamente a la desviacin estndar de la media de la muestra. La notacin para el error estndar de la media de la muestra es X

10

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

2.25 Estimador por intervalos (Interval Estimator). Intervalo cuyos lmites son una funcin estadstica con lmite superior (vase el numeral 2.8) y una funcin estadstico con lmite inferior.
NOTA 1 Uno de los puntos extremos puede ser +, - un lmite natural del valor de un parmetro. Por ejemplo, 0 es un lmite inferior natural para un estimador por intervalos de la varianza de la poblacin (vase el numeral 3.36). En estos casos, los intervalos se designan comnmente como intervalos unilaterales. NOTA 2 Un estimador por intervalos se puede suministrar junto con una estimacin (vase el numeral 2.36) de un parmetro (vase el numeral 3.9). Se supone que el estimador por intervalos contiene un parmetro en una proporcin declarada de situaciones, bajo condiciones de muestreo repetido, o en algn otro sentido probabilstico. NOTA 3 Tres tipos comunes de estimadores por intervalos incluyen intervalos de confianza (vase el numeral 2.28) para parmetro(s), intervalos de prediccin (vase el numeral 2.30) para observaciones futuras, e intervalos estadsticos de tolerancia (vase el numeral 2.26) para la proporcin de una distribucin (vase el numeral 3.11) contenida.

2.26 Intervalo de tolerancia estadstica (Statistical Tolerance Interval). Intervalo determinado a partir de una muestra aleatoria (vase el numeral 2.6) de manera que puede existir un nivel determinado de confianza en que el intervalo cubre al menos una proporcin especificada de la poblacin sometida a muestreo (vase el numeral 2.1).
NOTA La confianza en este contexto es la proporcin a largo plazo de intervalos construidos de esta manera, que incluirn al menos la proporcin especificada de la poblacin sometida a muestreo.

2.27 Lmite de tolerancia estadstica (Statistical Tolerance Limit). Estadstica (vase el numeral 2.8) que representa un punto final externo de un intervalo estadstico de tolerancia (vase el numeral 2.26).
NOTA Los intervalos estadsticos de tolerancia pueden ser: Unilaterales (con uno de sus lmites fijos al lmite natural de la variable aleatoria), en cuyo caso tienen un lmite estadstico de tolerancia superior e inferior, o Bilaterales, en cuyo caso tienen ambos.

Un lmite natural de la variable aleatoria puede brindar un lmite para un lmite unilateral. 2.28 Intervalo de confianza (Confidence Interval). Estimador por intervalos (vase el numeral 2.25) (T0, T1) para el parmetro (vase el numeral 3.9) T0 y T1 con las funciones estadsticas (vase el numeral 2.8) T0 y T1 como lmites de intervalos y para los cuales se estipula que:
P [T0 < < T1 ] 1

NOTA 1 La confianza refleja la proporcin de casos en donde el intervalo de confianza contendra el valor verdadero del parmetro en una serie grande larga de muestras aleatorias repetidas (vase el numeral 2.6) bajo condiciones idnticas. Un intervalo de confianza no refleja la probabilidad (vase el numeral 3.5) de que el intervalo observado contenga el valor real del parmetro (que lo contenga o no). NOTA 2 Este intervalo de confianza est asociado con la caracterstica de desempeo correspondiente correspondiente 100 (1-)%, en donde es generalmente un nmero pequeo. La caracterstica de desempeo, que se denomina coeficiente de confianza o nivel de confianza, es con frecuencia del 95 % 99 %. La desigualdad P [TO < < T1) 1 - se aplica a cualquier valor de poblacin especfico pero desconocido de .

2.29 Intervalo de confianza unilateral (One-Sided Confidence Interval). Intervalo de confianza (vase el numeral 2.28) con uno de sus extremos en + , -, o un lmite fijado naturalmente.

11

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 1 La definicin del numeral 2.28 se aplica a T0 fijado en -, T1 fijado en + Los intervalos de confianza unilaterales surgen en situaciones en las que el inters se enfoca estrictamente en una sola direccin. Por ejemplo, en una prueba de seguridad sobre volumen de audio en telfonos celulares, un lmite de confianza superior sera el inters que indica un lmite superior para el volumen producido en condiciones de seguridad supuestas. Para los ensayos mecnicos estructurales, sera de inters un lmite de confianza inferior sobre la fuerza a la cual el dispositivo falla. NOTA 2 Otro ejemplo de intervalos de confianza unilaterales se presenta en situaciones en las que un parmetro tiene un lmite natural, como por ejemplo cero. Para una distribucin de Poisson (vase el numeral 3.47) involucrada en el modelado de quejas de los clientes, cero es un lmite inferior. Otro ejemplo: un intervalo de confianza para la fiabilidad de un componente electrnico puede ser (0, 98, 1) en donde 1 es el lmite superior natural.

2.30 Intervalo de prediccin (Prediction Interval). Rango de valores de una variable obtenidos de una muestra aleatoria (vase el numeral 2.6) de valores de una poblacin continua, dentro del cual se puede asegurar con una confianza dada que fallar no menos de un nmero dado de valores en una muestra aleatoria ulterior posterior de la misma poblacin (vase el numeral 2.1).
NOTA Generalmente, el inters se enfoca en una sola observacin ulterior que surge de la misma situacin que las observaciones que son la base del intervalo de prediccin. Otro contexto prctico es el anlisis de regresin, en el cual un intervalo de prediccin se construye para un espectro de valores independientes.

2.31 Estimado (Estimate). Valor observado (vase el numeral 2.4) de un estimador (vase el numeral 2.12).
NOTA Un estimado hace referencia a un valor numrico obtenido a partir de valores observados. Con respecto a la estimacin (vase el numera 2.36) de un parmetro (vase el numeral 3.9) a partir de una distribucin de probabilidad (vase el numeral 3.11) supuesta, el estimador hace referencia a la funcin estadstica (vase el numeral 2.8) destinado a estimar el parmetro, y el estimado hace referencia al resultado obtenido con los valores observados. Algunas veces al estimado se le coloca el adjetivo "puntual", para hacer nfasis en que se produce un solo valor, no un intervalo de valores. En forma similar, la expresin "por intervalos" se coloca antes de "estimado", cuando se realiza una estimacin por intervalos.

2.32 Error de estimacin (Error of Estimation). Estimado (vase el numeral 2.31) menos el parmetro (vase el numeral 3.9) o propiedad de la poblacin que se prev estimar.
NOTA 1 La propiedad de la poblacin puede ser una funcin del parmetro o parmetros u otra cantidad relacionada con la distribucin de probabilidad (vase el numeral 3.11). NOTA 2 El error del estimador se puede deber al muestreo, a la incertidumbre de la medicin, al redondeo o a otras fuentes. En efecto, el error del estimador representa para los usuarios el desempeo de base de inters. La determinacin de las principales contribuciones al error del estimador es un elemento crtico en los esfuerzos de mejora de la calidad.

2.33 Sesgo (Bias). Valor esperado (vase el numeral 3.12) de un error de estimacin (vase el numeral 2.32).
NOTA 1 Esta definicin es diferente de las que se encuentran en la NTC 2062-2 (en el numeral 3.3.2 de la norma ISO 3534-2) y en el VIM:1993 (vense los numerales 5.25 y 5.28 del VIM). Sesgo se usa aqu en un sentido genrico, como se indica en la Nota 1 del numeral 2.34. NOTA 2 La existencia de sesgo puede conducir a consecuencias desafortunadas en la prctica. Por ejemplo, subestimar la resistencia de materiales debido al sesgo puede conducir a fallas inesperadas en un dispositivo. En muestreo por encuesta, el sesgo puede conducir a decisiones incorrectas a partir de un sondeo poltico.

2.34 Estimador sin sesgo (Unbiased Estimator). Estimador (vase el numeral 2.12) que tiene un sesgo (vase el numeral 2.33) igual a cero.
EJEMPLO 1 Para una muestra aleatoria (vase el numeral 2.6) de n variables aleatorias independientes (vase el numeral 3.10), cada una con la misma distribucin normal (vase el numeral 3.50) con media (vase el numeral 3.35) y desviacin estndar (vase el numeral 3.37) , la media de la muestra X (vase el numeral 2.15) y la varianza de la

12

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

muestra (vase el numeral 2.16) S2 son estimadores sin sesgo para la media y la varianza (vase el numeral 2.36) 2, respectivamente. EJEMPLO 2 Como se mencion en la Nota 1 del numeral 2.37, el estimador del mximo de verosimilitud (vase 2 el numeral 2.35) de la varianza usa el denominador n en lugar de n - 1, y de esta manera es un estimador con sesgo. En la prctica, la desviacin estndar de la muestra (vase el numeral 2.17) se usa considerablemente, pero es importante observar que la raz cuadrada de la varianza de la muestra utilizando n -1 es un estimador con sesgo de la desviacin estndar de la poblacin (vase el numeral 3.37). EJEMPLO 3 Para una muestra aleatoria de n pares independientes de variables aleatorias, cada par con la misma distribucin normal con dos variables (vase el numeral 3.65) con covarianza (vase el numeral 3.43) igual a XY, la covarianza de la muestra (vase el numeral 2.22) es un estimador sin sesgo para la covarianza de la poblacin. El estimador del mximo de verosimilitud usa n en lugar de n - 1 en el denominador, y de esta manera tiene sesgo. NOTA Los estimadores sin sesgo son tiles, ya que en promedio dan un valor correcto. Sin duda, los estimadores sin sesgo brindan un punto de partida til en la bsqueda de estimadores "ptimos" de los parmetros de poblacin. La definicin dada aqu es de naturaleza estadstica. En la prctica cotidiana, los usuarios intentan evitar la introduccin de sesgo en un estudio asegurndose, por ejemplo, de que la muestra aleatoria sea representativa de la poblacin de inters.

2.35 Estimador del mximo de verosimilitud (Maximum Likelihood Estimator). Estimador (vase el numeral 2.12) que asigna el valor del parmetro (vase el numeral 3.9), en donde la funcin de verosimilitud (vase el numeral 2.38) alcanza o se aproxima a su mayor valor.
NOTA 1 La estimacin del mximo de verosimilitud es un mtodo bien establecido para obtener estimados de parmetros cuando se ha especificado una distribucin (vase el numeral 3.11) [por ejemplo, normal (vase el numeral 3.50), gamma (vase el numeral 3.56), Weibull (vase el numeral 3.63), etc.] Estos estimadores tienen propiedades estadsticas tiles (por ejemplo, invariancia en transformacin montona) y en muchas situaciones proporcionan el mtodo de seleccin. En casos en que el estimador del mximo de verosimilitud tiene sesgo, puede tener lugar una correccin simple del sesgo (vase el numeral 2.33). Como se mencion en el ejemplo 2 del numeral 2.34, el estimador del mximo de verosimilitud para la varianza (vase el numeral 3.36) de la distribucin normal tiene sesgo pero se puede corregir usando n - 1 en vez de n. El alcance del sesgo en estos casos se reduce cuando se incrementa el tamao de la muestra. NOTA 2 La abreviatura EMV se usa comnmente para estimador del mximo de verosimilitud y para estimacin del mximo de verosimilitud, en donde el contexto indica la opcin apropiada.

2.36 Estimacin (Estimation). Procedimiento para obtener una representacin estadstica de una poblacin (vase el numeral 2.1) a partir de una muestra aleatoria (vase el numeral 2.6) tomada de esta poblacin.
NOTA 1 En particular, el procedimiento involucrado al pasar de un estimador (vase el numeral 2.12) a un estimado especfico constituye la estimacin. NOTA 2 La estimacin se entiende en un contexto bastante amplio para incluir estimacin puntual, estimacin por intervalos o estimacin de las propiedades de las poblaciones. NOTA 3 Con frecuencia, una representacin estadstica hace referencia a la estimacin de un parmetro (vase el numeral 3.9) o parmetros, o de una funcin de estos a partir de un modelo asumido. De manera ms general, la representacin de la poblacin puede ser menos especfica, tales como las funciones estadsticas relativas a los impactos de desastres naturales (vctimas, lesiones, prdidas de propiedades y prdidas en la agricultura, todas las que el responsable de las emergencias podra querer estimar). NOTA 4 La consideracin de una funcin estadstica descriptiva (vase el numeral 2.5) puede sugerir que un modelo supuesto brinda una representacin inadecuada de los datos, como se indica por una medida del ajuste del modelo a los datos. En estos casos, se pueden considerar otros modelos y continuar el proceso de estimacin.

13

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

2.37 Estimacin del mximo de verosimilitud (Maximum Likelihood Estimation). Estimacin (vase el numeral 2.36) basada en el estimador del mximo de verosimilitud (vase el numeral 2.35).
NOTA 1 Para la distribucin normal (vase el numeral 3.50), la media de la muestra (vase el numeral 2.15) es el estimador del mximo de verosimilitud (vase el numeral 2.35) del parmetro (vase el numeral 3.9) , mientras que la varianza de la muestra (vase el numeral 2.16), usando el denominador n en vez de n - 1, 2 proporciona el estimador del mximo de verosimilitud de . El denominador n -1 se usa habitualmente, ya que este valor proporciona un estimador sin sesgo (vase el numeral 2.34). NOTA 2 La estimacin del mximo de verosimilitud se usa algunas veces para describir la obtencin de un estimador (vase el numeral 2.12) a partir de la funcin de verosimilitud. NOTA 3 Aunque en algunos casos el uso de la estimacin del mximo de verosimilitud da lugar a una expresin analtica, existen otras situaciones en las que el estimador del mximo de verosimilitud requiere una solucin iterativa a un conjunto de ecuaciones. NOTA 4 La abreviatura EMV se usa comnmente para estimador del mximo de verosimilitud y para estimacin del mximo de verosimilitud, dependiendo del contexto.

2.38 Funcin de verosimilitud (Likelihood Function). Funcin de densidad de probabilidad (vase el numeral 3.26) evaluada a los valores observados (vase el numeral 2.4) y considerada como una funcin de los parmetros (vase el numeral 3.9) de la familia de distribuciones (vase el numeral 3.8).
EJEMPLO 1 Considere una situacin en la cual se seleccionan aleatoriamente 10 elementos de una poblacin muy grande (vase el numeral 2.1) y se encuentra que 3 elementos tienen una caracterstica especfica. De esta muestra, 0,3 (3 de 10) es un estimado (vase el numeral 2.31) intuitivo de la proporcin de poblacin que tiene la caracterstica. Dentro de un modelo de distribucin binomial (vase el numeral 3.46), la funcin de verosimilitud (funcin de masa de probabilidad como una funcin de p con n fijado en 10 y x en 3) logra su mximo en p = 0,3, que concuerda con la intuicin.

[Esto se puede verificar posteriormente graficando la funcin de masa de probabilidad de la distribucin binomial (vase el numeral 3.46) 120 p3 (1 - p)7 con relacin a p].
EJEMPLO 2 Para la distribucin normal (vase el numeral 3.50) con una desviacin estndar (vase el numeral 3.37) conocida, se puede demostrar en general que la funcin de verosimilitud alcanza su mximo cuando es igual a la media de la muestra.

2.39 Funcin de verosimilitud parcial (Profile Likelihood Function). Funcin de verosimilitud (vase el numeral 2.38) considerada con base en un solo parmetro (vase el numeral 3.9), con todos los dems parmetros fijados para maximizarla. 2.40 Hiptesis, H (Hypothesis, H). Declaracin acerca de una poblacin (vase el numeral 2.1).
NOTA Comnmente, la declaracin acerca de la poblacin concierne a uno o ms parmetros (vase el numeral 3.9) en una familia de distribuciones (vase el numeral 3.8) o acerca de la familia de distribuciones.

2.41 Hiptesis nula, H0 (Null Hiptesis, H0). Hiptesis (vase el numeral 2.40) que se debe poner a prueba por medio de una prueba estadstica (vase el numeral 2.48).
EJEMPLO 1 En una muestra aleatoria (vase el numeral 2.6) de variables aleatorias independientes (vase el numeral 3.10) que tienen la misma distribucin normal (vase el numeral 3.50), con una media desconocida (vase el numeral 3.35) y una desviacin estndar desconocida (vase el numeral 3.37), una hiptesis nula para una media puede ser que la media es menor o igual a un valor dado 0 y esto se escribe usualmente de la siguiente forma; H0: 0. EJEMPLO 2 Una hiptesis nula puede ser que el modelo estadstico para una poblacin (vase el numeral 2.1) es una distribucin normal. Para este tipo de hiptesis nula no se especifican la media y la desviacin estndar.

14

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

EJEMPLO 3 Una hiptesis nula puede ser que el modelo estadstico para una poblacin sea una distribucin simtrica. Para este tipo de hiptesis nula no se especifica la forma de la distribucin. NOTA 1 Explcitamente, la hiptesis nula puede consistir en un subconjunto de un conjunto de distribuciones de probabilidades posibles. NOTA 2 Esta definicin no se debera considerar independientemente de la hiptesis alternativa (vase el numeral 2.42) y la prueba estadstica (vase el numeral 2.48), ya que la aplicacin apropiada de la puesta a prueba requiere todos estos componentes. NOTA 3 En la prctica jams se demuestra una hiptesis nula, sino que la evaluacin en una situacin dada puede ser inadecuada para rechazar la hiptesis nula. La motivacin original para poner a prueba la hiptesis probablemente ha sido que el resultado de la esperanza matemtica de que el resultado favorezca una hiptesis alternativa especfica para el problema en cuestin. NOTA 4 La decisin de no rechazar la hiptesis nula no es una prueba de su validez, sino puede ser ms bien una indicacin de que hay evidencia insuficiente para rechazarla. La hiptesis nula (o una cercana a ella) puede ser verdadera, o el tamao de la muestra es insuficiente para detectar una diferencia con relacin a sta. NOTA 5 En algunas situaciones, el inters inicial est enfocado hacia la hiptesis nula, pero la posibilidad de una desviacin puede ser de inters. La consideracin apropiada del tamao de la muestra y su capacidad para detectar una desviacin o alternativa especfica puede conducir a la construccin de un procedimiento de ensayo para evaluar apropiadamente la hiptesis nula. NOTA 6 La aceptacin de la hiptesis alternativa, contrariamente a la decisin de no rechazar la hiptesis nula, es un resultado positivo en el sentido en que apoya la conjetura de inters. El rechazo de la hiptesis nula a favor de la alternativa es un resultado con menos ambigedad que un resultado de "no se rechaza la hiptesis nula esta vez". NOTA 7 La hiptesis nula es la base para construir el estadstico de prueba (vase el numeral 2.52) correspondiente usada para evaluar la hiptesis nula. NOTA 8 La hiptesis nula se denota con frecuencia H0 (H con subndice 0).

NOTA 9 El subconjunto que identifica la hiptesis nula de ser posible debera seleccionarse de manera que la declaracin sea incompatible con la conjetura por estudiar. Vase la Nota 2 del numeral 2.48 y el ejemplo del numeral 2.49.

2.42 Hiptesis alternativa, HA, H1 (Alternative Hypotesis, HA, H1). Declaracin que selecciona un conjunto o subconjunto de todas las posibles distribuciones de probabilidad (vase el numeral 3.11) admisibles posibles que no pertenecen a la hiptesis nula (vase el numeral 2.41).
EJEMPLO 1 La hiptesis alternativa a la hiptesis nula dada en el ejemplo 1 del numeral 2.41 es que la media (vase el numeral 3.35) es mayor que el valor especificado, que se expresa as: HA : > 0. EJEMPLO 2 La hiptesis alternativa a la hiptesis nula presentada en el ejemplo 2 del numeral 2.41 es que el modelo estadstico de la poblacin no es una distribucin normal (vase el numeral 3.50). EJEMPLO 3 La hiptesis alternativa a la hiptesis nula dada en el Ejemplo 3 del numeral 2.41 es que el modelo estadstico de la poblacin es una distribucin asimtrica. Para esta hiptesis alternativa no se establece la forma especfica de la asimetra. NOTA 1 La hiptesis alternativa es el complemento de la hiptesis nula.

NOTA 2 La hiptesis alternativa tambin se puede designar como H1 o HA sin preferencia clara en tanto que el simbolismo sea paralelo a la notacin de la hiptesis nula. NOTA 3 La hiptesis alternativa es una declaracin que contradice la hiptesis nula. El estadstico de prueba (vase el numeral 2.52) correspondiente se usa para decidir entre las hiptesis cero y la alternativa. NOTA 4 La hiptesis alternativa no se debera considerar aislada de la hiptesis nula ni del estadstico de prueba (vase el numeral 2.48). NOTA 5 La aceptacin de la hiptesis alternativa, contrariamente a la decisin de no rechazar la hiptesis nula, es un resultado positivo en el sentido en que apoya la conjetura de inters.

15

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

2.43 Hiptesis simple (Simple Hypothesis). Hiptesis (vase el numeral 2.40) que especifica una sola distribucin en una familia de distribuciones (vase el numeral 3.8).
NOTA 1 Una hiptesis simple es una hiptesis nula (vase el numeral 2.41) o una hiptesis alternativa (vase el numeral 2.42) para la cual el conjunto seleccionado consta de una distribucin de probabilidad simple (vase el numeral 3.11). NOTA 2 En una muestra aleatoria (vase el numeral 2.6) de variables aleatorias independientes (vase el numeral 3.10) con la misma distribucin normal (vase el numeral 3.50) con una media desconocida (vase el numeral 3.35) y una desviacin estndar conocida (vase el numeral 3.37) , una hiptesis simple para la media es que la media es igual a un valor dado '0 y esto se escribe usualmente de la siguiente forma: H0: = 0. NOTA 3 Una hiptesis simple especifica completamente la distribucin de probabilidad (vase el numeral 3.11).

2.44 Hiptesis compuesta (Composite Hypothesis). Hiptesis (vase el numeral 2.40) que especifica ms de una distribucin (vase el numeral 3.11) en una familia de distribuciones (vase el numeral 3.8).
EJEMPLO 1 La hiptesis nula (vase el numeral 2.41) y las hiptesis alternativas (vase el numeral 2.42) dadas en los ejemplos de los numerales 2.41 y 2.42 son todos ejemplos de hiptesis compuestas. EJEMPLO 2 En el numeral 2.48, la hiptesis nula en el Caso 3 del Ejemplo 3 es una hiptesis simple. La hiptesis nula del Ejemplo 4 tambin es una hiptesis simple. Las otras hiptesis del numeral 2.48 son compuestas. NOTA Una hiptesis compuesta es una hiptesis nula o una hiptesis alternativa para la cual el subconjunto seleccionado consta de ms de una distribucin de probabilidad simple.

2.45 Nivel de significacin, (Significance Level, ). <ensayo estadstico>. Probabilidad mxima (vase el numeral 3.5) de rechazar la hiptesis nula (vase el numeral 2.41) cuando en realidad es verdadera.
NOTA Si la hiptesis nula es una hiptesis simple (vase el numeral 2.43), entonces la probabilidad de rechazar la hiptesis nula si fuera verdadera, llega a ser un valor simple.

2.46 Error Tipo I (Type I Error). Rechazo de la hiptesis nula (vase el numeral 2.41) cuando en realidad es verdadera.
NOTA 1 De hecho, un error Tipo I es una decisin incorrecta. En consecuencia, se desea mantener la menor probabilidad posible (vase el numeral 3.5) de tomar una decisin incorrecta. Para obtener una probabilidad cero de un error Tipo I, nunca se rechazara la hiptesis nula. En otras palabras, independientemente de la evidencia, se toma la misma decisin. NOTA 2 En algunas situaciones (por ejemplo, en el ensayo del parmetro binomial p) es posible que no se pueda alcanzar un nivel de significacin especificado tal como 0,05, debido a la discontinuidad de los resultados.

2.47 Error tipo II (Type II Error). Decisin de no rechazar la hiptesis nula (vase el numeral 2.41) cuando en realidad sta no es verdadera.
NOTA De hecho, el error Tipo II es una decisin incorrecta. En consecuencia, se desea mantener la menor probabilidad posible (vase el numeral 3.5) de tomar una decisin incorrecta. Los errores Tipo II ocurren comnmente en situaciones en las que el tamao de la muestra es insuficiente para revelar una desviacin de la hiptesis nula.

2.48 Prueba estadstica, prueba de significacin (Statistical Test, Significance Test). Procedimiento para decidir si una hiptesis nula (vase el numeral 2.41) debe ser rechazada a favor de una hiptesis alternativa (vase el numeral 2.42).
EJEMPLO 1 A manera de ejemplo, si una variable aleatoria continua (vase el numeral 3.29) real puede tomar valores entre - y + y se sospecha que la distribucin de probabilidad verdadera no es una distribucin normal (vase el numeral 3.50), entonces se formularn las siguientes hiptesis:

16

NORMA TCNICA COLOMBIANA


-

NTC 2062-1 (Segunda actualizacin)

El alcance de la situacin son todas las distribuciones de probabilidad continuas (vase el numeral 3.23) que pueden tomar valores entre - y + . La conjetura es que la distribucin de probabilidad verdadera no es una distribucin normal. La hiptesis nula es que la distribucin de probabilidad es una distribucin normal. La hiptesis alternativa es que la distribucin de probabilidad no es una distribucin normal.

EJEMPLO 2 Si la variable aleatoria sigue una distribucin normal con una desviacin estndar conocida (vase el numeral 3.37) y se sospecha que su valor esperado se desva de un valor dado 0, entonces las hiptesis se formularn de acuerdo con el Caso 3 en el siguiente ejemplo. EJEMPLO 3 Este ejemplo considera tres posibilidades en el ensayo estadstico. Caso 1. Se supone que la media del proceso es mayor que la media objetivo de 0. Esta conjetura conduce a las siguientes hiptesis. Hiptesis nula: Hiptesis alternativa: H0 : 0 H1 : 0

Caso 2. Se supone que la media del proceso es inferior a la media objetivo de 0. Esta conjetura conduce a las siguientes hiptesis. Hiptesis nula: Hiptesis alternativa: H0 : 0 H1 : 0

Caso 3. Se supone que la media del proceso no es compatible con la media del proceso, pero no se especifica la direccin. Esta conjetura conduce a las siguientes hiptesis. Hiptesis nula: Hiptesis alternativa: H0 : = 0 H1 : 0

En todos los tres casos, la formulacin de las hiptesis se basa en una conjetura concerniente a la hiptesis alternativa y a su desviacin de su condicin de referencia. EJEMPLO 4 Este ejemplo considera como su alcance todas las proporciones p1 y p2 entre cero y una proporcin de defectuosos en los lotes 1 y 2. Se podra sospechar que los dos lotes son diferentes, y por tanto, suponer que las proporciones de defectos en los dos lotes son diferentes. Esta conjetura conduce a las siguientes hiptesis: Hiptesis nula: Hiptesis alternativa: H0 : p1 = p2 H1 : p1 p2

NOTA 1 Una prueba estadstica es un procedimiento que es vlido bajo condiciones especificadas, para decidir, por medio de observaciones de una muestra, si la distribucin de probabilidad verdadera pertenece a la hiptesis nula o a la hiptesis alternativa. NOTA 2 Antes de llevar a cabo una prueba estadstica, se determina primero el conjunto posible de distribuciones de probabilidad con base en la informacin disponible. Posteriormente se identifican las distribuciones de probabilidad que pueden ser verdaderas con base en la conjetura por estudiar, para elaborar la hiptesis alternativa. Finalmente, la hiptesis nula se formula como complemento a la hiptesis alternativa. En muchos casos, el conjunto posible de distribuciones de probabilidad, y en consecuencia tambin la hiptesis nula y la hiptesis alternativa se pueden determinar por referencia a conjuntos de valores de parmetros pertinentes. NOTA 3 Cuando la decisin se toma con base en observaciones de una muestra, existe el riesgo de cometer un error Tipo I (vase el numeral 2.46), rechazar la hiptesis nula cuando de hecho es correcta, o un error Tipo II (vase el numeral 2.47), decidir no rechazar la hiptesis nula a favor de la hiptesis alternativa, cuando esta ltima es verdadera. NOTA 4 El Caso 1 y 2 del Ejemplo 3 anterior son casos de pruebas unilaterales. El Caso 3 es un ejemplo de una prueba bilateral. En todos los tres casos, la seleccin entre unilateral contra bilateral se determina considerando la regin del parmetro correspondiente a la hiptesis alternativa. Ms generalmente, las ensayos unilaterales y bilaterales pueden ser controlados por la regin para rechazo de la hiptesis nula, correspondiente a la funcin estadstica de ensayo escogida. Es decir, la funcin estadstica de ensayo tiene una regin crtica asociada que favorece la hiptesis alternativa, pero es posible que no est relacionada directamente con una simple descripcin

17

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

del espacio del parmetro, como en los Casos 1, 2 y 3. NOTA 5 Se debera prestar mucha atencin a las suposiciones subyacentes, o la aplicacin de las pruebas estadsticas no tendr fundamento. Las pruebas estadsticas que conducen a inferencias estables incluso en el caso de posibles especificaciones defectuosas de las suposiciones subyacentes se denominan robustos. El ensayo t de una muestra para la media es un ejemplo de una prueba considerada muy robusta en condiciones no normales. El ensayo de Bartlett para homogeneidad de las varianzas es un ejemplo de un procedimiento no robusto que posiblemente conduce al rechazo excesivo de la igualdad de varianzas en casos de distribucin para las cuales las varianzas fueron en realidad idnticas.

2.49 Valor p (p-value). Probabilidad (vase el numeral 3.5) de observar el valor del estadstico de prueba (vase el numeral 2.52) observado o cualquier otro valor desfavorable para la hiptesis nula (vase el numeral 2.41).
EJEMPLO Considere el ejemplo numrico introducido originalmente en el numeral 2.9. Suponga, a manera de ilustracin, que estos valores son observaciones de un proceso que se espera nominalmente que tenga una media de 12,5 y que con base en su experiencia previa el ingeniero asociado con el proceso considere que ste era constantemente ms bajo que el valor nominal. Se realiz un estudio y se recolect una muestra aleatoria de tamao 10, con los resultados numricos de del numeral 2.9. Las hiptesis apropiadas son: Hiptesis nula: H0 : 12,5 Hiptesis alternativa: H1 : < 12,5

La media de la muestra es 9,7, que parece concordar con la conjetura, pero, est lo suficientemente alejada de 12,5 para apoyar la conjetura? Para este ejemplo, el estadstico de prueba (vase el numeral 2.52) es -1,976 4 con su correspondiente valor p de 0,040. Esto significa que hay menos de 4 oportunidades en cien de observar un valor de funcin estadstica de -1,976 4 inferior, si de hecho la media del proceso verdadero es 12,5. Si el nivel de significacin pre-especificada original hubiera sido 0,05, entonces habitualmente se rechazara la hiptesis nula a favor de la hiptesis alternativa. Como alternativa, suponga que el problema fuera formulado en una forma un poco diferente. Imagine que el problema fuera que el proceso est alejado de la meta de 12,5 pero la direccin no se ha especificado. Esto conduce a las siguientes hiptesis: Hiptesis nula: H0 : = 12,5 Hiptesis alternativa: H1 : 12,5 Dados los mismos datos recolectados de una muestra aleatoria, la funcin estadstica de ensayo es el mismo, -1,976 4. Para esta hiptesis alternativa, una pregunta importante es "cul es la probabilidad de observar un valor as de extremo u otro ms extremo?" En este caso hay dos regiones pertinentes: valores menores o iguales a -1,9764, o valores mayores o iguales a 1,9764. La probabilidad de que ocurra una funcin estadstica de ensayo t en una de estas regiones es 0,080 (el doble del valor unilateral). Hay ocho oportunidades en 100 de observar un valor de una funcin estadstica de ensayo as de extremo o todava ms. As, la hiptesis nula no es rechazada al nivel de significacin de 0,05.
NOTA 1 Por ejemplo, si el valor p resulta ser 0,029, entonces hay menos de tres oportunidades en cien de que este valor extremo de la funcin estadstica de ensayo, o uno ms extremo, ocurra bajo la hiptesis nula. Con base en esta informacin es posible tener que rechazar la hiptesis nula, ya que este es un valor p bastante pequeo. Ms formalmente, si el nivel de significacin se hubiera establecido en 0,05, entonces definitivamente el valor p de 0,029, al ser inferior a 0,05 conducira al rechazo de la hiptesis nula. NOTA 2 El valor p del trmino algunas veces se denomina probabilidad de significacin, que no se debera confundir con el nivel de significacin (vase el numeral 2.45) que es una constante especificada en una aplicacin.

2.50 Potencia de una prueba (Power of a Test). Uno menos la probabilidad (vase el numeral 3.5) del error Tipo II (vase el numeral 2.47). 18

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 1 La eficiencia de una prueba para un valor especificado de un parmetro desconocido (vase el numeral 3.9) en una familia de distribuciones (vase el numeral 3.8) es igual a la probabilidad de rechazar la hiptesis nula (vase el numeral 2.41) para el valor del parmetro. NOTA 2 En la mayora de casos de inters prctico, al incrementar el tamao de la muestra se incrementar la eficiencia de la prueba. En otras palabras, la probabilidad de rechazar la hiptesis nula cuando la hiptesis alternativa (vase el numeral 2.42) es verdadera aumenta al incrementarse el tamao de la muestra, reduciendo de esta manera la probabilidad de un error Tipo II. NOTA 3 En situaciones de ensayo es recomendable que cuando la muestra de ensayo es extremadamente grande, deberan detectarse incluso desviaciones pequeas de la hiptesis nula, lo que conduce al rechazo de la hiptesis nula. En otras palabras, la eficiencia de la prueba se debera aproximar a 1 para cualquier alternativa a la hiptesis nula cuando el tamao de la muestra llega a ser infinitamente grande. Estos ensayos se denominan consistentes. Al comparar dos pruebas con respecto a su eficiencia potencia, la prueba con la mayor eficiencia potencia se considera la ms eficiente, siempre y cuando los niveles de significacin sean idnticos, al igual que las hiptesis nulas y alternativas particulares. Hay descripciones matemticas ms formales de los trminos "consistencia" y "eficiencia" que se encuentran fuera del alcance de esta norma. (Consulte las diferentes enciclopedias de estadstica o libros de estadstica matemtica).

2.51 Curva de potencia (Power Curve). Conjunto de valores de la eficiencia de una prueba (vase el numeral 2.50) en funcin del parmetro de la poblacin (vase el numeral 3.9) de una familia de distribuciones (vase el numeral 3.8).
NOTA La funcin de eficiencia es igual a uno menos la curva caracterstica de operacin.

2.52 Estadstico de prueba, estadstico de contraste (Test Statistic). Estadstico (vase el numeral 2.8) usado conjuntamente con una prueba estadstica (vase el numeral 2.48).
NOTA La funcin estadstica de ensayo se usa para evaluar si la distribucin de probabilidad (vase el numeral 3.11) considerada es coherente con la hiptesis nula (vase el numeral 2.41) o la hiptesis alternativa (vase el numeral 2.42).

2.53 Funcin estadstica descriptiva grfica (Graphical Descriptive Statistics). Estadstica descriptiva (vase el numeral 2.5) representada en forma grfica.
NOTA Generalmente, la intencin de la funcin estadstica descriptiva es reducir un gran nmero de valores a algunos valores fciles de manejar, o presentar los valores de manera que se facilite su visualizacin. Los ejemplos de resmenes grficos incluyen grficos de cajas, grficos de probabilidad, grficos Q-Q, diagramas de cuantila normal, grficos de dispersin (nube de puntos), grficos de dispersin mltiple (nube de puntos mltiple), e histogramas (vase el numeral 2.61).

2.54 Funcin estadstica descriptiva numrica (Numerical Descriptive Statistics). Funcin Estadstica descriptiva (vase el numeral 2.5) en forma numrica.
NOTA La estadstica descriptiva numrica incluye el promedio (vase el numeral 2.15), el rango de la muestra (vase el numeral 2.10), la desviacin estndar de la muestra (vase el numeral 2.17), el rango intercuartila, etc.

2.55 Clases (Classes)


NOTA Se supone que las clases son mutuamente exclusivas y exhaustivas. La lnea real son todos los nmeros reales entre - y + .

2.55.1 Clase (Class). <Caracterstica cualitativa> Subconjunto de elementos de una muestra (vase el numeral 2.3). 2.55.2 Clase (Class). <Caracterstica ordinal> Conjunto de una o ms categoras adyacentes en una escala ordinal. 2.55.3 Clase (Class). <Caracterstica cuantitativa> Intervalo de la lnea real.

19

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

2.56 Lmites de clase (Class limits, Class boundaries). <Caracterstica cuantitativa) Valores que definen los lmites superior e inferior de una clase (vase el numeral 2.55).
NOTA Esta definicin hace referencia a los lmites de clase asociados con las caractersticas cuantitativas.

2.57 Punto medio de la clase (Mid-Point of Class). <Caracterstica cuantitativa> Promedio (vase el numeral 2.15) de los lmites de la clase superior e inferior (vase el numeral 2.56). 2.58 Ancho de la clase (Class Width). <Caracterstica cuantitativa> lmite superior de una clase menos el lmite inferior de una clase (vase el numeral 2.55). 2.59 Frecuencia (Frequency). Nmero de ocurrencias o valores observados (vase el numeral 2.4) en una clase especificada (vase el numeral 2.55). 2.60 Distribucin de frecuencia (Frequency Distribution). Relacin emprica entre clases (vase el numeral 2.55) y su nmero de ocurrencias o valores observados (vase el numeral 2.4). 2.61 Histograma (Histogram). Representacin grfica de una distribucin de frecuencia (vase el numeral 2.60) compuesta por rectngulos contiguos, cada uno de ellos con un ancho de base igual al ancho de la clase (vase el numeral 2.58) y rea proporcional a la frecuencia de la clase.
NOTA Se debe prestar atencin a situaciones en las que los datos se producen en clases que tienen anchos de clase desiguales.

2.62 Grfico de barras. (Bar Chart). Representacin grfica de una distribucin de frecuencia (vase el numeral 2.60) de una propiedad nominal, compuesta de un conjunto de rectngulos de ancho uniforme con altura proporcional a la frecuencia (vase el numeral 2.59).
NOTA 1 Los rectngulos se describen algunas veces como imgenes tridimensionales con propsitos aparentemente estticos, aunque esto no agrega informacin adicional y no es una presentacin recomendada. En un grfico de barras no es necesario que los rectngulos sean contiguos. NOTA 2 Los software disponibles no siempre siguen las definiciones establecidas aqu, debido a que la diferencia entre histogramas y grficos de barras no es muy clara, ya que el software disponible no siempre sigue las definiciones establecidas aqu.

2.63 Frecuencia acumulativa (Cumulativa Frequency). Frecuencia (vase el numeral 2.59) para clases hasta un lmite especificado, inclusive.
NOTA Esta definicin solamente es aplicable a valores especificados que corresponden a los lmites de clase (vase el numeral 2.56).

2.64 Frecuencia Relativa (Relative Frequency). Frecuencia (vase el numeral 2.59) dividida por el nmero total de ocurrencias o valores observados (vase el numeral 2.4). 2.65 Frecuencia relativa acumulativa (Cumulative Relative Frequency). Frecuencia acumulativa (vase el numeral 2.63) dividida por el nmero total de ocurrencias o valores observados (vase el numeral 2.4).

3.

TRMINOS USADOS EN PROBABILIDAD

3.1 Espacio muestral, (Sample Space, ). Conjunto de todos los resultados posibles.
EJEMPLO 1 Considere los tiempos de falla de las bateras compradas por un consumidor. Si la batera no tiene potencia al usarla la primera vez, su tiempo de falla es 0. Si la batera funciona durante un momento, tiene un tiempo

20

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

de falla de algunas horas. Por tanto, el espacio muestral est compuesto de los resultados {la batera falla en el intento inicial} y {la batera falla despus de x horas, en donde x es mayor que cero horas}. Este ejemplo se usar en todo el numeral. En particular, en el numeral 3.68 se presenta un explicacin amplia de este ejemplo. EJEMPLO 2 Una caja contiene 10 resistencias etiquetadas 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Si se hiciera un muestreo aleatorio de 2 resistencias de este conjunto de resistencias, sin reemplazarlas, el espacio muestral constara de los siguientes resultados: (1,2), (1,3), (1,4), (1,5) (1,6), (1,7), (1,8), (1,9), (1,10), (2,3), (2,4), (2,5) (2,6), (2,7), (2,8), (2,9), (2,10), (3,4), (3,5) (3,6), (3,7), (3,8), (3,9), (3,10), (4,5) (4,6), (4,7), (4,8), (4,9), (4,10), (5,6), (5,7), (5,8), (5,9), (5,10), (6,7), (6,8), (6,9), (6,10), (7,8), (7,9), (7,10), (8,9), (8,10), (9,10). El evento (1,2) se considera idntico a (2.1), de manera que el orden de muestreo de las resistencias no importa. Por el contrario, si el orden tiene significacin, de manera que (1,2) se considera diferente de (2,1), entonces hay un total de 90 resultados en el espacio muestral. EJEMPLO 3 Si en el ejemplo anterior el muestreo se ha realizado con reemplazo, entonces sera necesario incluir los eventos adicionales (1,1), (2,2), (3,3), (4,4), (5,5), (6,6), (7,7), (8,8), (9,9) y (10,10). En el caso en que el orden no es de importancia, habra 55 resultados en el espacio muestral. En la situacin en la que el orden es importante, habra 100 resultados en el espacio de la muestra. NOTA 1 Los resultados posibles pueden provenir de un experimento real o de uno completamente hipottico. Este conjunto puede ser, por ejemplo, una lista explcita, un conjunto contable, tal como los enteros positivos, {1, 2, 3,...}, o la lnea real. NOTA 2 El espacio muestral es el primer componente de un espacio de probabilidad (vase el numeral 3.68).

3.2 Evento, A (Event, A). Subconjunto del espacio muestral (vase el numeral 3.1).
EJEMPLO 1 Continuando con el ejemplo 1 del numeral 3.1, los siguientes son ejemplos de los eventos {0}, (0,2), {5, 7} [7, + ), correspondiente a una batera que fall inicialmente, una batera que trabaja al comienzo pero falla a las dos horas, una batera que falla exactamente a las 5,7 h, y una batera que no ha fallado a las 7 h. El {0} y el {5, 7} son cada uno conjuntos que contienen un solo valor; (0, 2) es un intervalo abierto de la lnea real; [7, + ] es un intervalo infinito cerrado a la izquierda, de la lnea real. EJEMPLO 2 Continuando con el ejemplo 2 de 3.1, el inters se limita a la seleccin sin reemplazo y sin registrar el orden de la seleccin. Un evento posible es A definido por {al menos una de las resistencias 1 2 est incluida en la muestra}. Este evento contiene 17 resultados (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (1,8), (1,9), (1,10), (2,3), (2,4), (2,5), (2,6), (2,7), (2,8), (2,9) y (2,10). Otro evento posible B es {ninguna de las resistencias 8, 9 10 est incluida en la muestra}. Este evento contiene los 21 resultados (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (2,3), (2,4) (2,5), (2,6), (2,7), (3,4), (3,5), (3,6), (3,7), (4,5), (4,6), (4,7), (5,6), (5,7), (6,7). EJEMPLO 3 Continuando con el ejemplo 2, la interseccin de eventos A y B (es decir, que al menos una de las resistencias 1 y 2 est incluida en la muestra, pero ninguna de las resistencias 8, 9 y 10) contiene los siguientes 11 resultados (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (2,3), (2,4), (2,5), (2,6), (2,7). Incidentalmente, el nmero de resultados en la unin de los eventos A, y B (es decir, que al menos una de las resistencias 1 y 2, ninguna de las resistencias 8, 9 y 10 est incluida en la muestra) es 27, que tambin es igual a 17 + 21 - 11, a saber, el nmero de resultados en A ms el nmero de resultados en B, menos el nmero de resultados en la interseccin es igual al nmero de resultados en la unin de los eventos. NOTA Dado un evento y un resultado de un experimento, se dice que el evento ocurri si el resultado pertenece al evento. Los eventos de inters prctico pertenecern a la suma algebrica de eventos (vase el numeral 3.69), el segundo componente del espacio de probabilidad (vase el numeral 3.68). Los eventos ocurren naturalmente en contextos de juego (pquer, ruleta, etc.) en donde la determinacin del nmero de resultados que pertenecen a un evento determina las probabilidades de pares.

3.3 Evento complementario, Ac (Complementary Event, Ac). Espacio muestral (vase el numeral 3.1), exceptuando el evento dado (vase el numeral 3.2).
EJEMPLO 1 Continuando con el ejemplo 1 del numeral 3.1 sobre la batera, el complemento del evento {0} es el evento (0, + ), que es equivalente al complemento del evento en el cual la batera no funcion inicialmente, es el evento en que la batera funcion inicialmente. En forma similar, el evento [0,3) corresponde a los casos en que la batera no estaba funcionando inicialmente o funcion menos de tres horas. El complemento de este evento es [3, ), que corresponde al caso en que la batera funcion durante 3 h y su tiempo de falla es mayor que este valor. EJEMPLO 2 Continuando con el ejemplo 2 del numeral 3.2, el nmero de resultados en B se puede encontrar fcilmente considerando el evento complemento a B = {la muestra contiene al menos una de las resistencias 8, 9 y 10}. Este evento contiene los 7 + 8 + 9 = 24 resultados (1,8), (2,8), (3.8), (4,8), (5,8), (6,8), (7,8), (1,9), (2,9), (3,9),

21

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

(4,9), (5,9), (6,9), (7.9), (8,9), (1,10), (2,10), (3,10), (4,10), (5,10), (6,10), (7,10), (8,10), (9,10). Ya que todo el espacio muestral contiene 45 resultados en este caso, el evento B contiene 45 - 24 = 21 resultados [a saber: (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (2,3), (2,4), (2,5), (2,6), (2,7), (3,4), (3,5), (3,6), (3,7), (4,5),(4.6), (4,7), (5,6), (5,7), (6,7)]. NOTA 1 NOTA 2 NOTA 3 El evento complemento es el suplemento del evento en el espacio muestral. El evento complementario tambin es un evento.
C Para un evento A, el evento complementario a A se designa usualmente por el smbolo A .

NOTA 4 En muchas situaciones puede ser ms fcil calcular la probabilidad del complemento de un evento que la probabilidad del evento. Por ejemplo, el evento definido por "al menos ocurre un defecto en una muestra de 10 elementos escogidos aleatoriamente de una poblacin de 1 000 elementos, con un porcentaje supuesto de elementos defectuosos" tiene un nmero considerable de resultados por enumerar. El complemento de este evento (no se encuentra ningn defecto) es mucho ms fcil de abordar.

3.4 Eventos independientes (Independent Events). Par de eventos (vase el numeral 3.2), tal que la probabilidad (vase el numeral 3.5) de la interseccin de dos eventos es el producto de las probabilidades individuales.
EJEMPLO 1 Considere una situacin en la que se lanzan dos dados, uno de ellos rojo y el otro blanco, para diferenciar los 36 posibles resultados con probabilidad de 1/36 asignada a cada uno. D1 se define como el evento en donde la suma de los puntos en el dado rojo y en el blanco es i. W se define como el evento en que el dado blanco muestra un punto. Los eventos D7 y W son independientes, mientras que los eventos Di y W no son independientes para i = 2, 3, 4, 5 6. Los eventos que no son independientes se denominan eventos dependientes. EJEMPLO 2 Los eventos independientes y dependientes surgen naturalmente en las aplicaciones. En casos en donde los eventos o circunstancias son dependientes, es bastante til conocer el resultado de un evento relacionado. Por ejemplo, un individuo que debe ser sometido a una ciruga del corazn puede tener posibilidades de xito muy diferentes, si el individuo tiene historia de fumador u otros factores de riesgo. As, el tabaco y el riesgo de muerte por procedimientos invasivos pueden ser dependientes. En contraste, es probable que la muerte sea independiente del da de la semana en que la persona naci. En el contexto de confiabilidad, los componentes que tienen una causa de falla comn no tienen tiempos de falla independientes. Las barras de combustible de un reactor tienen una probabilidad presumiblemente baja de que presenten grietas, pero si una barra de combustible se agrieta, la probabilidad de agrietamiento de la barra adyacente se puede incrementar sustancialmente. EJEMPLO 3 Continuando con el ejemplo 2 del numeral 3.2, suponga que el muestreo se ha llevado a cabo mediante muestreo aleatorio simple, de manera que todos los resultados tienen la misma probabilidad 1/45. Entonces P(A) = 17/45 = 0,377 8, P(B) = 25/45 = 0,4667 y P(A y B) = 11/45 = 0,244 4. Sin embargo, el producto P(A) x P(B) = (17(45) x (21/45) = 0,176 3 es diferente de 0,244 4, de manera que los eventos A y B no son independientes. NOTA Esta definicin se aplica en el contexto de dos eventos, pero se puede ampliar. Para los eventos A y B la condicin de independencia es P(A B) = P (A) P(B). Para que tres eventos, A, B y C, sean independientes, se requiere que:
P ( A B C ) = P ( A ) P ( B ) P (C ) P ( A B) = P ( A) P (B) P ( A C ) = P ( A ) P (C ) y P ( B C ) = P ( B ) P (C )

En general, para ms de dos eventos, A1, A2, ... An son independientes si la probabilidad de la interseccin de cualquier subconjunto dado de eventos es igual al producto de los eventos individuales. Esta condicin se aplica a todos los subconjuntos. Es posible construir un ejemplo en el cual cada par de eventos sea independiente, pero los tres eventos no son independientes (es decir, independencia por pares, pero no completa). 3.5 Probabilidad de un evento A, P(A) (Probability of an Event A, P(A)). Nmero real en el intervalo cerrado [0,1] asignado a un evento (vase el numeral 3.2).
EJEMPLO Continuando con el ejemplo 2 del numeral 3.1, la probabilidad para un evento se puede encontrar sumando las probabilidades de todos los resultados que componen el evento. Si todos los 45 resultados tienen la

22

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

misma probabilidad, cada uno de ellos tendr una probabilidad 1/45. La probabilidad de un evento se puede encontrar contando el nmero de resultados y dividiendo este nmero por 45. NOTA 1 La medida de la probabilidad (vase el numeral 3.70) suministra la atribucin de nmeros reales a cada evento de inters en el espacio muestral. Si consideramos un evento individual, la atribucin dada por la medida de probabilidad da la probabilidad asociada con el evento. En otras palabras, la medida de la probabilidad da el conjunto completo de atribuciones para todos los eventos, mientras que la probabilidad representa una atribucin especfica para un evento individual. NOTA 2 Esta definicin se refiere a la probabilidad como probabilidad de un evento especfico. La probabilidad puede estar relacionada con una frecuencia relativa de ocurrencias a largo plazo, o con un grado de creencia en la ocurrencia probable de un evento. Habitualmente, la probabilidad de un evento A se designa por P(A). La notacin (A) usando la letra se usa en contextos en donde existe la necesidad de considerar explcitamente la formalidad de un espacio de probabilidad (vase el numeral 3.68).

3.6 Probabilidad condicional, P(A|B) (Conditional Probability, P(A|B)). Probabilidad de un evento (vase el numeral 3.5) de la interseccin de A y B dividida por la probabilidad de B.
EJEMPLO 1 Continuando con el ejemplo de la batera del numeral 3.1, considere el evento A (vase el numeral 3.2) definido como {la batera sobrevive al menos 3 h}, a saber [3, ). Sea el evento B definido como {la batera que funcion inicialmente}, a saber (0, ). La probabilidad condicional de A dado B tiene en cuenta que uno tiene que ver con las bateras que funcionaron inicialmente. EJEMPLO 2 Continuando con el ejemplo 2 del numeral 3.1, si la seleccin es sin reemplazo, la probabilidad de seleccionar la resistencia 2 en la segunda extraccin es igual a 0, dado que no fue seleccionada en la primer extraccin. Si las probabilidades son iguales para todas las resistencias por seleccionar, la probabilidad de seleccionar la resistencia 2 en la segunda extraccin es igual a 0,111 1, dado que no ha sido seleccionada en la primera extraccin. EJEMPLO 3 Continuando con el ejemplo 2 del numeral 3.1, si la seleccin se hace con reemplazo, y las probabilidades son las mismas para todas las resistencias que van a ser seleccionadas dentro de cada extraccin, entonces la probabilidad de seleccionar la resistencia 2 en la segunda extraccin ser de 0,1 si la resistencia 2 ha sido seleccionada o no en la primera extraccin. As, los resultados de la primera y segunda extraccin son eventos independientes. NOTA 1 Se requiere que la probabilidad del evento B sea mayor de cero.

NOTA 2 "A dado B" se puede formular en forma ms completa como "el evento A dado que el evento B ha ocurrido". La barra vertical en el smbolo para probabilidad condicional se lee "dado". NOTA 3 Si la probabilidad condicional del evento A dado que el evento B ocurri es igual a la probabilidad de que ocurra A, los eventos A y B son independientes. En otras palabras, el conocimiento de la ocurrencia de B no sugiere ajustes a la probabilidad de A.

3.7 Funcin de distribucin de una variable aleatoria X, F(x). (Distribution Function of a Random Variable X, F(x)) Funcin de x dada la probabilidad (vase el numeral 3.5) del evento (vase el numeral 3.2) (-, x]
NOTA 1 El intervalo (-, x] es el conjunto de todos los valores hasta x inclusive.

NOTA 2 La funcin de distribucin describe completamente la distribucin de probabilidad (vase el numeral 3.11) de la variable aleatoria (vase el numeral 3.10). Las clasificaciones de las distribuciones, al igual que las clasificaciones de las variables aleatorias en clases discretas o continuas se basan en clasificaciones de las funciones de distribucin. NOTA 3 Ya que las variables aleatorias toman valores que son nmeros reales o k-uplas ordenadas de nmeros reales, est implcito en la definicin que x es tambin un nmero real o una k-upla ordenada de nmeros reales. La funcin de distribucin para una distribucin con mltiples variables (vase el numeral 3.17) da la probabilidad de un evento (vase el numeral 3.5) de que cada una de las variables aleatorias de la distribucin con mltiples variables sea menor o igual a un valor especificado. En trminos de notacin, una funcin de distribucin con variables mltiples est dada por F(x1, x2, ..., xn) = P[X1 x1, X2 x2, ..., Xn xn ]. Adems, una funcin de distribucin es no decreciente. En una posicin con una sola variable, la funcin de distribucin est dada por F(x) = P[X x], que da la probabilidad del evento de que la variable aleatoria X asuma un valor menor o igual a x.

23

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 4 Comnmente las funciones de distribucin se clasifican en funciones de distribucin discreta (vase el numeral 3.22) y distribucin continua (vase el numeral 3.23) pero existen otras posibilidades. Tomando nuevamente el ejemplo de la batera del numeral 3.1, una posible funcin de distribucin es:
0 0 ,1 F (x) = 0 ,1 + 0 ,9 [1 exp ( x ) ] si si si x < 0 x = 0 x > 0

Sobre la base de esta especificacin de la funcin de distribucin, la vida de la batera es no negativa. Existe una probabilidad del 10 % de que la batera no funcione al primer intento. Si la batera funciona inicialmente, su vida tiene una distribucin exponencial (vase el numeral 3.58) con una vida media de 1 h.
NOTA 5 La abreviatura fda (funcin de distribucin acumulativa) est dada para la funcin de distribucin.

3.8 Familia de distribuciones (Family of Distributions). Conjunto de distribuciones de probabilidad (vase el numeral 3.11).
NOTA 1 El conjunto de distribuciones de probabilidad con frecuencia est determinado por un parmetro (vase el numeral 3.9) de la probabilidad de distribucin. NOTA 2 Con frecuencia la media (vase el numeral 3.35) y/o la varianza (vase el numeral 3.36) de la distribucin de probabilidad se usan como el ndice de la familia de distribuciones o como parte del ndice en los casos en donde se necesitan ms de dos parmetros para determinar la familia de distribuciones. En otras ocasiones, la media y la varianza no son necesariamente parmetros explcitos en la familia de distribuciones, sino ms bien una funcin de los parmetros.

3.9 Parmetro (Parameter). ndice de una familia de distribuciones (vase el numeral 3.8).
NOTA 1 El parmetro puede ser unidimensional o multidimensional.

NOTA 2 Algunas veces los parmetros se designan como parmetros de posicin, particularmente si el parmetro corresponde directamente a la media de la familia de distribuciones. Algunos parmetros se describen como parmetros de escala, particularmente si son exactos o proporcionales a la desviacin estndar (vase el numeral 3.37) de la distribucin. Los parmetros que no son de posicin ni de escala se denominan generalmente parmetros de forma.

3.10 Variable aleatoria (Random Variable). Funcin definida en un espacio muestral (vase el numeral 3.1) en donde los valores de la funcin son k-uplas de nmeros reales.
EJEMPLO Continuando con el ejemplo de la batera introducido en el numeral 3.1, el espacio muestral est compuesto de eventos que se describen con palabras (la batera falla al intento inicial, la batera trabaja al comienzo, pero falla a las x horas). Estos eventos son difciles de analizar matemticamente, por tanto es natural asociar con cada evento el momento (dado como un nmero real) en el que la batera falla. Si la batera aleatoria toma el valor de 0, entonces se reconocera que este resultado corresponde a una falla inicial. Para un valor de la variable aleatoria mayor de 0 se entendera que la batera trabaj inicialmente y luego fall a su valor especfico. La representacin de la variable aleatoria permite responder preguntas tales como: " Cul es la probabilidad de que la batera exceda su vida garantizada, es decir, 6 h?" NOTA 1 Un ejemplo de k-upla ordenada es (x1, x2, ..., dimensiones k (ya sea un vector de fila o columna).

xk). En otras palabras, una k-upla ordenada es un vector en

NOTA 2 Como regla general, la variable aleatoria tiene una dimensin designada como k. Si k = 1, se dice que la variable aleatoria es unidimensional o con una sola variable. Para k > 1, se dice que la variable aleatoria es multidimensional. En la prctica, cuando la dimensin es un nmero dado, k, se dice que la variable aleatoria es kdimensional.

24

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 3 Una variable aleatoria unidimensional es una funcin de valor real definida en el espacio muestral (vase el numeral 3.1) que es parte de un espacio de probabilidad (vase el numeral 3.68). NOTA 4 Una variable aleatoria con valores reales dados como pares ordenados, se dice que es bidimensional. La definicin ampla el concepto de par ordenado a las k-uplas ordenadas. NOTA 5 El componente jsimo de una variable aleatoria dimensional con k dimensiones es la variable aleatoria sima componente de la k-upla. El componente jsima de una variable aleatoria con k correspondiente solamente al j dimensiones corresponde a un espacio de probabilidad en donde los eventos (vase el numeral 3.2) estn determinados solamente en trminos de los valores del componente considerado.

3.11 Distribucin de probabilidad (Probability Distribution, Distribution). Medida de la probabilidad (vase el numeral 3.70) inducida por una variable aleatoria (vase el numeral 3.10).
EJEMPLO Continuando con el ejemplo de la batera del numeral 3.1, la distribucin de la vida de la batera describe completamente las probabilidades con las que ocurre el valor especfico. No se conoce con certeza cul ser el momento de falla de una batera dada, y tampoco si funcionar al primer intento. La distribucin de probabilidad describe completamente la naturaleza probabilstica de un resultado incierto. En la Nota 4 del numeral 3.7 se incluy una representacin posible de la distribucin de probabilidad, a saber, una funcin de distribucin. NOTA 1 Existen numerosas representaciones matemticas equivalentes de una distribucin, que incluyen la funcin de distribucin (vase el numeral 3.7), la funcin de densidad de probabilidad (vase el numeral 3.27), si existe, y la funcin caracterstica. Con niveles variados de dificultad, estas representaciones permiten determinar la probabilidad con la cual una variable aleatoria toma valores en una regin dada. NOTA 2 Ya que una variable aleatoria es una funcin de subconjuntos del espacio muestral al valor real, puede existir el caso, por ejemplo, donde la probabilidad de que una variable aleatoria tome un valor real es 1. Para el ejemplo de la batera, P[X 0] = 1. En muchas situaciones es mucho ms fcil analizar directamente la variable aleatoria y una de sus representaciones, que interesarse en la medicin de probabilidad subyacente. Sin embargo, al hacer la conversin de una representacin a otra, la medida de la probabilidad asegura la coherencia. NOTA 3 Una variable aleatoria con un solo componente se denomina distribucin de probabilidad unidimensional o con una sola variable. Si una variable aleatoria tiene dos componentes, se habla de una distribucin de probabilidad bidimensional o con dos variables, y con ms de dos componentes, la variable aleatoria tiene una distribucin de probabilidad multidimensional o con mltiples variables.

3.12 Valor esperado (Expectation). Integral de una funcin de una variable aleatoria (vase el numeral 3.10) con respecto a una medida de probabilidad (vase el numeral 3.70) sobre el espacio muestral (vase el numeral 3.1).
NOTA 1 como: El valor esperado de la funcin g de una variable aleatoria X se designa mediante E [g(X)] y se calcula

E [g ( X )] = en donde
F(x)

g ( X ) dP = g ( x ) d F ( x )
Rk

es la funcin de distribucin correspondiente.

NOTA 2 La "E" en E[g(X)] proviene del valor esperado o expectativa de la variable aleatoria X. E se puede considerar como un operador o funcin que representa una variable aleatoria con una lnea real, de acuerdo con el clculo anterior. NOTA 3 Se dan dos integrales para E[g(X)] . La primera concierne a la integracin sobre el espacio muestral que es conceptualmente atractivo, pero no para uso prctico, por razones de dificultad al abordar estos eventos (por ejemplo, si se indican verbalmente). La segunda integral describe el clculo sobre Rk, que es de mayor inters prctico. NOTA 4 En muchos casos de inters prctico la integral anterior se reduce a una forma reconocible de clculo. Se presentan ejemplos en las notas del momento de orden r (vase el numeral 3.34) en donde g(x) = xr , la media (vase el numeral 3.35) en donde g(x) = x y la varianza (vase el numeral 3.36) en donde g(x) = [x - E (X)]2.

25

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 5 La definicin no est limitada a integrales unidimensionales, como lo podran sugerir los ejemplos y notas anteriores. Para situaciones dimensionales superiores, vase el numeral 3.43. NOTA 6 Para una variable aleatoria discreta (vase el numeral 3.28), la segunda integral de la nota 1 se reemplaza por el smbolo de sumatoria. En el numeral 3.35 se presentan ejemplos.

3.13 Cuantila-p, Fractila-p, Xp, xp.. Valor de x igual al menor de todos los x, de manera que la funcin de distribucin (vase el numeral 3.7) F(x) es mayor o igual que p, para 0 < p < 1.
EJEMPLO 1 Considere una distribucin binomial (vase el numeral 3.46) con la funcin de masa de probabilidad dada en la Tabla 2. Este conjunto de valores corresponde a una distribucin binomial con parmetros n = 6 y p = 0,3. Para este caso, algunas p-cuantilas seleccionadas son: x0,1 = 0 x0,25 = 1 x 0,5 = 2 x0,75 = 3 x0,90 = 3 x0,95 = 4 x0,99 = 5 x0,999 = 5

El carcter discreto de la distribucin binomial conduce a valores integrales de las cuantilas-p.


Tabla 2. Ejemplo de distribucin binomial

X 0 1 2 3 4 5 6

P[X=x] 0,117 649 0,302 526 0,324 135 0,185 220 0,059 535 0,010 206 0,000 729

P[X x] 0,117 649 0,420 175 0,744 310 0,929 530 0,989 065 0,999 271 1,000 000

P[X > x] 0,882 351 0,579 825 0,255 690 0,070 470 0,010 935 0,000 729 0,000 000

EJEMPLO 2 Considere una distribucin normal estandarizada (vase el numeral 3.51) con valores seleccionados, a partir de su funcin de distribucin dada en la Tabla 3. Algunas cuantilas-p seleccionadas son:
Tabla 3. Ejemplo de distribucin normal estandarizada p 0,1 0,25 0,5 0,75 0,841 344 75 0,9 0,95 0,975 0,99 0,995 0,999 x tal que P[X x]= p -1,282 -0,674 0,000 0,674 1,000 1,282 1,645 1,960 2,356 2,576 3,090

Ya que la distribucin de X es continua, el encabezado de la segunda columna tambin puede ser x, tal que P [X < x] = p.

26

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 1 Para las distribuciones continuas (vase el numeral 3.23), si p es 0,5, entonces la cuantila-0,5 corresponde a la mediana (vase el numeral 3.14). Para p igual a 0,25, la cuantila-0,25 se conoce como la cuartila inferior. Para distribuciones continuas, el 25 % de la distribucin est por debajo de la cuantila 0,25, mientras que el 75 % est por encima de la cuantila 0,25. Para p igual a 0,75, la cuantila-0,75 se conoce como la cuartila superior. NOTA 2 En general, 100 p % de una distribucin est por debajo la cuantila-p; 100(1-p) % de una distribucin est por encima de la cuantila-p. Es difcil definir la mediana para las distribuciones discretas, ya que se puede argumentar que tiene mltiples valores que satisfacen la definicin. NOTA 3 Si F es continua y estrictamente creciente, la p-cuantila es la solucin a F(x) = p. En este caso, la palabra "infimum" en la definicin puede ser reemplazada por "mnimo". NOTA 4 Si la funcin de distribucin es constante e igual a p en un intervalo, entonces todos los valores en ese intervalo son cuantilas-p para F. NOTA 5 Las cuantilas-p se definen para las distribuciones con una variable (vase el numeral 3.16).

3.14 Mediana (Median). Cuantila-0,5 (vase el numeral 3.13).


EJEMPLO Para el ejemplo de la batera de la Nota 4 en el numeral 3.7, la mediana es 0,587 8, que es la solucin para x en 0,1 + 0,9 [1-exp(-x)] = 0,5 NOTA 1 La mediana es una de las cuantilas-p (vase el numeral 3.13) de aplicacin ms comn en la prctica. La mediana de una distribucin continua con una variable (vase el numeral 3.16) es tal, que la mitad de la poblacin (vase el numeral 2.1) es mayor o igual a la mediana, y la mitad de la poblacin es menor o igual a la mediana. NOTA 2 Las medianas se definen para distribuciones con una variable (vase el numeral 3.16).

3.15 Cuartila (Quartile). Cuantila-0,25 (vase el numeral 3.13) o cuantila-0,75.


EJEMPLO Continuando con el ejemplo de la batera del numeral 3.14, se puede demostrar que la cuantila 0,25 es 0,182 3 y la cuantila 0,75 es 1,280 9. NOTA 1 La cuantila 0,25 tambin se conoce como la cuartila inferior mientras que la cuantila 0,75 tambin se conoce como la cuartila superior. NOTA 2 Las cuantilas se definen para distribuciones con una variable (vase el numeral 3.16).

3.16 Distribucin de probabilidad con una variable (Univariate Probability Distribution, Univariate Distribution). Distribucin de probabilidad (vase el numeral 3.11) de una sola variable aleatoria (vase el numeral 3.10).
NOTA Las distribuciones de probabilidad con una variable son unidimensionales. Las distribuciones binomial (vase el numeral 3.46), Poisson (vase el numeral 3.47), normal (vase el numeral 3.50), gama (vase el numeral 3.56), t (vase el numeral 3.53), Weibull (vase el numeral 3.63) y beta (vase el numeral 3.59) son ejemplos de distribuciones de probabilidad con una variable.

3.17 Distribucin de probabilidad multivariable, distribucin multivariable (Multivariate Probability Distribution, Multivariate Distribution). Distribucin de probabilidad (vase el numeral 3.11) de dos o ms variables aleatorias (vase el numeral 3.10).
NOTA 1 Para distribuciones de probabilidad con dos variables aleatorias exactamente, el calificativo "con mltiples variables" con frecuencia se reemplaza por el calificativo ms restrictivo con dos variables. Como se mencion en el prlogo, la distribucin de probabilidad de una sola variable aleatoria se puede denominar explcitamente distribucin unidimensional o distribucin con una variable (vase el numeral 3.16). Ya que esta situacin es la que predomina, es habitual suponer una situacin con una variable, a menos que se indique algo diferente. NOTA 2 La distribucin con mltiples variables algunas veces se denomina distribucin conjunta.

27

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 3 La distribucin multinomial (vase el numeral 3.45), la distribucin normal con dos variables (vase el numeral 3.65) y la distribucin normal multivariable (vase el numeral 3.64) son ejemplos de distribuciones de probabilidad multivariable (vase el numeral 3.64) de que trata la presente norma, NTC 2062-1 (ISO 3534-1).

3.18 Distribucin de probabilidad marginal, distribucin marginal (Marginal Probability Distribution, Marginal Distribution). Distribucin de probabilidad (vase el numeral 3.11) de un subconjunto estricto y no vaco de componentes de una variable aleatoria (vase el numeral 3.10).
EJEMPLO 1 Para una distribucin con tres variables aleatorias X, Y y Z hay tres distribuciones marginales con dos variables aleatorias, a saber, para (X, Y), (X, Z) y (Y, Z) y tres distribuciones marginales con una sola variable aleatoria, a saber, para X, Y y Z. EJEMPLO 2 Para la distribucin normal con dos variables (vase el numeral 3.65) de la pareja de variables (X, Y), la distribucin de cada una de las variables X y Y consideradas separadamente son distribuciones marginales, y ambas son distribuciones normales (vase el numeral 3.50). EJEMPLO 3 Para la distribucin multinomial (vase el numeral 3.45), la distribucin de (X1, X2) es una distribucin marginal si k > 3. Las distribuciones de X1, X2, ... Xk separadamente tambin son distribuciones marginales. Estas distribuciones marginales son cada una distribuciones binomiales (vase el numerales 3.46). NOTA 1 Para una distribucin conjunta en dimensiones k, un ejemplo de una distribucin marginal incluye la distribucin de probabilidad de un subconjunto de k1 < k variables aleatorias. NOTA 2 Dada una distribucin de probabilidad multivariable (vase el numeral 3.17) continuas (vase el numeral 3.23) representadas por su funcin de densidad de probabilidad (vase el numeral 3.26), la funcin de densidad de probabilidad de su distribucin de probabilidad marginal se determina integrando la funcin de densidad de probabilidad sobre el dominio de las variables que no se consideran en la distribucin marginal. NOTA 3 Dada una distribucin de probabilidad con mltiples variables discretas (vase el numeral 3.22) representada por su funcin de masa de probabilidad (vase el numeral 3.24), la funcin de masa de probabilidad de su distribucin de probabilidad marginal se determina sumando la funcin de masa de probabilidad sobre el dominio de las variables que no se consideran en la distribucin marginal.

3.19 Distribucin de probabilidad condicional, distribucin condicional (Conditional Probability Distribution, Conditional Distribution). Distribucin de probabilidad (vase el numeral 3.11) limitada a un subconjunto no vaco del espacio muestral (vase el numeral 3.1) y ajustada para tener una probabilidad total sobre el espacio muestral limitado.
EJEMPLO 1 En el ejemplo de la batera del numeral 3.7, Nota 4, la distribucin condicional de la vida de la batera, dada de que la batera funciona inicialmente, es exponencial (vase el numeral 3.58). EJEMPLO 2 Para la distribucin normal con dos variables (vase el numeral 3.65), la distribucin de probabilidad condicional de Y dado que X = x refleja el impacto sobre Y del conocimiento de X. EJEMPLO 3 Considere una variable aleatoria X que describe la distribucin de los costos anuales asegurados por prdidas en la Florida debido a eventos declarados causados por huracanes. Esta distribucin tendra una probabilidad no cero de costos cero por prdidas anuales debido a la posibilidad de que ningn huracn afecte a la Florida en un ao dado. Puede tener inters la distribucin condicional de los costos de prdidas para estos aos en los que un evento ocurre realmente. NOTA 1 Como ejemplo de una distribucin con dos variables aleatorias X y Y, existen distribuciones condicionales para X y distribuciones condicionales para Y. Una distribucin de X condicionada a travs de Y = y se designa como "distribucin condicional de X dada Y = Y", mientras que una distribucin de Y condicionada por X = x se designa como "distribucin condicional de Y dado X = x". NOTA 2 Las distribuciones de probabilidad marginal (vase el numeral 3.18) se pueden considerar como distribuciones no condicionales. NOTA 3 El Ejemplo 1 anterior ilustra la situacin en que una distribucin con una variable es ajustada por medio de condicionamiento para obtener otra distribucin con una variable, que en este caso es una distribucin diferente. En contraste, para la distribucin exponencial, la distribucin condicional de que una falla ocurrir en la siguiente hora, dado que durante las 10 primeras horas no ha ocurrido ninguna falla, es exponencial con el mismo parmetro.

28

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 4 Algunas distribuciones condicionales pueden surgir para algunas distribuciones discretas en donde no es posible obtener resultados especficos. Por ejemplo, la distribucin de Poisson puede servir como modelo para pacientes de cncer en una poblacin de pacientes infectados, sobre la base de que es estrictamente positiva (un paciente sin tumores por definicin no est infectado). NOTA 5 Las distribuciones condicionales surgen en el contexto de limitar el espacio muestral a un subconjunto particular. Para (X, Y) que tienen una distribucin normal con dos variables (vase el numeral 3.65), puede ser de inters considerar la distribucin condicional de (X, Y), dado que el resultado debe ocurrir en el cuadrado de la unidad [0,1] x [0,1]. Otra posibilidad es la distribucin condicional de (X, Y), dado que X2 + Y2 r. Este caso corresponde a una situacin en la que, por ejemplo, una parte cumple una tolerancia y una podra estar interesada en otras propiedades, con base en la conformidad con esta tolerancia.

3.20 Curva de regresin (Regression Curve). Conjunto de valores esperados (vase el numeral 3.12) de la distribucin de probabilidad condicional (vase el numeral 3.19) de una variable aleatoria (vase el numeral 3.10) Y dada una variable aleatoria X = x.
NOTA Aqu, una curva de regresin se define en el contexto de (X, Y) que tiene una distribucin con dos variables (vase la Nota 1 del numeral 3.17). En consecuencia, es un concepto diferente de los encontrados en el anlisis de regresin en el cual Y est relacionado con un conjunto determinista de valores independientes.

3.21 Superficie de regresin (Regression Surface). Conjunto de valores esperados (vase el numeral 3.12) de la distribucin de probabilidad condicional (vase el numeral 3.19) de una variable aleatoria Y (vase el numeral 3.10) dadas las variables aleatorias X1 = x1 y X2 = x2.
NOTA Aqu, al igual que en el numeral 3.20, la superficie de regresin se define en el contexto de (Y, X1, X2) que tiene una distribucin multivariable (vase el numeral 3.17). Al igual que con la curva de regresin, la superficie de regresin involucra un concepto diferente de los encontrados en el anlisis de regresin y en la metodologa de respuesta de la superficie.

3.22 Distribucin de probabilidad discreta, distribucin discreta (Discrete Probability Distribution, Discrete Distribution). Distribucin de probabilidad (vase el numeral 3.11) para la cual el espacio muestral (vase el numeral 3.1) es finito o contablemente infinito .
EJEMPLO Los ejemplos de distribuciones discretas en este documento son multinomiales (vase el numeral 3.45), binomiales (vase el numeral 3.46), Poisson (vase el numeral 3.47), hipergeomtricas (vase el numeral 3.48) y binomiales negativas (vase el numeral 3.49). NOTA 1 El trmino "discreto" implica que el mismo espacio muestral se puede dar en una lista finita o al inicio de una lista infinita en la cual la estructura es aparente, tal como un nmero de defectos igual a 0, 1, 2, ... Adicionalmente, la distribucin binomial corresponde a un espacio muestral finito {0, 1, 2, ... n}, mientras que la distribucin de Poisson corresponde a un espacio muestral infinito en forma contable {0, 1, 2, ...}. NOTA 2 NOTA 3 Las situaciones con datos de atributos en el muestreo de aceptacin involucran distribuciones discretas. La funcin de distribucin (vase el numeral 3.7) de una distribucin discreta contiene valores discretos.

3.23 Distribucin de probabilidad continua, distribucin continua (Continuous Probability Distribution). Distribucin de probabilidad (vase el numeral 3.11) para la cual la funcin de distribucin (vase el numeral 3.7) evaluada en x se puede expresar como una integral de una funcin no negativa de - a x.
EJEMPLO Las situaciones en las que ocurren distribuciones continuas son prcticamente cualquiera de las que involucran datos tipo variable encontrados en aplicaciones industriales. NOTA 1 Los ejemplos de las distribuciones continuas son normal (vase el numeral 3.50), normal estandarizada (vase el numeral 3.51), t (vase el numeral 3.53), F (vase el numeral 3.55), gama (vase el numeral 3.56), chicuadrado (vase el numeral 3.57), exponencial (3.58), beta (vase el numeral 3.59), uniforme (vase el numeral 3.60), valor extremo tipo I (vase el numeral 3.61), valor extremo tipo II (vase el numeral 3.62), valor extremo tipo III (vase el numeral 3.63), y logartmica normal (vase el numeral 3.52).

29

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 2 La funcin no negativa a la que se hace referencia en la definicin es la funcin de densidad de probabilidad (vase el numeral 3.26). Es demasiado restrictivo insistir en que la funcin de distribucin sea diferenciable en todas partes. Sin embargo, para consideraciones prcticas muchas distribuciones continuas usadas comnmente se benefician de la propiedad de que la derivada de la funcin de distribucin proporciona la funcin de densidad de probabilidad correspondiente. NOTA 3 Las situaciones con datos tipo variable en las aplicaciones de muestreo de aceptacin corresponden a distribuciones de probabilidad continuas.

3.24 Funcin de masa de probabilidad (Probability Mass Function) .<Distribucin discreta> funcin que da la probabilidad (vase el numeral 3.5) de que una variable aleatoria (vase el numeral 3.10) sea igual a un valor dado.
EJEMPLO 1 La funcin de masa de probabilidad que describe la variable aleatoria X igual al nmero de caras que resultan al lanzar tres monedas es:
P ( X = 0) = 1 / 8 P ( X = 1) = 3 / 8 P ( X = 2) = 3 / 8 P ( X = 3) = 1 / 8

EJEMPLO 2 Al definir las distribuciones discretas comunes (vase el numeral 3.22) encontradas en aplicaciones se dan diversas funciones de masa de probabilidad. Los ejemplos siguientes de distribuciones discretas con una variable incluyen la binomial (vase el numeral 3.4), Poisson (vase el numeral 3.47), hipergeomtrica (vase el numeral 3.48) y binomial negativa (vase el numeral 3.49). Un ejemplo de una distribucin discreta con mltiples variables es la multinomial (vase el numeral 3.45). NOTA 1 La funcin de masa de probabilidad se puede dar como P(X=x1) = pi, en donde X es la variable aleatoria, xi es un valor dado, y pi es la probabilidad correspondiente. NOTA 2 Una funcin de masa de probabilidad se introdujo en la cuantila-p del ejemplo 1 del numeral 3.13, usando distribucin binomial (vase el numeral 3.46).

3.25 Modo de funcin de masa de probabilidad (Mode of Probability Mass Function). Valor(es) en donde una funcin de masa de probabilidad (vase el numeral 3.24) alcanza el mximo local.
EJEMPLO La distribucin binomial (vase el numeral 3.46) con n = 6 y p = 1/3 es unimodal, con un modo en 3.

NOTA Una distribucin discreta (vase el numeral 3.22) es unimodal si su funcin de masa de probabilidad tiene exactamente un modo, bimodal si su funcin de probabilidad tiene exactamente dos modos, y multimodal si su funcin de masa de probabilidad tiene ms de dos modos.

3.26 Funcin de densidad de probabilidad, f(x) (Probability Density Function, f(x)). Funcin no negativa que cuando est integrada de - a x da la funcin de distribucin (vase el numeral 3.7) evaluada en x de una distribucin continua (vase el numeral 3.23).
EJEMPLO 1 Se dan diversas funciones de densidad de la probabilidad al definir las distribuciones de probabilidad comunes encontradas en la prctica. Los ejemplos siguientes incluyen las distribuciones normal (vase el numeral 3.50), normal estandarizada (vase el numeral 3.51), t (vase el numeral 3.53), F (vase el numeral 3.55), gamma (vase el numeral 3.56), chi- cuadrado (vase el numeral 3.57), exponencial (vase el numeral 3.58), beta (vase el numeral 3.59), uniforme (vase el numeral 3.60), normal multivariable (vase el numeral 3.64) y distribuciones normales con dos variables (vase el numeral 3.65). EJEMPLO 2 Para la funcin de distribucin definida por F(x) = 3x2 - 2x3 en donde 0 x 1, la funcin de densidad de probabilidad correspondiente es f(x) = 6x (1 -x) en donde 0 x 1. EJEMPLO 3 Continuando con el ejemplo de la batera del numeral 3.1, no existe una funcin de densidad de probabilidad asociada con la funcin de distribucin especificada, debido a la probabilidad positiva de obtener un resultado cero. Sin embargo, la distribucin condicional dada de que la batera funciona inicialmente tiene f(x) = exp (-x) para x > 0 como su funcin de densidad de probabilidad, que corresponde a la distribucin exponencial.

30

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 1 Si la funcin de distribucin F es diferenciable en forma continua, entonces la funcin de densidad de probabilidad es:
f ( x ) = dF ( x ) / dx

En los puntos x en donde existe la derivada.


NOTA 2 Una representacin grfica de f(x) contra x sugiere descripciones tales como simtricas, con valor pico, con mayor ponderacin en las colas, unimodal, bimodal, entre otros. Un grfico de una f(x) ajustada sobre un histograma brinda una evaluacin visual del acuerdo entre una distribucin ajustada y los datos. NOTA 3 Una abreviatura comn de la funcin de densidad de probabilidad es fdp.

3.27 Modo de funcin de densidad de probabilidad (Mode of Probability Density Function). Valor(es) en donde una funcin de densidad de probabilidad (vase el numeral 3.26) alcanza un mximo local.
NOTA 1 Una distribucin continua (vase el numeral numeral 3.23) es unimodal si su funcin de densidad de probabilidad tiene un modo exactamente, bimodal si su funcin de densidad de probabilidad tiene dos modos exactamente, y multimodal si su funcin de densidad de probabilidad tiene ms de dos modos. NOTA 2 Una distribucin en donde los modos constituyen un conjunto conexo se define igualmente como unimodal.

3.28 Variable aleatoria discreta (Discrete Random Variable). Variable aleatoria (vase el numeral 3.10) que tiene una distribucin discreta (vase el numeral 3.22).
NOTA Las variables aleatorias discretas consideradas en esta parte de la NTC 2062 (ISO 3534) incluyen las variables binomiales (vase el numerales 3.46), Poisson (vase el numeral 3.47), hipergeomtricas (vase el numeral 3.48) y las aleatorias (vase el numeral 3.45).

3.29 Variable aleatoria continua (Continuous Random Variable). Variable aleatoria (vase el numeral 3.10) que tiene una distribucin continua (vase el numeral 3.23)
NOTA Las variables aleatorias continuas consideradas en esta parte 1 norma NTC 2062 (ISO 3534) incluyen las variables aleatorias normal (vase el numeral 3.50), normal estandarizada (vase el numeral 3.51), distribucin t (vase el numeral 3.53), distribucin F (vase el numeral 3.55), gama (vase el numeral 3.56, chi-cuadrado (vase el numeral 3.57), exponencial (vase el numeral 3.58), beta (vase el numeral 3.59), uniforme (vase el numeral 3.60), valor extremo Tipo I (vase el numeral 3.61), valor extremo Tipo II (vase el numeral 3.62), valor extremo Tipo III (vase el numeral 3.63), logartmica normal (vase el numeral 3.52), normal multivariable (vase el numeral 3.64) y normal con dos variables (vase el numeral 3.65).

3.30 Distribucin de probabilidad centrada (Centred Probability Distribution). Distribucin de probabilidad (vase el numeral 3.11) de una variable aleatoria centrada (vase el numeral 3.31). 3.31 Variable aleatoria centrada (Centred Random Variable). Variable aleatoria (vase el numeral 3.10) en donde la media (vase el numeral 3.35) se ha restado.
NOTA 1 Una variable aleatoria centrada tiene una media igual a cero.

NOTA 2 Este trmino se aplica solamente a variables aleatorias con una media. Por ejemplo, no existe la media de la distribucin t (vase el numeral 3.53) con un grado de libertad. NOTA 3 Si una variable aleatoria X tiene una media (vase el numeral 3.35) igual a , la variable aleatoria centrada correspondiente es X - , que tiene una media igual a cero.

3.32 Distribucin de probabilidad normalizada (Standardized Probability Distribution). Distribucin de probabilidad (vase el numeral 3.11) de una variable aleatoria normalizada (vase el numeral 3.33). 31

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

3.33 Variable aleatoria normalizada (Standardized Random Variable). Variable aleatoria centrada (vase el numeral 3.31) cuya desviacin estndar (vase el numeral 3.37) es igual a 1.
NOTA 1 Una variable aleatoria (vase el numeral 3.10) se normaliza automticamente si su media es cero y su desviacin estndar es 1. La distribucin uniforme (vase el numeral 3.60) en el intervalo (-30,5, 30,5) tiene cero como media y una desviacin estndar igual a 1. La distribucin normal estandarizada (vase el numeral 3.51) es, por supuesto, normalizada. NOTA 2 Si la distribucin (vase el numeral 3.11) de la variable aleatoria X tiene una media (vase el numeral 3.35) y desviacin estndar , entonces la variable aleatoria correspondiente es (X - ) / .

3.34 Momento de orden r, momento r-simo (Moment of Order r, rth Moment). Valor esperado (vase el numeral 3.12) de la rsima potencia de una variable aleatoria (vase el numeral 3.10).
EJEMPLO Considere una variable aleatoria que tiene una funcin de densidad de probabilidad (vase el numeral 3.26) f(x) = exp(-x) para x > 0. Usando la integracin por partes del clculo elemental, se puede demostrar que E(X) = 1, E(X2) = 2, E(X3) = 6 y E(X4) = 24, en general, E(Xr) = r!. Este es un ejemplo de distribucin exponencial (vase el numeral 3.58). NOTA 1 En el caso discreto con una variable, la frmula apropiada es:
n

E (X

) =

x ir p ( x i )

i =1

Para un nmero finito de n resultados y


E (X
r

) =

x ir p ( x i )

i =1

para un nmero de resultados contablemente infinitos. En el caso de condiciones continuas con una variable, la frmula apropiada es:

E(X r) =

f (x) dx

NOTA 2 Si la variable aleatoria tiene una dimensin k, entonces se entiende que la potencia rsima se aplica componente por componente. NOTA 3 Los momentos dados aqu utilizan una variable aleatoria X elevada a una potencia. Ms generalmente, se pueden considerar momentos del orden r de X - , o (X - ) /.

3.35 Medias (Means) 3.35.1 Media (Mean), , momento de orden r = 1, (Moment of Order r=1 ) <Distribucin continua> Momento de orden r, en donde r es igual a 1, calculado como la integral del producto de x y la funcin de densidad de probabilidad (vase el numeral 3.26), f(x), sobre la lnea real.
EJEMPLO 1 Considere una variable aleatoria continua (vase el numeral 3.29) X que tiene una funcin de densidad de probabilidad f(x) = 6x(1-x), en donde 0 x 1. La media de X es:

1 0

6 x 2 (1 x )d x = 0,5

EJEMPLO 2 Continuando con el ejemplo de la batera de los numerales 3.1 y 3.7, la media es 0,9, ya que con una probabilidad de 0,1, la media de la parte discreta de la distribucin es 0 y con probabilidad de 0,9 la media de la parte continua de la distribucin es 1. Esta distribucin es una mezcla de distribuciones continuas y discretas.

32

NORMA TCNICA COLOMBIANA


NOTA 1

NTC 2062-1 (Segunda actualizacin)

La media de una distribucin continua (vase el numeral 3.23) se designa por E(x) y se calcula como:

E (X ) =

xf ( x ) d x

NOTA 2 La media no existe para todas las variables aleatorias (vase el numeral 3.10). Por ejemplo, si X se define por su funcin de densidad de probabilidad f(x) = [(1 + x2)]-1, la integral correspondiente a E(X) es divergente.

3.35.2 Media, (Mean, ). <Distribucin discreta> Sumatoria del producto de xi y la funcin de masa de probabilidad (vase el numeral 3.24) p(xi).
EJEMPLO 1 Considere una variable aleatoria discreta X (vase el numeral 3.28) que representa el nmero de caras resultantes cuando se lanzan 3 monedas. La funcin de masa de probabilidad es:
P ( X = 0 ) =1 / 8 P ( X = 1) = 3 / 8 P ( X = 2) = 3 / 8 P ( X = 3) = 1 / 8

En consecuencia, la media de X es:


0 (1 / 8 ) + 1 ( 3 / 8 ) + 2 ( 3 / 8 ) +3(1 / 8 ) = 12 / 8 = 1,5

EJEMPLO 2 Vase el ejemplo 2 del numeral 3.35.1. NOTA La media de una distribucin discreta (vase el numeral 3.22) se designa por E(x) y se calcula como:
E(X ) =

x p (x )
i i i =1

Para un nmero finito de resultados, y


E (X ) =

xi p( xi )

i =1

Para un nmero de resultados contablemente infinitos. 3.36 Varianza, V (Variance, V). Momento de orden r (vase el numeral 3.34) en donde r es igual a 2 en la distribucin de probabilidad centrada (vase el numeral 3.30) de la variable aleatoria (vase el numeral 3.10).
EJEMPLO 1 Para la variable aleatoria discreta (vase el numeral 3.28) en el ejemplo del numeral 3.24, la varianza es:

(x
i=0

1,5) 2 P ( X = x i ) = 0,75

EJEMPLO 2

Para la variable aleatoria continua (vase el numeral 3.29) en el ejemplo 1 del numeral 3.26, la varianza es:

1 0

( xi 0,5 ) 2 6 x (1 x ) d x = 0,05

EJEMPLO 3 Para el ejemplo de la batera del numeral 3.1, la varianza se puede determinar reconociendo que la varianza de X es E (X2) - [E(X)] 2. Del ejemplo 3 del numeral 3.35, E(X) = 0,9. Usando el mismo tipo de argumento de condicionamiento, se puede demostrar que E(X2) es 1,8. As, la varianza de X es 1,8 - (0,9)2, que es igual a 0,99.

33

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA La varianza se puede definir de manera equivalente como el valor esperado (vase el numeral 3.12) del cuadrado de la variable aleatoria menos su media (vase el numeral 3.35). La varianza de la variable aleatoria X se designa mediante V(X) = E{[X-E(X)]2}.

3.37 Desviacin estndar, (Standard Desviation, ). Raz cuadrada positiva de la varianza (vase el numeral 3.36).
EJEMPLO Para el ejemplo de la batera de los numerales 3.1 y 3.7 la desviacin estndar es 0,995.

3.38 Coeficiente de variacin, CV (Coefficient of Variation, CV). <Variable aleatoria positiva> desviacin estndar (vase el numeral 3.37) dividida por la media (vase el numeral 3.35).
EJEMPLO Para el ejemplo de la batera de los numerales 3.1 y 3.7, el coeficiente de variacin es 0,99/0,995 que es igual a 0,994 97. NOTA 1 El coeficiente de variacin se reporta comnmente como un porcentaje.

NOTA 2 Se prefiere el trmino coeficiente de variacin al trmino usado anteriormente "desviacin estndar relativa".

3.39 Coeficiente de asimetra, 1 (Coefficient of Skewness, 1),. Momento de orden 3 (vase el numeral 3.34) en la distribucin de probabilidad normalizada (vase el numeral 3.32) de una variable aleatoria (vase el numeral 3.10).
EJEMPLO Continuando con el ejemplo de la batera de los numerales 3.1 y 3.7, con una distribucin combinada discreta-continua, y utilizando los resultados del ejemplo del numeral 3.34, se tiene:
E ( X ) = 0 ,1 ( 0 ) + 0 ,9 (1 ) = 0 ,9 E ( X 2 ) = 0 ,1 ( 0 2 ) + 0 ,9 ( 2 ) = 1,8 E ( X 3 ) = 0 ,1 ( 0 ) + 0 ,9 ( 6 ) = 5,4 E ( X 4 ) = 0 ,1 ( 0 ) + 0 ,9 ( 24 ) = 21 ,6

Para calcular el coeficiente de asimetra, observe que E{[X-E(X)] 3} = E(X) 3- 3 E (X) E(X2) + 2 [E(X)]3 , y del numeral 3.37, la desviacin estndar es 0,995. Entonces, el coeficiente de asimetra es [5,4 - 3(0,9)(1,8) + 2(0,9)3]/(0,995)3 1,998.
NOTA 1 Una definicin equivalente se basa en el valor esperado (vase el numeral 3.12) de la tercera potencia de (X-)/, a saber, E[(X-)3 / 3]. NOTA 2 El coeficiente de asimetra es una medida de la simetra de una distribucin (vase el numeral 3.11) y algunas veces se designa como 1 . Para distribuciones simtricas, el coeficiente de asimetra es igual a 0 (siempre y cuando en la definicin existan los momentos apropiados). Los ejemplos de distribuciones con asimetra igual a cero incluyen la distribucin normal (vase el numeral 3.50), la distribucin beta (vase el numeral 3.59) siempre y cuando = y la distribucin t (vase el numeral 3.53), siempre que existan los momentos.

3.40 Coeficiente de curtosis, 2 (Coefficient of Curtosis, 2). Momento de orden 4 (vase el numeral 3.34) en la distribucin de probabilidad normalizada (vase el numeral 3.32) de una variable aleatoria (vase el numeral 3.10).
EJEMPLO Continuando con el ejemplo de la batera de los numerales 3.1 y 3.7, para calcular el coeficiente de curtosis, observe que:
E

{[X

E (X )

}=

E ( X 4 ) 4 E ( X ) E ( X 3 ) + 6 [E ( X ) ] 2 E ( X 2 ) 3 [E ( X ) ] 4

El coeficiente de curtosis es entonces:

[ 21,6 4( 0,9 )( 5,4 ) + 6( 0,9 ) ( 2 ) 3( 0,9 ) ] / ( 0,995 )


2 4

34

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 1 Una definicin equivalente se basa en el valor esperado (vase el numeral 3.12) de la cuarta potencia de (X - ) /, a saber, E[(X - )4 / 4]. NOTA 2 El coeficiente de curtosis es una medida de la mayor ponderacin de las colas de una distribucin (vase el numeral 3.11). Para la distribucin uniforme (vase el numeral 3.60), el coeficiente de curtosis es 1,8; para la distribucin normal (vase el numeral 3.50) el coeficiente de curtosis es 3; para la distribucin exponencial (vase el numeral 3.58), el coeficiente de curtosis es 9. NOTA 3 Se debe tener precaucin al considerar los valores de curtosis reportados, ya que algunos usuarios restan 3 (la curtosis de la distribucin normal) del valor que se calcula de la definicin.

3.41 Momento combinado de las rdenes r y s (Joint Moment of Orders r and s) Media (vase el numeral 3.35) del producto de la rsima potencia de una variable aleatoria (vase el numeral 3.10) y la ssima potencia de otra variable aleatoria en su distribucin de probabilidad (vase el numeral 3.11) combinada. 3.42 Momento central combinado de rdenes r y s (Joint Central Moment of Orders r and s) Media (vase el numeral 3.35) del producto de la rsima potencia de una variable aleatoria centrada (vase el numeral 3.31) y la ssima potencia de otra variable aleatoria centrada en su distribucin de probabilidad combinada (vase el numeral 3.11). 3.43 Covarianza, XY (Covariance, XY). Media (vase el numeral 3.35) del producto de dos variables aleatorias centradas (vase el numeral 3.31) en su distribucin de probabilidad (vase el numeral 3.11) combinada.
NOTA 1 La covarianza es el momento central combinado de las rdenes 1 y 1 (vase el numeral 3.42) para dos variables aleatorias. NOTA 2 En trminos de notacin, la covarianza es: E (X X ) Y en donde
E(X) = X y E(Y) = Y

)]

3.44 Coeficiente de correlacin (Correlation Coefficient). Media (vase el numeral 3.35) del producto de dos variables aleatorias normalizadas (vase el numeral 3.33) en su distribucin de probabilidad (vase el numeral 3.11) combinada.
NOTA El coeficiente de correlacin algunas veces se denomina en forma ms breve como correlacin. Sin embargo, este uso coincide parcialmente con las interpretaciones de correlacin como una asociacin entre dos variables.

3.45 Distribucin multinomial (Multinomial Distribution). Distribucin discreta (vase el numeral 3.22) que tiene la funcin de masa de probabilidad (vase el numeral 3.24)
P ( X1 = x1, X 2 = x2 ,...X k = xk ) n! p1 x1 p2 x2 ... pk x k x1! x2 ! ...xk !
en donde
x1, x2,...xk x1 + x2 + ...+ xk = n k

son enteros no negativos, de manera que: con parmetros pi > 0 para todos los i = 1,2..., k con p1 + p2 + ... + pk = 1
n entero mayor o igual a 2.

35

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA La distribucin multinomial da la probabilidad del nmero de veces que ha ocurrido cada k resultados posibles en n pruebas independientes, en donde cada prueba tiene los mismos k eventos mutuamente exclusivos y las probabilidades de los eventos son las mismas para todas las pruebas.

3.46 Distribucin binomial (Poisson Distribution) Distribucin discreta (vase el numeral 3.22) que tiene la funcin de masa de probabilidad (vase el numeral 3.24)
p( X = x ) = n! p x (1 p ) n x x! ( n x )!

en donde
x

0, 1, 2, ..., n y con los parmetros determinados n = 1,2, ..., y 0 < p < 1.

EJEMPLO La funcin de masa de probabilidad descrita en el ejemplo 1 del numeral 3.24 se puede considerar que corresponde a la distribucin binomial con parmetros de ndice n = 3 y p = 0,5. NOTA 1 k = 2. La distribucin binomial es un caso especial de la distribucin multinomial (vase el numeral 3.45) con

NOTA 2 La distribucin binomial da la probabilidad del nmero de veces que han ocurrido cada uno de los dos resultados posibles en n pruebas independientes, en donde cada prueba tiene los mismos dos eventos (vase el numeral 3.2) mutuamente exclusivos y las probabilidades (vase el numeral 3.5) de los eventos son las mismas para todas las pruebas. NOTA 3 La media (vase el numeral 3.35) de la distribucin binomial es igual a np. La varianza (vase el numeral 3.36) de la distribucin binomial es igual a np(1 - p). NOTA 4 La funcin de masa de probabilidad binomial se puede expresar igualmente utilizando el coeficiente binomial dado por:

( )=
n x

n! x! ( n x )!

3.47 Distribucin de Poisson (Poisson Distribution). Distribucin discreta (vase el numeral 3.22) que tiene la funcin de masa de probabilidad (vase el numeral 3.24)
P(X = x) =

x
x!

e-

en donde
x

0, 1, 2, ... y con el parmetro > 0.

NOTA 1 El lmite de la distribucin binomial (vase el numeral 3.46) cuando n se aproxima a y p tiende a cero, de manera que np tiende a es la distribucin de Poisson con parmetro . NOTA 2 La media (vase el numeral 3.35) y la varianza (vase el numeral 3.36) de la distribucin de Poisson son ambas iguales a NOTA 3 La funcin de masa de probabilidad (vase el numeral 3.24) de la distribucin de Poisson da la probabilidad para el nmero de veces en que ocurre una propiedad de un proceso en un intervalo de tiempo unitario que satisface determinadas condiciones, por ejemplo, intensidad con que ocurre, independientemente del tiempo.

3.48 Distribucin hipergeomtrica (Hypergeometric Distribution). Distribucin discreta (vase el numeral 3.22) con la misma funcin de masa de probabilidad (vase el numeral 3.24).

36

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


( N M )! (n x )! ( N M n + x ) ! N! n ! ( N n) !

(M !) x! ( M x ) ! P(X = x) =

en donde mximo (0, M - N) x mnimo (M, n) con los parmetros enteros

N = 1, 2 , ... M = 0 , 1, 2 , ..., N 1 n = 1, 2 ..., N


NOTA 1 La distribucin hipergeomtrica (vase el numeral 3.11) designa el nmero de elementos marcados en una muestra aleatoria simple (vase el numeral 2.7) de tamao n, tomados sin reemplazo de una poblacin (o lote) de tamao N que contiene exactamente M elementos marcados. NOTA 2 La Tabla 4 permite comprender la distribucin hipergeomtrica.
Tabla 4. Ejemplo de distribucin hipergeomtrica Conjunto de referencia Elementos marcados o no marcados N n N-n Elementos marcados M x M-x Elementos no marcados N-M N-x N-n-M+x

Poblacin Elementos incluidos en la muestra Elementos no incluidos en la muestra

NOTA 3 Bajo determinadas condiciones (por ejemplo, n es pequeo en relacin con N), entonces la distribucin hipergeomtrica se puede aproximar por la distribucin binomial con n y p = M/N. NOTA 4 La media (vase el numeral 3.35) de la distribucin hipergeomtrica es igual a (nM / N). La varianza (vase el numeral 3.36) de la distribucin hipergeomtrica es igual a
n M M N n 1 n N N 1

3.49 Distribucin binomial negativa (Negative Binomial Distribution), Distribucin discreta (vase el numeral 3.22) que tiene una funcin de masa de probabilidad (vase el numeral 3.24).
(c + x 1)! c p (1 p ) x x! (c 1)!

P (X = x) =

en donde
x

0, 1, 2, ..., n con el parmetro c > 0 y el parmetro p que satisfacen 0 < p < 1.

NOTA 1 Si c = 1, la distribucin binomial negativa se conoce como la distribucin geomtrica y describe la probabilidad (vase el numeral 3.5) de que el primer incidente del evento (vase el numeral 3.2) cuya probabilidad es p, ocurrir en la prueba (x + 1). NOTA 2 La funcin de masa de probabilidad tambin se puede escribir de la manera equivalente siguiente:
P(X = x) =

( )p
c x

(1 p ) x

El trmino "distribucin binomial negativa" surge de esta manera de escribir la funcin de masa de probabilidad. 37

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 3 La versin de la funcin de masa de probabilidad dada en la definicin se denomina a menudo "distribucin de Pascal" siempre y cuando c sea un entero mayor o igual a 1. En este caso, la funcin de masa de probabilidad describe la probabilidad de que el incidente csimo del evento (vase el numeral 3.2), cuya probabilidad (vase el numeral 3.5) es p, ocurra en la prueba (c + x). NOTA 4 La media (vase el numeral 3.35) de la distribucin binomial negativa es (cp) / (1 - p). La varianza (vase el numeral 3.36) de la distribucin binomial negativa es (cp)/(1 - p)2.

3.50 Distribucin normal, distribucin Gaussiana (Normal Distribution, Gaussian Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x) =

e-

( x )2

2 2

en donde - < x < y con los parmetros - < < y > 0. NOTA 1 La distribucin normal es una de las distribuciones de probabilidad ms ampliamente usadas (vase el numeral 3.11) en estadstica aplicada. Debido a la forma de la funcin de densidad, se denomina informalmente como curva "en forma de campana". Adems de servir como modelo para fenmenos aleatorios, surge como la distribucin lmite de los promedios (vase el numeral 2.15). Como distribucin de referencia en estadstica, es se ampliamente para evaluar la excepcionalidad de los resultados experimentales. NOTA 2 El parmetro de localizacin es la media (vase el numeral 3.35) y el parmetro de la escala es la desviacin estndar (vase el numeral 3.37) de la distribucin normal.

3.51 Distribucin normal estandarizada, distribucin Gaussiana estandarizada (Standardized Normal Distribution, Standardized Gaussian Distribution). Distribucin normal (vase el numeral 3.50) con = 0 y = 1.
NOTA La funcin de densidad de probabilidad (vase el numeral 3.26) de la distribucin normal estandarizada es:

f (x) =

1 2

e-x

/2

en donde - < x < . Las tablas de la distribucin normal involucran esta funcin de densidad de probabilidad, dando por ejemplo, el rea bajo f para los valores en (-, ).

3.52 Distribucin lognormal (Lognormal Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x) = 1 x 2
e
(ln x )2 / 2 2

en donde
x > 0 y con los parmetros - < < y > 0.

NOTA 1 Si Y tiene una distribucin normal (vase el numeral 3.50) con una media (vase el numeral 3.35) y una desviacin estndar (vase el numeral 3.37) , entonces la transformacin dada por X = exp (Y) tiene la funcin de densidad de probabilidad dada en la definicin. Si X tiene una distribucin lognormal con la funcin de densidad como se da en la definicin, entonces ln(X) tiene una distribucin normal con una media y una desviacin estndar . NOTA 2 La media de la distribucin lognormal es exp [ + (2) / 2] y la varianza es exp(2 + 2) x [exp(2) -1]. Esto indica que la media y la varianza de la distribucin lognormal son funciones de los parmetros y 2.

38

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

NOTA 3 La distribucin lognormal y la distribucin de Weibull (vase el numeral 3.63) se usan comnmente en aplicaciones de confiabilidad.

3.53 Distribucin t, distribucin de Student (t Distribution, Students Distribution). Distribucin continua (vase el numeral 3.23) que tiene una funcin de densidad de probabilidad (vase el numeral 3.26).
f (t ) = [(v + 1) / 2]] t2 1 + v v( v / 2 )
( v + 1) / 2

en donde - < t < y con el parmetro con un entero positivo. NOTA 1 La distribucin t se usa ampliamente en la prctica para evaluar la media de la muestra (vase el numeral 2.15) en el caso comn en que la desviacin estndar de la poblacin se estima a partir de los datos. La funcin estadstica t se puede comparar con la distribucin t con n - 1 grados de libertad para evaluar una media especificada como una descripcin de la media verdadera de la poblacin. NOTA 2 La distribucin t surge como la distribucin del cociente de dos variables aleatorias independientes (vase el numeral 3.10), cuyo numerador tiene una distribucin normal estandarizada (vase el numeral 3.51) y el denominador est distribuido como la raz cuadrada positiva de una distribucin chi-cuadrado (vase el numeral 3.57) despus de dividir por sus grados de libertad. El parmetro se designa como los grados de libertad (vase el numeral 3.54). NOTA 3 La funcin gama es como se define en el numeral 3.56.

3.54 Grados de libertad, (Degrees of Freedom, ). Nmero de trminos en una suma, menos el nmero de limitaciones sobre los trminos de la suma.
NOTA Este concepto se encontr previamente en el contexto de uso de n - 1 en el denominador del estimador (vase el numeral 2.12) de la varianza de la muestra (vase el numeral 2.16). El nmero de grados de libertad se usa para modificar parmetros. El trmino grados de libertad tambin se usa ampliamente en la NTC 2062-3 (ISO 3534-3), en donde los cuadrados medios se dan como sumas de los cuadrados divididos por los grados de libertad apropiados.

3.55 Distribucin F (F Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x) = [(v1 + v2 ) / 2] (v1 )v1 / 2 (v2 ) (v1 / 2 ) (v2 / 2 )
v2 / 2

x ( 1 / 2 )1 (v1 x + v2 )
( v1 + v 2 ) / 2

en donde
x>0

1 y 2 son enteros positivos


es la funcin gama definida en el numeral 3.56.
NOTA 1 La distribucin F es una distribucin de referencia til para la evaluacin de la relacin de dos varianzas independientes (vase el numeral 3.36). NOTA 2 La distribucin F surge como la distribucin del cociente de dos variables aleatorias independientes, cada una con una distribucin de chi-cuadrado (vase el numeral 3.57), dividido por sus grados de libertad (vase el numeral 3.54). El parmetro 1 es el numerador para grados de libertad y 2 es el denominador para grados de libertad de la distribucin F.

3.56 Distribucin gama (Gamma Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26). 39

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


f ( x) = x 1 e
x /

( )

en donde
x > 0 y los parmetros > 0, > 0

NOTA 1 La distribucin gama se usa en aplicaciones de confiabilidad para modelado de tiempo de falla. Incluye la distribucin exponencial (vase el numeral 3.58) como un caso especial, al igual que otros casos con tasas de falla que se incrementan con el tiempo. NOTA 2 La funcin gama se define por:
0

( ) =
Para valores enteros de , ( ) = ( 1)!

x 1e x dx

NOTA 3 La media (vase el numeral 3.35) de la distribucin gama es . La varianza (vase el numeral 3.36) de la distribucin gama es 2.

3.57 Distribucin chi-cuadrado, distribucin 2 (Chi-Squared Distribution, 2 Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
v 1 x 2 e x / 2

f ( x) =
en donde

2 v / 2 ( v / 2 )

x > 0 y con > 0


NOTA 1 Para datos que surgen de una distribucin normal (vase el numeral 3.50) con una desviacin estndar conocida (vase el numeral 3.37) , la funcin estadstica nS2 / 2 tiene una distribucin chi-cuadrado con n - 1 grados de libertad. Este resultado es la base para obtener intervalos de confianza de 2. Otra rea de aplicacin para la distribucin chi-cuadrado es como referencia para las pruebas de conveniencia a una distribucin. NOTA 2 Esta distribucin es un caso especial de la distribucin gama (vase el numeral 3.56) con parmetros = v/2 y = 2. El parmetro se refiere a los grados de libertad (vase el numeral 3.54). NOTA 3 La media (vase el numeral 3.35) de la distribucin chi-cuadrado es . La varianza (vase el numeral 3.36) de la distribucin chi-cuadrado es 2 .

3.58 Distribucin exponencial (Exponential Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x ) = 1 e x /

en donde
x > 0 y con parmetro > 0

NOTA 1 La distribucin exponencial brinda una lnea de referencia en aplicaciones de confiabilidad, correspondiente al caso de "falta de envejecimiento" o propiedad sin memoria. NOTA 2 La distribucin exponencial es un caso especial de la distribucin gama (vase el numeral 3.56) con = 1 en forma equivalente, la distribucin chi-cuadrado (vase el numeral 3.57) con = 2. NOTA 3 La media (vase el numeral 3.35) de la distribucin exponencial es . La varianza (vase el numeral 3.36) de

40

NORMA TCNICA COLOMBIANA


la distribucin exponencial es 2.

NTC 2062-1 (Segunda actualizacin)

3.59 Distribucin beta (Beta Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x) =
en donde 0 x 1 y con los parmetros , , > 0. NOTA La distribucin beta es considerablemente flexible, tiene una funcin de densidad de probabilidad con una variedad de formas (unimodal, en forma de "j", en forma de "u"). La distribucin se puede usar como un modelo de la incertidumbre asociada con una proporcin. Por ejemplo, en una aplicacin de modelado de un seguro contra huracanes, la proporcin esperada de dao en un tipo de estructura para una velocidad del viento dada podra ser 0,40, aunque no todas las casas que experimentan este viento sufrirn el mismo dao. Una distribucin beta con una media de 0,40 puede servir para modelar la disparidad en el dao a este tipo de estructura.

( + ) 1 x (1 x ) 1 ( ) ( )

3.60 Distribucin uniforme, distribucin rectangular (Uniform Distribution), (Rectangular Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x) = 1 ba

en donde
axb

NOTA 1 La distribucin uniforme con a = 0 y b = 1 es la distribucin subyacente para los generadores de nmeros aleatorios tpicos. NOTA 2 La media (vase el numeral 3.35) de la distribucin uniforme es (a + b)/2. La varianza (vase el numeral 3.36) de la distribucin uniforme es (b - a)2/12. NOTA 3 La distribucin uniforme es un caso especial de la distribucin beta con = 1 y = 1.

3.61 Distribucin de valores extremos Tipo I, Distribucin de Gumbel (Type I Extreme Value Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de distribucin (vase el numeral 3.7).

F ( x) = e
en donde - < x < con parmetros - < a < , b > 0

e ( xa ) / b

NOTA Las distribuciones de valores extremos proporcionan distribuciones de referencia apropiadas para los extremos de las funciones estadsticas de orden (vase el numeral 2.9) X(1) y X(n). Las tres distribuciones lmites posibles cuando n tiende a son suministradas por los tres tipos de distribuciones de valores extremos dados en los numerales 3.61, 3.62 y 3.63.

3.62 Distribucin de valores extremos Tipo II, Distribucin de Frchet (Type II Extreme Value Distribution, Frchet Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de distribucin (vase el numeral 3.7).
k x a b

F ( x) = e

41

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

en donde
x > a y con parmetros - < a < , b > 0, k > 0

3.63 Distribucin de valores extremos tipo III, Distribucin de Weibull. (Type II Extreme Value Distribution, Weibull Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de distribucin (vase el numeral 3.7).
xa b
k

F ( x) =1 e

en donde

x > a con parmetros - < a < , b > 0, k > 0


NOTA 1 Adems de funcionar como una de las tres distribuciones lmites posibles de las funciones estadsticas de orden extremo, la distribucin de Weibull ocupa un lugar destacado en diversas aplicaciones, particularmente confiabilidad e ingeniera. Se ha demostrado que la distribucin de Weibull proporciona ajustes empricos a una variedad de conjuntos de datos. NOTA 2 El parmetro a es un parmetro de posicin en el sentido de que es el valor mnimo que puede lograr la distribucin de Weibull. El parmetro b es un parmetro de escala [relacionado con la desviacin estndar (vase el numeral 3.37) de la distribucin de Weibull]. El parmetro k es un parmetro de forma. NOTA 3 Para k = 1, se considera que la distribucin Weibull incluye la distribucin exponencial. Elevar una distribucin exponencial con a = 0 y el parmetro b a la potencia 1/k produce la distribucin Weibull de la definicin. Otro caso especial es la distribucin Rayleigh (para a = 0 y k = 2).

3.64 Distribucin normal de mltiples variables (Multivariate Normal Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26).
f ( x ) = ( 2 ) / 2
en donde - < xi < para cada i.
n / 2
( x ) T 1 ( x ) 2

s un vector de parmetro con n dimensiones. es una n x n matriz simtrica definida positiva de parmetros, y

La negrilla indica los vectores con dimensin n.


NOTA Cada una de las distribuciones marginales (vase el numeral 3.18) de la distribucin con mltiples variables de este numeral tiene una distribucin normal. Sin embargo, hay muchas otras distribuciones con mltiples variables que tienen distribuciones marginales normales adems de la versin de la distribucin dada en este numeral.

3.65 Distribucin normal con dos variables (Bivariate Normal Distribution). Distribucin continua (vase el numeral 3.23) que tiene la funcin de densidad de probabilidad (vase el numeral 3.26)
f ( x, y ) = 1 2 x y 1 2 1 x x exp 2 x 2(1 ) x x 2 x
2

y y y

y y + y

en donde

42

NORMA TCNICA COLOMBIANA


< x < , < y < < x < , < y < ,

NTC 2062-1 (Segunda actualizacin)

x > 0 y > 0 <1


NOTA Como lo sugiere la notacin, para (X, Y) que tiene la anterior funcin de densidad de probabilidad (vase el numeral 3.26), E(X) = x, E(Y) = y, V(X) = x2, V(Y) = y2, y es el coeficiente de correlacin (vase el numeral 3.44) entre X y Y.

3.66 Distribucin normal estandarizada con dos variables (Standardized Bivariate Normal Distribution). Distribucin normal con dos variables (vase el numeral 3.65) que tiene componentes de una distribucin normal estandarizada (vase el numeral 3.51). 3.67 Distribucin de muestreo (Sampling Distribution). Distribucin de una funcin estadstica.
NOTA Las ilustraciones de las distribuciones de muestreo especficas se dan en la Nota 2 del numeral 3.53, la Nota 1 del numeral 3.55 y la Nota 1 del numeral 3.57.

3.68 Espacio de probabilidad (Probability Space) (,,). Espacio muestral (vase el numeral 3.1), una suma algebrica de eventos (vase el numeral 3.69) asociados, y una medida de probabilidad (vase el numeral 3.70).
EJEMPLO 1 Como un caso simple, el espacio muestral puede estar compuesto por todos los 105 elementos fabricados un da especfico en una planta. La suma algebrica de eventos consta de todos los posibles subconjuntos. Estos eventos incluyen {ningn elemento}, {elemento 1}, {elemento 2}, ... {elemento 105}, {elemento 1 y 2}. ... {todos los 105 elementos}. Una medida de probabilidad posible se puede definir como el nmero de elementos en un evento, dividido por el nmero total de elementos fabricados. Por ejemplo, el evento {elemento 4, elemento 27, elemento 92} tiene una medida de probabilidad de 3/105. EJEMPLO 2 Como segundo ejemplo, considere la duracin de las bateras. Si las bateras llegan a las manos del cliente y no tienen potencia, su tiempo de vida es 0 h. Si las bateras son funcionales, sus tiempos de supervivencia siguen alguna distribucin de probabilidad (vase el numeral 3.11), tal como una exponencial (vase el numeral 3.58). El conjunto de los tiempos de vida es entonces gobernado por una distribucin que es una mezcla entre discreta (la proporcin de bateras que no son funcionales al inicio) y continua (un tiempo de vida real). Para simplificar el ejemplo, se supone que la duracin de las bateras es relativamente corta, en comparacin con el tiempo de estudio, y que todos los tiempos de vida se miden en continuo. Por supuesto, en la prctica existe la posibilidad de tiempos de vida truncados a la izquierda o a la derecha (por ejemplo, se sabe que el tiempo de falla es al menos de 5 h, o que el tiempo de falla est entre 3 h y 3,5 h), en cuyo caso surgiran ventajas adicionales de esta estructura. El espacio muestral comprende la mitad de la lnea real (nmeros reales mayores o iguales a cero). La suma algebrica de eventos incluye todos los intervalos de la forma [0,x] y el conjunto {0}. Adicionalmente, La suma algebrica incluye todas las uniones e intersecciones contables de estos conjuntos. La medida de probabilidad involucra determinar, para cada conjunto, sus componentes que representan bateras no funcionales y las que tienen un tiempo de vida positivo. En donde es apropiado, en este numeral se presentan detalles de los clculos asociados con los tiempos de falla.

3.69 Suma algebrica de eventos, - algebrica, campo de suma, campo-. (Sigma Algebra of Events, -Algebra, Sigma Field, -Field). Conjunto de eventos (vase el numeral 3.2) con las propiedades: a) Pertenece a ;

43

NORMA TCNICA COLOMBIANA


b) c)

NTC 2062-1 (Segunda actualizacin)

Si un evento pertenece a , entonces su evento complementario (vase el numeral 3.3) tambin pertenece a . Si {Ai} es un conjunto de eventos en , entonces la unin
i =1

i =1

Ai ,

y la interseccin

Ai

del evento pertenece a

EJEMPLO 1 Si el espacio muestral es el conjunto de enteros, entonces se puede escoger una suma algebrica de eventos, como el conjunto de todos los subconjuntos de los enteros. EJEMPLO 2 Si el espacio muestral es el conjunto de los nmeros reales, entonces se puede escoger una suma algebrica de eventos que incluya todos los conjuntos correspondientes a intervalos en la lnea real, y todas sus uniones finitas y contables y las intersecciones de estos intervalos. Este ejemplo se puede extender a dimensiones ms grandes, considerando intervalos k dimensionales. En particular, en dos dimensiones, el conjunto de intervalos puede estar compuesto de regiones definidas por {(x,y): x < s, y < t} para todos los valores de s y t. NOTA 1 Una suma algebrica es un conjunto compuesto de conjuntos de sus miembros. El conjunto de todos los posibles resultados es un miembro de la suma algebrica de eventos, como se indica en la propiedad a). NOTA 2 La propiedad c) involucra las operaciones definidas sobre un conjunto de subconjuntos (posiblemente infinito en forma contable) de la suma algebrica de eventos. La notacin dada indica que todas las uniones e intersecciones contables de estos conjuntos tambin pertenecen a la suma algebrica de eventos. NOTA 3 La propiedad c) incluye el cerramiento (los conjuntos pertenecen a una suma algebrica de eventos) bajo uniones o intersecciones finitas. El calificativo suma se usa para hacer nfasis en que A est cerrado incluso bajo operaciones infinitas en forma contable, en conjuntos.

3.70 Medida de probabilidad, (Probability Measure, ). Funcin no negativa definida en la suma algebrica de eventos (vase el numeral 3.69) tal que: a)
() = 1

en donde designa el espacio muestral (vase el numeral 3.1). b)


(

i =1

Ai ) =

i =1

( Ai )

en donde {A i} es una secuencia de eventos divididos por pares (vase el numeral 3.2).
EJEMPLO Continuando con el ejemplo de la vida de las bateras del numeral 3.1, considere el evento de que la batera sobrevive menos de una hora. Este evento consta del par disjunto de eventos {no funciona} y {funciona menos de una hora pero funciona inicialmente}. En forma equivalente, los eventos se pueden designar {0} y (0,1). La medida de probabilidad de {0} es la proporcin de las bateras que no funcionan en el primer intento. La medida de probabilidad del conjunto (0,1) depende de la distribucin de probabilidad continua especfica [por ejemplo, exponencial (vase el numeral 3.58)] que rige la distribucin de fallas. NOTA 1 Una medida de probabilidad asigna un valor de [0,1] para cada evento en la suma algebrica l de eventos. El valor 0 corresponde a un evento que es imposible, mientras que el valor 1 representa certeza de que ocurre. En particular, la medida de probabilidad asignada con el conjunto es cero y la medida de probabilidad asignada al espacio muestral es 1. NOTA 2 La propiedad b) indica que si una secuencia de eventos no tiene elementos en comn cuando se considera por pares, la medida de probabilidad de la unin es la suma de las medidas de probabilidad individuales. Como se indic en la propiedad b), se aplica si el nmero de eventos es infinito en forma contable. NOTA 3 Los tres componentes de la probabilidad se vinculan eficazmente por medio de variables aleatorias. Las probabilidades (vase el numeral 3.5) de los eventos en el conjunto de imgenes de la variable aleatoria (vase el numeral 3.10) se deducen de las probabilidades de eventos en el espacio de la muestra. Un evento en el conjunto de imgenes de la variable aleatoria es asignado a la probabilidad del evento en el espacio muestral que se aplica a la variable aleatoria. NOTA 4 El conjunto de imgenes de la variable aleatoria es el conjunto de nmeros reales o el conjunto de n-uplas ordenadas de nmeros reales (observe que el conjunto de imgenes es el conjunto en el cual se aplica la variable aleatoria).

44

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


ANEXO A (Informativo) SMBOLOS

Smbolos A AC

, , , , , , ,
p, N, M, c, v, a, b, k

Trmino en espaol Evento Evento complementario Suma algebrica de eventos, algebrica, campo de suma, Campo-

Nivel de significacin Parmetro

Trmino en ingls Event Complementary event - Sigma Algebra of Events, Algebra, Sigma Field -Field Significance Level Parameter

Numeral 3.2 3.3 3.69

2.45

2
E(Xk) E[g(X)] F(x) f(x) 1 H Ho HA, H1 k k, r, s

v n (, , ) P(A) P(A|B) rxy s


S S2 SXY

2 XY X

Coeficiente de curtosis 3.40 Coefficient of Kurtosis Momento de muestra de orden k Sample Moment of Order k 2.14 Valor esperado de la funcin g de una Expectation of the Function g of a 3.12 variable aleatoria X Random Variable X Funcin de distribucin 3.7 Distribution Function Funcin de densidad de probabilidad 3.26 Probability Density Function Coeficiente de asimetra 3.39 Coefficient of Skewness Hiptesis 2.40 Hypothesis Hiptesis nula 2.41 Null Hypothesis Hiptesis alternativa 2.42 Alternative Hypothesis Dimensin Dimension Orden de un momento 2.14, 3.34, Order of a Moment 3.41, 3.42 Media 3.35 Mean Grados de libertad 3.54 Degrees of Freedom Tamao de la muestra Sample Size Espacio muestral 3.1 Sample Space Espacio de probabilidad 3.68 Probability Space Probability of an Event A Probabilidad de un evento A 3.5 Conditional Probability of A given B Probabilidad condicional de A dado B 3.6 Medida de probabilidad 3.70 Probability Measure Coeficiente de correlacin de la muestra 3.23 Sample Correlation Coefficient Valor observado de una desviacin Observed Value of a Sample estndar de la muestra Standard Deviation Desviacin estndar de la muestra 2.17 Sample Standard Deviation Varianza de la muestra 2.16 Sample Variance Covarianza de la muestra 2.22 Sample Covariance Desviacin estndar 3.37 Sample Deviation Varianza 3.36 Variance Covarianza 3.43 Covariance Error estndar 2.24 Standard Error Error estndar de la media de la muestra Standard Error of the Sample Mean Parmetro de una distribucin Parameter of a Distribution Estimador Varianza de una variable aleatoria X isima funcin estadstica de orden Valor observado Variable aleatoria p-cuantila p-fractila Promedio, media de la muestra
Estimator Variance of a Random Variable X ith Order Statistic Observed Value Random Variable p-Quantile p-Fractile Average, Sample Mean

V(X) X(i) x, y, z X, Y, Z, T Xp, xp

2.12 3.36 2.9 2.4 3.10 3.13 2.15

X, x

45

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


ANEXO B (Informativo)

DIAGRAMAS DE CONCEPTOS ESTADSTICOS


Poblacin (2.1)

Muestra (2.3) Unidad de muestreo (2.2) Funcin de distribucin (3.7)

Valor observado (2.4)

Muestra aleatoria (2.6)

...

Rango de la muestra (3.10) Estadstica (2.8) Estadstica de una prueba (2.52)

Estadstica descriptiva (2.5)

Muestra aleatoria simple (2.7)

Estadstica de orden (2.9)

...

Estimador (2.12) Mediana de la muestra (2.13)

Estadstica de orden extremo

Rango de la muestra (2.10)

Rango medio (2.11)

Figura B.1. Conceptos bsicos sobre poblacin y muestra

46

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Muestra aleatoria simple (2.7)

Momento de la muestra de orden k (2.14)

Media de la muestra (2.15)

...

Coeficiente de variacin de la muestra (2.18)

Varianza de la muestra (2.16)

Coeficiente de asimetra de la muestra (2.20)

Coeficiente de curtosis de la muestra (2.21)

Coeficiente de correlacin de la muestra (2.23)

Desviacin estandar de la muestra (2.17)

Covarianza de la muestra (2.22)

Variable aleatoria normalizada de la muestra (2.19)

Figura B.2. Conceptos acerca de momentos de la muestra

47

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Error estndar (2.24)

Estimador (2.12) ... ...

Estimacin (2.36)

...

Estimador por intervalos (2.25)

Estimado (2.31)

Error de estimacin (2.32)

Estimador del mximo de verosimilitud (2.35)

Estimacin del mximo de verosimilitud (2.37)

Intervalo de prediccin (2.30) Parmetro (3.9)

Sesgo (2.33)

Estimador sin sesgo (2.34) Funcin de verosimilitud (2.36)

Intervalo de confianza (2.28)

Intervalo estadstico de tolerancia (2.26)

Funcin de densidad de probabilidad (3.26) ...

Familia de distribuciones (3.8)

Funcin de verosimilitud parcial (2.39)

Intervalo de confianza unilateral (2.29)

Funcin de masa de probalidad (3.24)

Lmite estadstico de tolerancia (2.27)

Figura B.3. Conceptos de estimacin

48

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Estadstico de prueba (2.52)

Prueba estadstica (2.48)

Hiptesis (2.40) Valor-p (2.49)

Hiptesis nula (2.41)

Hiptesis alternativa (2.42)

Hiptesis simple (2.43)

Hiptesis compuesta (2.44)

Nivel de significacin (2.45)

Error tipo I (2.46)

Prueba estadstica (2.48)

Error tipo II (2.47)

Potencia de una prueba (2.50) Curva de Potencia (2.51)

Familia de distribuciones (3.8)

Figura B.4. Conceptos acerca de pruebas estadsticas

49

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Estadstica descriptiva (2.5) ...

Funcin estadstica descriptiva (2.53)

Funcin estadstica descriptiva numrica (2.54)

Valor observado (2.4)

Clase (2.55)

Frecuencia (2.59)

Lmites de clase (2.56)

Punto medio de la clase (2.57)

Ancho de la clase (2.58)

Distribucin de frecuencia (2.60) Frecuencia acumulativa (2.63)

Frecuencia relativa (2.64)

(Representacin de una distribucin de frecuencia)

Frecuencia relativa acumulativa (2.65)

Histograma (2.61)

Grfico de barras (2.62)

Figura B.5. Conceptos acerca de clases y distribuciones empricas

50

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

(Poblacin finita) (Modelo estadstico) (Poblacin infinita) Poblacin (2.1)

(Poblacin hipottica) Muestra (2.3)

Variable aleatoria (3.10)

Parmetro (3.9)

Valor observado (2.4)

(Funcin estadstica inferencial)

Estimacin (2.36)

(Prediccin)

Prueba estadstica (2.48)

Figura B.6. Diagrama de conceptos de inferencia estadstica

51

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


ANEXO C (Informativo)

DIAGRAMA DE CONCEPTOS DE PROBABILIDAD


Espacio de probabilidad (, ,) (3.68)

Valor esperado (3.12) Espacio muestral, (3.61) Suma algebrica de eventos, (3.69) Medida de probabilidad, (3.70)

Evento complementario (3.3)

Evento (3.2)

Probabilidad (3.6)

Probabilidad condicional de A dado B (3.6)

Familia de distribuciones (3.8) Parmetro (3.9)

Evento independiente (3.4)

( , x )

Funcin de distribucin (3.7) Distribucin de probabilidad (3.11) Variable aleatoria (3.10)

Cuartila-p (3.13)

...

Mediana (3.14)

Cuartila (3.15)

Figura C.1. Conceptos fundamentales en probabilidad

52

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Distribucin de probabilidad (3.11)

Variable aleatoria (3.10) ...

Valor esperado (3.12)

...

... Variable aleatoria discreta (3.28) Variable aleatoria continua (3.29) Momento combinado de las rdenes r y s (3.41)

Distribucin de probalidad centrada (3.30)

Variable aleatoria centrada (3.31)

Momento de orden r (3.34) ... Momento central combinado de ordenes r y s (3.42)

...

... Media (3.35)

...

Covarianza (3.43)

Distribucin de probabilidad normalizada (3.32)

Variable aleatoria normalizada (3.33)

Coeficiente de Coeficiente de Varianza (3.36) asimetra (3.39) variacin (3.38)

Coeficiente de curtosis (3.40)

Error estndar (2.24) Desviacin estandar (3.37) Coeficiente de correlacin (3.44)

Figura C.2. Conceptos acerca de momentos

53

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Distribucin de probabilidad (3.11)

Distribucin de probabilidad con una variable (3.16)

Distribucin de probabilidad con mltiples variables (3.17)

Funcin de masa de probabilidad (3.24)

Distribucin de probabilidad discreta (3.22)

Distribucin de probabilidad continua (3.24)

Funcin de densidad de probabilidad (3.26)

... Modo de funcin de masa de probabilidad (3.25) Modo de funcin de densidad de probabilidad (3.27)

Distribucin de probabilidad marginal (3.18)

Distribucin de probabilidad condicional (3.19)

Distribucin multinominal (3.45)

Distribucin de Poisson (3.47)

Distribucin hipergeomtrica (3.48)

Distribucin binomial negativa (3.49)

Curva de regresin (3.20)

Superficie de regresin (3.21)

...

Distribucin de probabilidad con mltiples variables (3.17)

Distribucin binominal (3.46)

Distribucin de probabilidad con una variable (3.16)

Figura C.3. Conceptos acerca de las distribuciones de probabilidad

54

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

Distribucin de probabilidad continua (2.23)

...

Distribucin lognormal (3.52)

Distribucin normal (3.50)

Distribucin t Distribucin F (3.53) (3.55)

...

Grados de libertad (3.54) Distribucin gama (3.56) ... ... ... ... Distribucin beta (3.59) (Distribucin de valores extremos) Distribucin normal con mltiples variables (3.64)

Distribucin normal estandarizada (3.51)

Distribucin Chi-cuadrado (3.57)

Distribucin exponencial (3.58)

Distribucin uniforme (3.60)

Distribucin normal con dos variables (3.65)

...

Distribucin normal estandarizada con dos variables (3.66)

Distribucin de valores extremos tipo I (3.61)

Distribucin de valores extremos tipo II (3.62)

Distribucin de valores extremos tipo III (3.63)

Figura C.4. Conceptos acerca de distribuciones continuas

55

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


ANEXO D (Informativo)

METODOLOGA USADA EN EL DESARROLLO DEL VOCABULARIO

D.1

INTRODUCCIN

La aplicacin universal de la familia de normas ISO requiere el empleo de un vocabulario coherente y armonizado que sea fcilmente comprensible por usuarios potenciales de normas de estadstica aplicada. Los conceptos son interrelacionados. El anlisis de estas relaciones entre conceptos dentro del campo de la estadstica aplicada y su ordenamiento en diagramas de conceptos es prerrequisito para un vocabulario coherente. Este anlisis se utiliz en el desarrollo de esta norma. Ya que los diagramas de conceptos empleados durante el proceso de desarrollo pueden ser tiles en un sentido informativo, se reproducen en el literal D.4. D.2 CONTENIDO DE UNA ENTRADA DE VOCABULARIO Y REGLA DE SUSTITUCIN

El concepto forma la unidad de transferencia entre idiomas (incluidas las variantes dentro de una lengua, por ejemplo, ingls americano e ingls britnico). Para cada idioma se escoge el trmino ms apropiado para representar el concepto en esa lengua, es decir, es un enfoque no literal de la traduccin. Una definicin se hace describiendo nicamente aquellas caractersticas que son esenciales para identificar el concepto. La informacin concerniente al concepto, que es importante pero no esencial para su descripcin, se coloca en una o ms notas de la definicin. Cuando un trmino se reemplaza por su definicin, sujeto a cambios menores en la sintaxis, no debera haber cambio en el significado del texto. Esta sustitucin es un mtodo sencillo para verificar la exactitud de una definicin. Sin embargo, en donde la definicin es compleja, en el sentido de que contiene varios trminos, la mejor forma de hacer la sustitucin es tomar una a la vez, o mximo dos definiciones. La sustitucin completa de la totalidad de los trminos es difcil de lograr sintcticamente y no tendr utilidad para transmitir significado. D.3 RELACIONES ENTRE CONCEPTOS Y SU REPRESENTACIN GRFICA

D.3.1 Generalidades En el trabajo terminolgico, las relaciones entre los conceptos se basan en la formacin jerrquica de las caractersticas de una especie, de manera que la descripcin ms econmica de un concepto se forma nombrando sus especies y describiendo las caractersticas que las distinguen de sus conceptos matriz o asociados. Existen tres formas principales de relaciones de conceptos indicadas en este anexo: genricas (vase el literal D.3.2), partitivas (vase el literal D.3.3) y asociativas (vase el literal D.3.4). D.3.2 Relacin genrica Los conceptos subordinados dentro de la jerarqua heredan todas las caractersticas del concepto de rango superior y contienen descripciones de estas caractersticas que las diferencian de los conceptos de rango superior e igual, por ejemplo, la relacin entre la 56

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)

primavera, verano, otoo e invierno, con la estacin. Las relaciones genricas se describen mediante un esquema o diagrama de rbol sin flechas (vase la Figura D.1).
Estacin

Primavera

Verano

Otoo

Invierno

Figura D.1. Representacin grfica de una relacin genrica

D.3.3 Relaciones partitivas Conceptos subordinados dentro de la jerarqua de las partes componentes del concepto de rango superior, por ejemplo, primavera, verano, otoo e invierno se pueden definir como partes del concepto ao. En comparacin, es inapropiado definir un clima soleado (una posible caracterstica del verano) como parte de un ao. Las relaciones partitivas se representan mediante un esquema sin flechas (vase la Figura D.2). Las partes simples se representan mediante una lnea, y las mltiples mediante dos lneas.
Ao

Primavera

Verano

Otoo

Invierno

Figura D.2. Representacin grfica de una relacin partitiva

D.3.4 Relacin asociativa Las relaciones asociativas no pueden abreviar la descripcin, como se presenta en las relaciones genricas y partitivas, pero son tiles para identificar la naturaleza de la relacin entre conceptos dentro de un sistema de conceptos, por ejemplo, causa y efecto, actividad y ubicacin, actividad y resultado, herramienta y funcin, material y producto. Las relaciones asociativas se describen por flechas en dos sentidos (vase la Figura D.3).

Soleado

Verano

Figura D.3. Representacin grfica de una relacin asociativa

57

NORMA TCNICA COLOMBIANA


D.4 DIAGRAMAS DE CONCEPTOS

NTC 2062-1 (Segunda actualizacin)

Las Figuras B.1 a B.5 muestran los diagramas de conceptos en los que se basan las definiciones del numeral 1 de esta norma. La Figura B.6 es un diagrama de conceptos adicional que indica la relacin de algunos trminos que aparecen previamente en las Figuras B.1 a B.5. Las Figuras C.1 a C.4 muestran los diagramas de conceptos en los que se basan las definiciones del numeral 2 de esta norma. Existen varios trminos que aparecen en diagramas de conceptos mltiples que establecen un vnculo entre los diagramas. Estos trminos se indican de la siguiente manera:
Figura B.1 Conceptos bsicos sobre poblacin y muestras Estadstica descriptiva (vase el numeral 2.5) Muestra aleatoria simple (vase el numeral 2.7) Estimador (Vase la el numeral 2.12) Vase la Figura B.5 Vase la Figura B.2 Vase la Figura B.3

Estadstico de prueba, estadstico de contraste (Vase el Vase la Figura B.4 numeral 2.52) Vase la Figura C.1, C.2 Variable aleatoria (vase el numeral 3.10) Vase la Figura C.1 Funcin de distribucin (vase el numeral 3.7) Figura B.2 Conceptos acerca de momentos de la muestra (vase el numeral 2.7) Muestra aleatoria simple (vase el numeral 2.7) Figura B.3 Conceptos de estimacin: Estimador (vase el numeral 2.12) Parmetro (vase el numeral 3.9) Familia de distribuciones (vase el numeral 3.8) Funcin de densidad de probabilidad (vase el numeral 3.26) Funcin de masa de probabilidad (vase el numeral 3.24) Figura B.4. Conceptos acerca de pruebas estadsticas Estadstico de prueba, estadstico de contraste (vase el Vase la Figura B.1 numeral 2.52) Funcin de densidad de probabilidad (vase el numeral 3.26) Funcin de masa de probabilidad (vase el numeral 3.24) Familia de distribuciones (vase el numeral 3.8) Vase la Figura B.3, C.3 Vase la Figura B.3, C.3 Vase la Figura B.3, C.1 Vase la Figura B.1 Vase la Figura C.1 Vase la Figura B.4, C.1 Vase la Figura C.3 Vase la Figura C 3 Vase la Figura B.1

Figura B.5. Conceptos acerca de clases y distribuciones empricas Estadstica descriptiva (2.5) Figura 6. Diagrama de conceptos de inferencia estadstica Poblacin (vase el numeral 2.1) Muestra (vase el numeral 2.3) Valor observado (vase el numeral 2.4) Vase la Figura B.1 Vase la Figura B.1 Vase la Figura B.1, B.5 Contina Vase la Figura B.1

58

NORMA TCNICA COLOMBIANA

NTC 2062-1 (Segunda actualizacin)


(Final)

Figura 6. Diagrama de conceptos de inferencia estadstica Estimacin (vase el numeral 2.36) Prueba estadstica (vase el numeral 2.48) Parmetro (vase el numeral 3.9) Variable aleatoria (vase el numeral 3.10) Figura C.1 Conceptos fundamentales en probabilidad Variable aleatoria (vase el numeral 3.10) Distribucin de probabilidad (vase el numeral 3.11) Familia de distribuciones (vase el numeral 3.8) Funcin de distribucin (vase el numeral 3.7) Parmetro (vase el numeral 3.9) Figura C.2 Conceptos acerca de momentos Variable aleatoria (vase el numeral 3.10) Distribucin de probabilidad (vase el numeral 3.11) Vase la Figura B.1, C.1 Vase la Figura C.1, C.3 Vase la Figura B.1, C.2 Vase la Figura B.3 Vase la Figura B.4 Vase la Figura B.3, C.1 Vase la Figura B.1, C.1, C.2

Figura C.3 Conceptos acerca de las distribuciones de probabilidad Distribucin de probabilidad (vase el numeral 3.11) Funcin de masa de probabilidad (vase el numeral 3.24) Distribucin continua (vase el numeral 3.23) Distribucin con una variable (vase el numeral 3.16) Distribucin con mltiples variables (vase el numeral 3.17) Figura C.4. Conceptos acerca de distribuciones continuas Distribucin con una variable (vase el numeral 3.16) Distribucin con mltiples variables (vase el numeral 3.17) Distribucin continua (vase el numeral 3.23) Vase la Figura C.3 Vase la Figura C.3 Vase la Figura C.3 Vase la Figura C.2, C.3 Vase la Figura B.3, B.4 Vase la Figura C.4 Vase la Figura C.4 Vase la Figura C.4

Como Nota final a la Figura C.4, las siguientes distribuciones son ejemplos de distribuciones con una variable: normal, distribucin t, distribucin F, normal estandarizada, gama, beta, chi-cuadrado, exponencial, uniforme, valor extremo Tipo I, valor extremo Tipo II y valor extremo Tipo III. Las siguientes distribuciones son ejemplos de distribuciones con variables mltiples: normal con mltiples variables, normal con dos variables y normal estandarizada con dos variables. Al incluir la distribucin con una variable (vase el numeral 3.16) y la distribucin con mltiples variables (vase el numeral 3.17) se sobrecargara indebidamente la figura en el diagrama de conceptos.

59

NORMA TCNICA COLOMBIANA


DOCUMENTO DE REFERENCIA

NTC 2062-1 (Segunda actualizacin)

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Statistics - Vocabulary and Symbols. Part 1: General Statistic Terms and Terms Used in Probability. Genve: ISO, 2006, 103 p. (ISO 3534-1).

60

You might also like