You are on page 1of 11

Sustentando por:

Rey T. Meja R.
Matrcula:
2008-1797
Asignatura:
Probabilidad y Estadstica (MAT-252)
Tema:
Conceptos Generales de la Estadstica
Profesor:
Ral Santana
Santo Domingo, D.N
Enero 2016

Historia
Origen
El trmino alemn Statistik, introducido originalmente por Gottfried Achenwall en 1749, se refera al
anlisis de datos del Estado, es decir, la ciencia del Estado (o ms bien, de la ciudad-estado).
Tambin se llam aritmtica poltica de acuerdo con la traduccin literal del ingls. No fue hasta el
siglo XIX cuando el trmino estadstica adquiri el significado de recolectar y clasificar datos. Este
concepto fue introducido por el militar britnico sir John Sinclair (1754-1835).
En su origen, por tanto, la estadstica estuvo asociada a los Estados o ciudades libres, para ser utilizados
por el gobierno y cuerpos administrativos (a menudo centralizados). La coleccin de datos acerca de
estados y localidades contina ampliamente a travs de los servicios de estadstica nacionales e
internacionales. En particular, los censos comenzaron a suministrar informacin regular acerca de la
poblacin de cada pas. As pues, los datos estadsticos se referan originalmente a los datos
demogrficos de una ciudad o Estado determinados. Y es por ello que en la clasificacin decimal de
Melvil Dewey, empleada en las bibliotecas, todas las obras sobre estadstica se encuentran ubicadas al
lado de las obras de o sobre la demografa.
Ya se utilizaban representaciones grficas y otras medidas en pieles, rocas, palos de madera y paredes
de cuevas para controlar el nmero de personas, animales o ciertas mercancas. Hacia el ao 3000 a. C.
los babilonios usaban ya pequeos envases moldeados de arcilla para recopilar datos sobre la
produccin agrcola y de los gneros vendidos o cambiados. Los egipcios analizaban los datos de la
poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XI a. C. Los libros
bblicos de Nmeros y Crnicas incluyen en algunas partes trabajos de estadstica. El primero contiene
dos censos de la poblacin de la Tierra de Israel y el segundo describe el bienestar material de las
diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a.
C. Los antiguos griegos realizaban censos cuya informacin se utilizaba hacia el 594 a. C. para cobrar
impuestos.

Empleo de la estadstica en las Antiguas Civilizaciones


En la Edad Antigua la estadstica consista en elaborar censos (de poblacin y tierras). Su objetivo era
facilitar la gestin de las labores tributarias, obtener datos sobre el nmero de personas que podran
servir en el ejrcito o establecer repartos de tierras u otros bienes.
En Egipto: La estadstica comienza con la Dinasta I, en el ao 3050 a.C.. Los faraones ordenaban la
realizacin de censos con la finalidad de obtener los datos sobre tierras y riquezas para poder planificar
la construccin de las pirmides.
En China: Ao 2238 a.C. el emperador Yao elabora un censo general sobre la actividad agrcola,
industrial y comercial.
En la Antigua Grecia: Se realizaron censos para cuantificar la distribucin y posesin de la tierra y
otras riquezas, organizar el servicio militar y determinar el derecho al voto.
En la Antigua Roma: Durante el Imperio Romano se establecieron registros de nacimientos y
defunciones, y se elaboraron estudios sobre los ciudadanos, sus tierras y sus riquezas.
En Mxico: Ao 1116, durante la segunda migracin de las tribus chichimecas, el rey Xlotl orden
que fueran censados los sbditos.
En el Oriente Medio, bajo el dominio sumerio, Babilonia tena casi 6000 habitantes. Se encontraron en
ella tablillas de arcilla que registraban los negocios y asuntos legales de la ciudad.
El censo en el pueblo judo sirvi, adems de propsitos militares, para calcular el monto de los
ingresos del templo.
Durante la Edad Media la estadstica no present grandes avances, pero destaca el trabajo de Isidoro de
Sevilla, quien recopil y clasifico datos de diversa naturaleza cuyos resultados fueron publicados en la
obra Originum sive Etymologiarum.

En la Edad Moderna se contina con la obtencin de censos.


En Espaa: Destaca el censo de Pecheros (1528), el de los Obispos (1587), el Censo de los Millones
(1591) o el Censo del Conde de Aranda (1768).
En Inglaterra: la peste de la dcada de 1500 provoc un aumento en la contabilizacin de los datos
sobre defunciones y nacimientos.

Orgenes en probabilidad
Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la cual data desde la
correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer
tratamiento cientfico que se conoce a la materia. El Ars coniectandi (pstumo, 1713) de Jakob
Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una
rama de las matemticas.1 En la era moderna, el trabajo de Kolmogrov ha sido un pilar en la
formulacin del modelo fundamental de la Teora de Probabilidades, el cual es usado a travs de la
estadstica.
La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de Roger Cotes y al
trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la
teora de la discusin de errores de observacin. La reimpresin (1757) de este trabajo incluye el
axioma de que errores positivos y negativos son igualmente probables y que hay unos ciertos lmites
asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una
curva de probabilidad.
Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinacin de
observaciones desde los principios de la teora de probabilidades. Laplace represent la Ley de
probabilidades de errores mediante una curva y dedujo una frmula para la media de tres
observaciones. Tambin, en 1871, obtiene la frmula para la ley de facilidad del error (trmino
introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce
el principio del mximo producto de las probabilidades de un sistema de errores concurrentes.
El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue
publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808), y Carl
Friedrich Gauss (1809). Gauss haba usado el mtodo en su famosa prediccin de la localizacin del
planeta enano Ceres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss
(1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W. F. Donkin (1844, 1856),
John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De
Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La frmula de Peters para r, el
probable error de una observacin simple es bien conocido.

Siglo XX
El campo moderno de la estadstica se emergi a los principios del siglo XX dirigida por la obra de
Francis Galton y Karl Pearson, quienes transformaron la estadstica a convertirse en una disciplina
matemtica rigurosa usada por anlisis, no solamente en la ciencia sino en la manufactura y la poltica.
Las contribuciones de Galton incluyen los conceptos de desviacin tpica, correlacin, anlisis de la
regresin y la aplicacin de estos mtodos al estudio de la variedad de caractersticas la altura, el peso,
el largo de las pestaas de ojo entre otros. Pearson desarroll el Coeficiente de correlacin de Pearson,
defini como un momento-producto, el mtodo de momentos por caber las distribuciones a las
muestras y la distribuciones de Pearson, entre otras cosas. Galton y Pearson se fundaron Biometrika
como su primera revista de la estadstica matemtica y la bioestadstica (en aquel entonces conocida
como la biomentra). Pearson tambin fund el primer departamento de estadstica en University
College de Londres.
Durante el siglo XX, la creacin de instrumentos precisos para asuntos de salud pblica
(epidemiologa, bioestadstica, etc.) y propsitos econmicos y sociales (tasa de desempleo,
econometra, etc.) necesit de avances sustanciales en las prcticas estadsticas.
Ronald Fisher invent el trmino hiptesis nula durante el experimento de la mujer saboreando t, la
cual nunca se pruebe ni se establezca pero tal vez se refuta, en el curso de experimentacin.
La segunda ola de los aos 1910 y 1920 se inici William Gosset, y se culmin en la obra de Ronald
Fisher, quin escribi los libros de texto que iban a definir la disciplina acadmica en universidades en
todos lados del mundo. Sus publicaciones ms importantes fueron su papel de 1918 The Correlation
between Relatives on the Supposition of Mendelian Inheritance, lo cual era el primero en usar el
trmino estadstico varianza, su obra clsica de 1925 Statistical Methods for Research Workers y su
1935 The Design of Experiments, donde desarroll los modelos rigorosos de diseo experimental.
Origin el concepto de suficiencia y la informacin de Fisher. En su libro de 1930 The Genetical
Theory of Natural Selection aplic la estadstica a varios conceptos en la biologa como el Principio de
Fisher13 13 (sobre el ratio de sexo), el Fisherian runaway, un concepto en la seleccin sexual sobre una
realimentacin positiva efecto hallado en la evolucin.
El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard
Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre y Didion. Augustus De Morgan y
George Boole mejoraron la presentacin de la teora. Adolphe Quetelet (1796-1874), fue otro
importante fundador de la estadstica y quien introdujo la nocin del hombre promedio (lhomme
moyen) como un medio de entender los fenmenos sociales complejos tales como tasas de
criminalidad, tasas de matrimonio o tasas de suicidios.

Estadstica - Definiciones
La estadstica es una ciencia formal y una herramienta que estudia usos y anlisis provenientes de una
muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico
o natural, de ocurrencia en forma aleatoria o condicional.
Sin embargo, la estadstica es ms que eso, es decir, es la herramienta fundamental que permite llevar a
cabo el proceso relacionado de la estadstica con la investigacin cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las
ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.

La estadstica se divide en dos grandes reas:


Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a
partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos
bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos
son: histograma, pirmide poblacional, grfico circular, entre otros.
Estadstica inferencial: Se dedica a la generacin de los modelos, inferencias y predicciones asociadas
a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas
inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones
de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de
asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras
tcnicas de modelamiento incluyen anlisis de varianza, series de tiempo y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. La estadstica inferencial,
por su parte, se divide en estadstica paramtrica y estadstica no paramtrica.
Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la
materia.
La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un
conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros.

Diferencias entre:
a) Poblacin y Muestra: La poblacin es el todo parte del universo sobre el cual se realiza una
investigacin un ejemplo: mujeres en edad frtil que sufren cncer de mama. El universo son las
mujeres la poblacin son las mujeres en edad frtil y la muestra se toma de la poblacin en estudio
aplicando frmulas ya sea para poblacin finita (cuando se conoce el dato cuantitativo de una
poblacin ) y para poblacines infinitas cuando la poblacion no se conoce el dato. Luego que se
establece la muestra, se selecciona el tipo de muestreo que sirve para describir la unidad de anlisis.

b) Parmetro y Estadstica: Parmetro: Es un indicador de la poblacin calculado con base en la


informacin de todas las unidades de anlisis Estadstica: Indicador de la poblacin calculado con base
en la informacin suministrada por la muestra Especializacin en Estadstica Aplicada Estadstica
Inferencial.

c) Variables Continuas y Discretas: Variables discretas, son las que pueden tomar un nmero finito o
infinito de valores aislados (por tanto son un conjunto numerable), generalmente enteros. A cada valor
de la variable se le asocia una probabilidad y los pares variable, probabilidad forman la Distribucin de
Probabilidades. Provienen generalmente de conteos.
Variables continuas, pueden tomar cualquier valor real en uno o ms intervalos (por tanto no forman
conjuntos numerables). A cada valor de la variable se le asocia una densidad de probabilidad. Solo
tienen probabilidad diferente de cero intervalos de medida no nula. La funcin se denomina de
Densidad de Probabilidades. Provienen generalmente de mediciones con instrumentos tericamente
con precisin infinita.

Formas de presentacin de los datos estadsticos


Una presentacin adecuada y clara de los resultados de un trabajo de investigacin adems de ser
fundamental para contribuir a la difusin de los mismos, puede incluso ser imprescindible para lograr
que se acepte su publicacin. en la actualidad la exigencia de las revistas y de los revisores ha
contribuido a que el nivel de calidad en la presentacin de datos sea bastante bueno, por lo que es
conveniente tener algunas ideas muy claras para evitar errores o situaciones que hoy ya no son
admisibles, lo que no solo nos preparar para la publicacin de nuestros trabajos sino tambin para una
lectura crtica de los de otros. precisamente un buen punto de partida para obtener informacin, no slo
sobre cmo presentar nuestros resultados sino tambin sobre cmo preparar todo el conjunto del
artculo, lo constituyen las propias guas suministradas por las revistas.
Un artculo bien concebido debe transmitir la mayor parte de la informacin con slo leer el abstract y
los resultados, siendo para ello vital que los datos, con las tablas y figuras correspondientes, estn bien
presentados y organizados. en general no debiera ser necesario acudir al texto para entender una tabla o
una figura; otro caso es para interpretarla, lo que ya corresponde al apartado de discusin o
conclusiones.
La manera de presentar los datos es diferente segn el tipo de los mismos. de forma rpida podemos
hacer dos grandes grupos: datos cuantitativos y datos cualitativos. en el grupo de datos cuantitativos
tenemos aquellos cuyo resultado puede variar de forma continua, como puede ser el peso, la edad, etc.
y los que slo pueden tomar valores enteros como por ejemplo el nmero de hijos, el nmero de
ingresados en la unidad de quemados un da concreto, etc. a su vez en las variables cualitativas
distinguiremos las nominales, que constituyen una simple etiqueta -como puede ser el sexo, el grupo
sanguneo, etc.- de las ordinales, en las que se da una relacin de orden entre las respuestas, como por
ejemplo en el resultado de una patologa/tratamiento (fallece, empeora, sin cambios, mejora, curacin)
o el nivel educacional. cada tipo variable tiene requerimientos propios en cuanto a presentacin y en
cuanto a las pruebas que se utilizan para contrastar los valores entre diferentes grupos.

Resumen de datos cuantitativos


Para resumir datos cuantitativos es preciso indicar un valor central y un ndice de variabilidad o
dispersin. cuando es razonable suponer que los datos pueden seguir una distribucin normal, se
indicar la estimacin de la media y la desviacin tpica.
Es correcto resumir los datos cuantitativos con la media y la desviacin tpica slo cuando es vlido
suponer que su distribucin de probabilidad se aproxima a una distribucin normal o de gauss, y es por
tanto una distribucin simtrica en torno a la media. en muestras grandes se podr verificar esta
hiptesis de normalidad, mientras que en muestra pequeas puede no ser posible.

En el caso de que los datos no sigan una distribucin normal, no es adecuado utilizar la media y
desviacin tpica para resumir la informacin, sino que debe emplearse la mediana como ndice de

centralizacin y el rango intercuartlico como ndice de dispersin. la mediana es el valor que deja a
cada lado, por encima y por debajo, la mitad de la distribucin, de tal manera que es igualmente
probable encontrar un valor ms pequeo que uno mayor que la mediana.
Para caracteriza la distribucin utilizamos los percentiles, que son aquellos valores que dejan una
proporcin determinada de datos a cada lado.

Resumen de datos cualitativos


los datos cualitativos (nominales u ordinales) se cuantifican como recuentos del nmero de casos
observados para cada categora, y suelen expresarse habitualmente como porcentajes u otro tipo de
cocientes.
Siempre se debe indicar los valores de los denominadores (nmero total de casos) con los que se
efectuaron los clculos, sobre todo teniendo en cuenta que en muchos trabajos se parte de un efectivo
de muestra pero luego una determinada tasa no se calcula sobre el total de pacientes, sino sobre una
parte de ellos, bien porque se trata de un grupo especial o porque faltan datos de algunos unidades en
estudio, y si no se indica el denominador se dar la falsa impresin de que el porcentaje se refiere a
toda la muestra, ya que no hay manera de comprobarlo con la informacin proporcionada.

Generalizacin de los resultados. intervalos de confianza y valores de probabilidad


El razonamiento que subyace en todo trabajo de investigacin es que si la muestra que hemos estudiado
ha sido extrada de forma aleatoria de la poblacin, los resultados observados en ella sern vlidos
aproximadamente para esa poblacin, y los procedimientos estadsticos nos permiten cuantificar la
magnitud del trmino "aproximadamente", lo que depender del tamao y representatividad de la
muestra (error de muestreo), la variacin debida a las tcnicas de medida empleadas (error de medida),
y la propia variabilidad del proceso estudiado (error aleatorio).

La precisin de la estimacin efectuada a partir de los datos del estudio se refleja en el intervalo de
confianza. el intervalo de confianza de un parmetro viene dado por dos lmites, inferior y superior, en
el que, de acuerdo con nuestros datos, esperamos que se encuentre el valor verdadero del parmetro de
la poblacin (desconocido), con un nivel de seguridad determinado y que se suele fijar en el 95%.

El intervalo de confianza es mucho ms informativo que indicar solo si un resultado ha sido


estadsticamente significativo, incluso aunque se d el valor de la probabilidad.

Aplicaciones de la Estadstica en Ingeniera


La estadstica aplicada en la Ingenira se hace mediante la rama de la estadstica que busca
implementar los procesos probabilsticos y estadsticos de anlisis e interpretacin de datos o
caractersticas de un conjunto de elementos al entorno industrial, a efectos de ayudar en la toma de
decisiones y en el control de los procesos industriales y organizacionales.
Pueden distinguirse tres partes:
* el estudio de las series temporales y las tcnicas de previsin, y la descripcin de los pasos necesarios
para el establecimiento de un sistema de previsin operativo y duradero en una empresa;
* el anlisis multivariante, necesario para la extraccin de informacin de grandes cantidades de datos,
una de las necesidades ms apremiantes;
* el control de calidad y la fiabilidad.
Las aplicaciones de la estadstica en la ingeniera actualmente han tomado un rpido y sostenido
incremento, debido al poder de clculo de la computacin desde la segunda mitad del siglo XX.
Para comprender el desarrollo de las aplicaciones de la estadstica en la ingeniera hay que citar que los
Viejos Modelos Estadsticos fueron casi siempre de la clase de los modelos lineales. Ahora, complejos
computadores junto con apropiados algoritmos numricos, estan utilizando modelos no lineales
(especialmente redes neuronales y rboles de decisin) y la creacin de nuevos tipos tales como
modelos lineales generalizados y modelos multinivel.
El incremento en el poder computacional tambin ha llevado al crecimiento en popularidad de mtodos
intensivos computacionalmente basados en remuestreo, tales como tests de permutacin y de bootstrap,
mientras tcnicas como el muestreo de Gibbs han hecho los mtodos bayesianos ms accesibles.
En el futuro inmediato la estadstica aplicada en la ingenieria, tendr un nuevo nfasis en estadsticas
"experimentales" y "empricas". Un gran numero de paquetes estadsticos est ahora disponible para los
ingenieros. Los Sistemas dinmicos y teora del caos, desde hace una dcada empez a ser utilizada por
la comunidad hispana de ingenieria, pues en la comunidad de ingenieria anglosajona de Estados Unidos
estaba ya establecida la conducta catica en sistemas dinmicos no lineales.
Algunos campos de investigacin en la Ingeniera usan la estadstica tan extensamente que tienen
terminologa especializada. Estas aplicaciones incluyen:
* Ciencias actuariales
* Fsica estadstica
* Estadstica industrial
* Estadstica Espacial
* Estadstica en Agronoma
* Estadstica en Planificacin

* Estadstica en Investigacin de Mercados.


* Estadstica en Planeacin de Obras Civiles - megaproyectos.
* Estadstica en Restauracin de Obras
* Geoestadstica
* Bioestadstica
* Estadsticas de negocios y mercadeo.
* Estadstica Computacional
* Investigacin de Operaciones
* Estadsticas de Consultora
* Estadstica en la comercializacin o mercadotecnia
* Cienciometra
* Estadstica del Medio Ambiente
* Minera de datos (aplica estadstica y reconocimiento de patrones para el conocimiento de datos)
* Estadstica econmica (Econometra)
* Estadstica en procesos de ingeniera
* Estadstica en Psicometra y Ergonomia Laboral.
* Controles Estadsticos en Calidad y Productividad
* Estadstica en Tcnicas de Muestreo y Control.
* Anlisis de procesos y quimiometra (para anlisis de datos en qumica analtica e ingeniera qumica)
* Confiabilidad estadstica aplicada al Diseo de Plantas Industriales.
* Procesamiento de imgenes e Interpretacin Binarias para Equipos de Diagnstico de Fallas y
Mantenimiento Predictivo.
La estadstica aplicada en la Ingenieria Industrial es una herramienta bsica en negocios y produccin.
Es usada para entender la variabilidad de sistemas de medicin, control de procesos (como en control
estadstico de procesos o SPC (CEP)), para compilar datos y para tomar decisiones. En estas
aplicaciones es una herramienta clave, y probablemente la nica herramienta disponible.

You might also like