Professional Documents
Culture Documents
PRESENTACION
La econometría como disciplina que forma parte de las matemáticas aplicadas, al utilizar conceptos
matemáticos y estadísticos en la economía, ha resultado de gran utilidad para estos profesionistas en
el estudio que suelen hacer sobre el comportamiento actual y futuro de los fenómenos económicos,
así como para identificar y cuantificar las relaciones estructurales que éstos mantienen entre sí, al
igual que para expresar matemáticamente sus teorías y para verificarlas con el instrumental que les
proporciona la estadística.
Así, este trabajo integra en forma sistematizada los conocimientos básicos sobre esta disciplina; de
manera didáctica describe los conceptos teóricos y la aplicación de las técnicas mediante las cuales
es posible:
Este acervo de conocimientos es de gran utilidad para el ejercicio profesional de los economistas,
que pueden constatar la veracidad y comportamiento futuro de las variables micro y macro
económicas. Debido a ello he puesto gran cuidado en la elaboración de este libro, en su
presentación y exposición didáctica, en la descripción de su alcance, de sus limitaciones y, por
consiguiente, en el uso concreto que tiene en determinadas situaciones.
Con este enfoque estimo que esta obra debe ser parte de la bibliografía básica que deben consultar
los estudiantes y profesionales de la economía. Pienso que su consulta le permitiría a los primeros
aprender los conceptos fundamentales de la econometría y, a los segundos, ratificar, refrescar y
enriquecer los conocimientos suficientes para hacerlos competitivos en el mundo globalizado que
nos ha tocado vivir, donde la constante es el cambio y la competencia entre las personas.
personas estén en condiciones de elaborar propuestas alternativas frente a los problemas diarios,
entonces ellos están desarrollando en el presente las pautas que les serán útiles en el futuro.
Luego entonces la educación generada con el enfoque sistémico determina que se considere al
aprendizaje como un fenómeno integrado a la persona entera, que lo hace diferente del viejo
enfoque mecanicista que asigna a la naturaleza humana el carácter dual cuerpo- mente.
Práctica docente
1.- En el contexto del enfoque sistémico de la educación es que procuro crear escenarios de
aprendizaje cercanos a la realidad en que los alumnos actuarán posteriormente como profesionistas.
2.- Expongo y evalúo el tema programado, es decir, destaco sus principales características e indico
el alcance de su metodología, sus limitaciones y aplicaciones adecuadas a la economía; los alumnos
no repiten ni memorizan, sino que asimilan, reflexionan y analizan los conceptos que les he
transmitido, además de buscar la aplicación conveniente de los métodos estadísticos aprendidos.
3.- Para cerciorarme del grado de asimilación de la teoría adquirida por los alumnos, acostumbro
hacer lo siguiente:
a).- Elaborar un cuestionario con preguntas clave o básicas sobre el tema que hemos visto; el
cuestionario lo entrego a los alumnos para que lo contesten fuera de aulas y cuando lo regresan,
juntos revisamos si fueron correctas las respuestas que escribieron, procediendo a hacer las
correcciones pertinentes; los estudiantes que contestaron bien la mayoría de los preguntas reciben
una nota por su “participación en clase”, como estímulo para su mejor desempeño en el futuro.
b).- Enseguida les aplico exámenes parciales escritos u orales a los alumnos; para ello los preparo en
la siguiente forma: les comunico el tema sobre el que haremos el examen, enseguida les dejo
ejercicios para resolver: Dicha solución la revisamos en el pleno de la clase: cuando los alumnos
los resolvieron correctamente, les reconozco dicho mérito con puntuación sobre su participación en
clase, cuando no resolvieron o hicieron mal los ejercicios, les corrijo e informo que el examen
versará sobre casos similares.
4.- Como puede observarse con este enfoque didáctico pretendo que el alumno razone, infiera,
deduzca, medite, reflexione y no repita o memorice. En este contexto es que utilizo las tres aulas:
la tradicional para presentarnos, conocernos e introducir el curso, además para establecer los
criterios de evaluación para calificar sus resultados al final del semestre. En el aula de cómputo
hacemos con rapidez los cálculos, situación que nos permite disponer de más tiempo para hacer
análisis e interpretación de los datos. El aula multimedia sirve para exponer y hacer énfasis en
ciertos puntos cruciales o básicos del conocimiento.
Para exponer uso los tres siguientes canales de percepción: auditivo, kinestésico y el visual, sobre
todo en el aula multimedia y en la de cómputo.
5.- Una vez afianzado el conocimiento econométrico, principalmente los métodos, acostumbro pedir
que los alumnos investiguen en otras fuentes bibliográficas con objeto de ampliar el conocimiento,
de conocer otros enfoques y quizás, de entender mejor el tema en estudio.
6.- De manera resumida, suelo desarrollar y calificar a lo largo del semestre las siguientes
actividades:
CONCEPTO PONDERACION
En esa forma ilustro la aplicación del enfoque sistémico en mis cursos de econometría, con el que,
como se infiere, no pretende enseñar econometría per se, sino que le enseño al alumno a reflexionar
sobre el alcance, importancia, uso y limitaciones de la econometría, en una atmósfera propicia para
considerarla como una de las principales herramientas para el análisis e interpretación de los
fenómenos económicos que le toque estudiar en el ejercicio profesional. En este contexto es que
termino haciendo una investigación económica mediante la cual indico cómo se plantea una teoría
económica, cómo se expresa matemáticamente y cómo se verifica o rechaza estadísticamente. Algo
similar le pido a los alumnos para que empiecen a desarrollar su capacidad de análisis e
interpretación.
Finalmente, aprovecho para agradecer a los profesores José Alberto Reyes de la Rosa, Ekatherina
Peregrina y Joel Rojas Escudero que participaron activamente en la captura, presentación y revisión
meticulosa de los ejemplos numéricos, en particular al profesor Alberto Reyes de la Rosa por la
I. INTRODUCCIÓN A LA ECONOMETRÍA
I.1 Definición
De ahí que la econometría tenga como objetivo la determinación empírica de las leyes económicas.
En ese contexto es que también se le utiliza para verificar teorías o hipótesis económicas.
Como puede observarse el análisis de regresión amplió considerablemente su ámbito de trabajo ya
que pasó de meras mediciones o cuantificaciones de un fenómeno económico ( variables
dependiente) a su relación o vinculación con otro(s) fenómenos (variables independientes),
permitiendo con ello formular relaciones, hipótesis o teorías como mejor convenga a los objetivos
del investigador; incluso ahora es posible predecir la media aritmética de la variables dependiente.
El concepto de análisis de regresión fue introducido por Francis Galton quien estudió las estaturas
de un número de padres de familia y de sus hijos; observó cierta tendencia: los padres de estatura
alta tenían hijos altos y los padres de estatura baja tenían hijos bajos ( Gujararti, 2003: 17) y que la
estatura promedio de los hijos nacidos de padres de una cierta estatura tendía a moverse o regresar
hacia la estatura promedio de la población total . Su hallazgo reveló que “la estatura de los hijos
inusualmente altos o de padres inusualmente bajos tiende a moverse hacia la estatura promedio de la
población total.
Sus hallazgos también conocidos como Ley de Regresión Universal fueron corroborados por su
amigo Kart Pearson con una muestra de mil individuos cuyas estaturas registró, analizó y encontró
“que la estatura promedio de los hijos de un grupo de padres alta era menor que la estatura de sus
padres y la estatura promedio de los hijos de un grupo de padres de estatura baja era mayor que la
estatura de sus padres, generando un fenómeno mediante el cual los hijos altos e hijos bajos,
“regresaban” por igual hacia la estatura promedio de todos los hombres”. En palabras de Galton, se
trataba de una “regresión hacia la mediocridad”.
Dicho incremento en la estatura promedio de los hijos dada la estatura de los padres, es una
estimación que se obtiene con la recta de regresión, cuyos valores de los parámetros de la ordenada
al origen y de la variable independiente ( la estatura de los padres) se obtienen con el método de
Mínimos cuadrados. Así, si le damos valores a la variable independiente ( al menos dos) se puede
gráficar y a esta línea se le conoce como Recta de Regresión, misma que expresa “la forma en que
el promedio de la estatura de los hijos aumenta conforme lo hace la de los padres” (Gujarati, 2003:
19). Dicho en otras palabras, la recta de regresión indica en cada uno de sus puntos que a un valor
dado de la estatura de los padres le corresponde una gama de estaturas de sus hijos pero que dicha
gama o distribución de estaturas tiene un promedio, que es el valor representativo de todos ellos
( valores altos y bajos de las estaturas de los hijos). Al siguiente valor de la estatura de los padres
también le corresponde un rango de estaturas de los hijos; ese rango o distribución de estaturas
también tiene un promedio, que es el siguiente punto de la recta de regresión. Así podemos ir
obteniendo sucesivos valores promedio de la recta, los cuales son estimaciones de la estatura de los
hijos (variable dependiente) obtenidas por el método de mínimos cuadrados. En resumen, los puntos
de una recta de regresión son valores promedio de la estatura de los hijos dada la estatura de los
padres. Todo este marco teórico de estimación se verá en detalle enseguida.
En este sentido ahora es conveniente indicar que un fenómeno económico se estudia a través de la
observación. Su comportamiento se registra y evalúa preferentemente con datos cuantitativos (en
ocasiones con cualitativos, expresados a través de variables llamadas categóricas, dicotómicas,
ficticios o dummy). La matemática permite expresar su comportamiento a través de ecuaciones que
pretenden describir determinada teoría económica, misma que en turno permite a la estadística
indicar si es o no verídica. Así, una vez que se expresa la teoría económica en forma uniecuacional
o multiecuacional, la estadística proporciona los métodos para corroborar sí se prueba o no con rigor
técnico.
I.2 Propósito1
Con base en la definición, puede decirse que la econometría tiene tres propósitos fundamentales:
Algunos estudiosos como G.S. Maddala (1996:2) comentan que en opinión de Stigler en 1699 se
identifica a Charles Devenant como pionero en el área, puesto que hizo y publicó ese año el primer
programa de demanda empírica; otros consideran que su origen está en los trabajos realizados en
dicho siglo XVII por Sir William Petty, quien escribió en 1676 y luego publicó en 1690 su obra la
aritmética política o más recientemente, en 1758, con la Tableau Économique elaborada por el
célebre médico francés Francois Quesney. En opinión de Julián Pérez (1998) han existido las
siguientes etapas evolutivas:
i). Etapa I: Antecedentes, que comprende desde las primeras expresiones económicas a través de las
matemáticas, hasta 1914.
ii). Etapa II. Desarrollos iniciales; abarca desde la publicación de H. Moore de Economic Cycles:
Their law and Causes, obra que muchos especialistas catalogan como el primer trabajo
econométrico formal, digamos hasta 1930.
iii). Etapa III. Formalización. Se le llama así porque el 29 de diciembre de 1930 se fundó la
Econometric Society en la ciudad norteamericana de Cleveland, a iniciativa de Charles Roos,
Ragnar Frisc e Irving Fisher; esta etapa llega hasta 1950.
iv). Etapa IV. Extensión, va desde la publicación de la monografía número diez de la Cowles
Comissión, en la cual se presentan las normas básicas de la investigación econométrica, etapa que se
prolongó hasta 1979.
v. Etapa V. Diversidad de enfoques, la cual se inicia con la publicación del Time Series Analysis de
Box & Jenkins, que brinda un nuevo enfoque ( modelos univariantes de series temporales,
conocidos como modelos ARIMA ) para explicar mejor ( ya que los distintos modelos clásicos
empezaron a fallar sistemáticamente en sus predicciones ) el comportamiento y relación de las
variables económicas en un sistema económico internacional agobiado por la crisis petrolera, el
abandono del patrón oro y el cambio del flujo financiero que ocasionaron altos niveles de inflación y
desempleo en economías completamente desestabilizadas.
Señala Julián Pérez que “en este contexto surgieron múltiples críticas a la modelización tradicional,
representada por los grandes modelos macroeconómicos de ecuaciones simultáneas, que sirvieron
como incentivo para el desarrollo de contrastes nuevos, especificaciones alternativas, y técnicas
nuevas para abordar el análisis económico aplicado. Esta diversidad de planteamientos constituye el
segundo de los factores diferenciadores que delimitan esta última etapa de la historia econométrica.
En los umbrales del siglo XXI, el instrumental teórico sobre análisis econométrico ha sido
fortalecido por un desarrollo exponencial de las tecnologías informáticas, las cuales han aportado
poderosas herramientas computacionales que han permitido el uso de sistemas de resolución muy
complejos en periodos muy cortos. Asimismo, los lenguajes de programación “amigables” han
facilitado a los investigadores la posibilidad de generar sus propias herramientas de computo, lo que
ha diversificado enormemente las posibilidades de aplicación teórica.”
Estos son algunos de los conocimientos frontera en el nuevo estado del arte econométrico, mismas
bases que norman el contenido del curso sobre introducción a la econometría.
1.4.1. Norteamericanos,
Se dice que en 1998 apareció publicado al mismo tiempo que se inauguró un sitio en Internet
gratuito con la versión electrónica, el MME para la economía de EEUU con el nombre de US
Model, de Ray Fair, profesor de la universidad de Yale. Entre otras aplicaciones, es útil como
simulador al contener información para crear escenarios en sectores claves como: los hogares, las
empresas, el sector financiero, el sector gobierno federal, el sector gobierno local, y el sector
externo.
Destacan el modelo Wharton –Universidad Autónoma de Madrid, (WUAM), que existe desde 1981.
También, el Modelo de investigación y simulación de la economía española (MOISSES) y, el que se
publicó en 1994, intitulado: “Modelo de Aproximación Trimestral, MAT.
Cronológicamente el que primero se conoció fue el Modelo UNAM de Ibarra ( Ibarra, 1970), le
siguieron el modelo de Clavijo ( 1976), el modelo de planeación hacendaria ( 1979), el modelo de
Ruffat, versión modificada del modelo de Beltrán ( 1981), el modelo Galileo ( 1983), el modelo
MODEM del CIDE (1984), el modelo Aspe-Jarques (1985), el modelo Amiela-Huerta (1985), el
modelo Ricardo Lago ( 1991), el modelo Eudoxio ( 1995) y otros más que sin duda han surgido en
la SHCP, SEDESOL, pero que no están disponibles al público..
Al ser la econometría la disciplina que expresa una teoría económica a través de las matemáticas y
de verificarse con métodos estadísticos, es conveniente señalar que la expresión matemática adopta
la forma de modelos.
Metodología de la econometría
Para la formulación de los modelos metodológicamente es necesario realizar las siguientes etapas
de trabajo:
1.- Enunciación de la teoría o hipótesis económica.
2.- La especificación del modelo, que es la exposición de la teoría económica con símbolos
matemáticos, es decir, la definición del modelo econométrico dirigido a probar la teoría económica.
3.– Estimación: la determinación del valor numérico de los parámetros del modelo.
4.- Verificación: Es la aceptación o el rechazo de la teoría económica mediante el método de
pruebas de hipótesis estadísticas.
5.- Predicción: Se evalúan relaciones estructurales y futuros resultados con base en el modelo
establecido.
6.- Aplicación: se evalúan las relaciones estructurales que existan entre las
variables endógenas y exógenas, en términos de dinamismo y tendencia
principalmente.
7.- Utilización del modelo para fines de control, formulación o evaluación de políticas económicas.
1. y 2.- ENUNCIACION/ESPECIFICACION
Endógenas: son las que explican el modelo y cuyo valor se determina dentro del mismo.
Exógenas: son aquellas cuyos valores no los determina el modelo, son independientes, por
consiguiente, influyen en el mismo pero no son influenciadas por el resto de las variables del
modelo.
Retardadas: son aquellas cuyos valores corresponden a momentos, años o periodos de tiempo
pasado que influyen en las variables endógenas del presente; pueden ser endógenas o exógenas.
Dicotómicas ( también conocidas como ficticias, dummy o categóricas) son las variables cualitativas
del modelo, expresadas en atributos, genero, raza, idioma, etc.
Perturbación aleatoria: Es una variable aleatoria cuya inclusión se debe al hecho de que las
relaciones económicas no se cumplen exactamente ( porque son “estimacions”). También se dice
que expresa los efectos en la variable dependiente de otras variables exógenas que no se exhiben
como explicativas en forma explícita en la forma funcional de la ecuación de regresión. Regresando
al enfoque inicial diremos que dicha inclusión, que confiere a los modelos el carácter estocástico, se
justifica por las siguientes razones no excluyentes:
1.- Resumen de la influencia conjunta de las otras variables exógenas, que, por tener poca
importancia, no son incluidas en el modelo de forma independiente.
Finalmente diremos que las variables dicotómicas (ficticias, dummy y categóricas) son las variables
cualitativas del modelo, expresan atributos, genero, raza, idioma etc. Existen métodos que veremos
más adelante para convertirlas en cuantitativas y así poder manipular la relación entre ellas y/o con
otras variables cuantitativas, relación que se obtiene con el método de mínimos cuadrados y que se
expresa con las pendientes que resultan en la ecuación de regresión.
b).- Parámetros:
Son coeficientes que acompañan a las variables en el modelo. Son magnitudes que permanecen
constantes dentro de un fenómeno concreto y que, por esta razón, reciben el nombre de parámetros
estructurales. En la teoría económica suelen tener ciertas restricciones para que ésta se cumpla,
por ejemplo el signo para indicar que se cumple o no cierta relación entre las variables dependiente e
independiente.
c) Ecuaciones.
Significado: una ecuación es un planteamiento que señala que dos expresiones son
iguales: Cada una de las expresiones se llama lado o miembr o y están separadas
por el signo de igualdad (=).
Luego entonces son relaciones matemáticas con las que se trata de expresar la forma en que
aparecen relacionadas las variables y los parámetros que componen el modelo. Matemáticamente se
clasifican así:
Institucionales: Describen los efectos de orden jurídico, social y de la política económica sobre el
fenómeno en estudio.
Identidad: Son las ecuaciones que expresan relaciones contables o identidades entre magnitudes
económicas.
d).- Datos:
Los datos de las variables pueden corresponder a valores de una variable en el tiempo: series de
tiempo, o a valores para diferentes individuos, grupos u objetos en un momento dado, llamados de
corte transversal y que generalmente provienen de las muestras usadas para hacer encuestas.
i). Por el número de ecuaciones, es decir, pueden ser uniecuacionales o multiecuacionales, todo
depende del número de ecuaciones con que se constituyan.
ii). Por la forma de sus ecuaciones, pueden ser lineales cuando sus ecuaciones lo son, no lineales si
alguna no lo es.
iii). Por la relación entre el número de ecuaciones y el número de variables endógenas, se dice que
es completo cuando coincide el número de ambas; es incompleto, cuando difiere dicho número.
iv). Por el momento del tiempo a que se refieren sus valores: son estáticos o dinámicos. En el primer
caso todas las variables están referidas al mismo instante de tiempo; en el segundo, cuando dentro
del modelo se incorpora alguna variable retardada.
3.- ESTIMACIÓN
Condiciones técnicas para la construcción y operación de modelos
Modelo lineal simple: uniecuacional
1.- Presentación:
Como señala el profesor José Hernández Alonso ( op. cit., 33), la relación
económica más sencilla es la que se establece entre dos variables X e Y mediante
una ecuación lineal ESTRUCTURAL como la siguiente:
Yi = α + β X i + U i
Donde:
Y i : variable endógena, explicada, dependiente o regresada;
X i : variable exógena, explicativa, independiente o regresora;
Ui: perturbación aleatoria o explicación de los efectos que no explica X i sobre Ŷi ;
α y β: parámetros desconocidos cuyo valor es necesario determinar ( estimar ) con
el método de mínimos cuadrados u otro.
Conviene señalar que la palabra estocástica viene del griego, idioma en que significa “ centro del
blanco”. Así, un proceso estocástico es aquel que genera resultados en un experimento o proceso
económico- productivo, como pueden ser la fabricación diaria de ladrillos, de tornillos, de ingresos
de las personas, etc., mismos que se supone son idénticos, iguales (todos dan en el blanco); sin
embargo, al observarlos se halla que las piezas no son exactamente iguales en peso, tamaño y
volumen, es decir, es “un proceso que permite errores” ( Gujarati, 2003:21). Cada uno de ellos
tiene una probabilidad de ocurrencia asociada.
1 2 3 4 5 6 21
E ( xi ) =
+ + + + + = = 3.5
6 6 6 6 6 6 6
E(xi)=3.5 que aunque no existe, aun así es el valor esperado en el experimento.
Ŷ= a+bX+ ei donde:
a es estimador de α
b es estimador de β
Ŷes estimador de Y
ei es el estimador de Ui
∑ y = na + b∑ x (1)
∑ xy = a ∑ x + b∑ x 2
(2)
5.- Predicción
ALCANCE DE LA ECONOMETRIA
1.- Es de gran ayuda para modelar políticas macro y macroeconómicas, para hacer
análisis de estructura, de predicción y para evaluar dichas políticas, en virtud de
que es la integración de una teoría económica con las matemáticas y las técnicas
estadísticas, que fundamentan solidamente a la primera.
2.- Es muy útil porque con su metodología se puede probar la relación hipotética
que se establezca entre las variables de interés para el investigador. Cuando la
relación estimada no pasa las pruebas estadísticas, es necesario modificar la
relación hipotética ( teoría económica) entre las variables bajo estudio. Si pasa
dichas pruebas, se cuenta con un sustento metodológico para decir que la relación
existe entre las variables.
3.-Sabiendo que existe la econometría teórica y la aplicada , en el análisis de
regresión la econometría teórica se complementa adecuadamente con la aplicada o
empírica, ya que la primera proporciona los métodos para medir la relación
económica que tiene la variable dependiente con la independiente o explicativa. La
segunda, cuantifica dicha relación con el valor del coeficiente de la variable
independiente, así como los hallazgos y problemas que surgen cuando se estudian
Ejem plos:
Una vez que sabemos que mediante el análisis de regresión podemos relacionar dos
o más variables, donde una de ellas es la dependiente y el resto son las
independientes o explicativas del comportamiento de la primera ( dependiente), así
como pusimos el ejemplo a nivel macro, ahora podemos aplicar el análisis de
regresión a nivel empresarial. Para ello primero debemos definir la política de la
empresa que se desea implementar, digamos la de ventas . Con esas referencias
enseguida se debe definir qué variable será la dependiente ( ventas) y las que
suponemos que las expliquen, quizás: publicidad, mercadotecnia, etc.
Así, el siguiente paso es buscar sus datos y usarlos para calcular la ecuación de
regresión, cuyos parámetros ( de la publicidad y de la mercadotecnia) indicarán la
relación que tienen estas variables independientes con la dependiente ( ventas).
Con esos resultados, podemos construir un escenario de planeación, digamos a
cinco años. Este pronóstico de ventas en función de la publicidad y la
mercadotecnia, nos permitirá formular la política de ventas de la empresa en ese
lapso de cinco años, en la que se describan las acciones a realizar para que sea
competitiva: de alta productividad y rentabilidad.
LIMITACIONES
Ahora bien, ciertos conjuntos de números tienen nombres especiales. Los números
1,2,3,4,5, ....,etc. forman el conjunto de los enteros positivos o números
naturales = {1,2,3,…} .
Los puntos suspensivos indican que la lista de elementos no tienen fin, aun cuando
sabemos cuales son los elementos del conjunto. Por otra parte, los enteros positivos
junto con el cero y los enteros negativos –1,-2,-3,-4.... forman el conjunto de los
enteros ={……-4,-3,-2,1,0,1,2,3,4,….}.
Los dos, tanto los números racionales como los números irracionales forman el
conjunto de los números reales. Estos números pueden representarse mediante
puntos en una recta y se les llaman coordenadas. Ejemplo:
− π -1.5 1/2 2 π
-3 -2 -1 0 1 2 3
II.2 Ecuaciones
Significado: una ecuación es un planteamiento que señala que dos expresiones son
iguales: Cada una de las expresiones se llama lado o miembr o y están separadas
por el signo de igualdad (=).
Ejemplos de ecuaciones:
Vemos que cada ecuación contiene cuando menos una variable, donde ésta se
representa generalmente ( pero no necesariamente ) por las letras finales del
alfabeto latino y se define como aquella literal que puede tomar cualquier valor
dentro de un dominio o rango que se específica previamente.
Es importante decir que una ecuación siempre debe estar definida; es decir, nunca
se permite que una variable tenga un valor para el cual cualquier expresión de la
ecuación resulta indefinida. Así, en el caso de la ecuación y/(y- 5)=7, la y no puede
ser 5 por que provocaría que el denominador fuera 0.
Por otra parte, se entiende por resolver una ecuación, el encontrar todos los
valores de sus variables para los cuales la ecuación se verifica; a estos valores los
llamamos soluciones de la ecuación y decimos que la satisfacen.
Finalmente, es conveniente decir que una ecuación debe resolverse para las
incógnitas; dichas soluciones son los valores encontrados para las variables que, al
sustituirlos en lugar de la incógnita, satisfacen la ecuación.
Ecuación lineal
Ax+b=0
También se le denomina de primer grado por que el exponente o mayor potencia de la variable x
es uno.
Ecuación cuadrática
ax 2 +bx + c=0.
Dado que por definición todas las ecuaciones expresan una igualdad del lado izquierdo con el lado
derecho, todas las operaciones en uno de los lados, también deben realizarse del otro lado para que
se mantenga la igualdad. Cualquier número puede sumarse o sustraerse de un lado de la ecuación,
siempre y cuando el mismo número sea agregado o restado del otro lado.
Simultáneamente ambos lados pueden multiplicarse o dividirse por el mismo número, ser elevados
a la misma potencia o sacarles la raíz cuadrada a ambos lados. Cuando se resuelven las ecuaciones
se debe tener cuidado con la remoción de los paréntesis y de las fracciones.
S = P + Prt
S = P ( 1 + rt )
P = S / 1 + rt
Solución de una ecuación cuadrática ( 3 )
La gráfica o curva de la función cuadrática Y = f (X) = ax 2 + bx + c = 0 se
denomina parábola, misma que tiene las siguientes características.
y
Vértice
y
Así, si la ecuación cuadrática es Y = f ( x ) =ax2+bx+c sustituyendo en, -x2 – 4x +12, vemos que a =
-1, b = -4 y c = 12. Puesto que a es menor que 0, la parábola abre hacia abajo. La coordenada X
del vértice es –b / 2a = -(-4) / 2 (- 1) = -2 . La coordenada Y es f( -2) = - (-2)2 – 4 ( - 2 ) + 12 = 16.
Así, el vértice o punto más alto de la parábola es (-2, 16 ). Como c = 12, la ordenada en el origen
(x= 0) es 12.
Para determinar las abscisas en el origen, se iguala Y a 0, es decir Y = -x2 -4x +12 y con ello
determinamos el valor de x :
0 = -x2 - 4x + 12
0 = - ( x2 + 4x – 12 )
0=-(x+6)(x–2)
Así tenemos el vértice en ( -2, 16), las intercepciones en ( -6,0 ) y ( 2, 0 ). Como el punto de
intercepción al eje Y es ( 0, 12 ) denominado ordenada en el origen, está a dos unidades a la
derecha del vértice, ( -2, 16 ), existe un punto a la izquierda del mismo con igual ordenada ( -4, 12 ),
con el que se obtiene la simetría con respecto al vértice.
Vértice (-2,16) y
15
(-4,12) (0,12)
12
simetría
(-6,0) (2,0) x
0
-7 -6 -5 -4 -3 -2 -1 0 1 2 3
( − 17 ) al cuadrado − 4(4)(15)
luego X = - (-17) ± / 2(4) = 17 ± 49 / 8
b).- 3x2 - 5x = 2
3x2 - 5x – 2 = 0 a = 3, b = -5 y c = -2
Cuando una situación se describe en forma matemática, en ocasiones se expresa por medio de un
conjunto de ecuaciones. Al respecto, es importante decir que un conjunto de ecuaciones simultáneas
se puede resolver normalmente con álgebra si el número de ecuaciones es igual al número de
variables. Así para resolver dos variables se requieren dos ecuaciones; generalizando, resolver para
n variables, significa que se requieren n ecuaciones. Sin embargo en ocasiones aun cuando el
número de ecuaciones es igual al número de variables no se encuentra su solución. Lo anterior se
ilustra con los siguientes ejemplos:
i).- inconsistente : x-y = 2 ..............(1) el sistema es inconsistente por que es igual a 2 o 5 pero no
x-y = 5 ..............( 2)
x + y = 5 ................( 1 )
x – y = 1 ...............( 2 )
Solo tienen solución los sistemas de ecuaciones que son ambas : independientes y consistentes, cuya
solución puede ser por los métodos de 1.- eliminación ; 2.- sustitución y 3.- determinantes.
5x + 2y = -5 ...........( 1 )
-3x +4 y = 29 ................( 2 )
si multiplicamos ( ¡ ) por 2 :
10 x + 4 y = - 10 .............. ( 1 ) por 2
-3x + 4y = 29 ..................( 2 )
solución 13 x + 0 = - 39
x = -3
Comprobación:
5 ( -3 ) + 2y = - 5
-15 + 2y = -5
y=5
respuesta X = -3 ; Y = 5
Ejemplo: 3x – 4y = 5 .................( 1 )
X + 7y = 10 ....................( 2 )
Referencias: sabemos que una matriz se define como un arreglo rectangular de números y que una
matriz cuadrada es aquella en que el número de “ renglones “ es igual al número de “ columnas “ :
A cada matriz cuadrada A corresponde un sòlo valor conocido como su determinante A .
a11 a12
A = = a11a22 – a12a21
a 21 a 22
vemos que el valor de A está dado por la diferencia de dos productos cruzados. Con números
4 5
= 4(3) – 5(1) = 7
1 3
a 22 a 23 a 21 a 23 a 21 a 22
A = a11 - a12 + a13
a 32 a33 a31 a33 a31 a32
ejemplo:
1 5 3
0 5 2 5 2 0
A = 2 0 5 = 1 -5 + 3
1 − 2 − 4 − 2 − 41
− 4 1− 2
A = - 79
En general decimos que un determinante de orden n se define en términos del determinante de orden
(n-1).
Ejemplos:
3x –4y = 5
x +7y = 10
5 − 4 3 − 4
X= entre = 35 – ( -40 )/ 21 – ( -4) = 75 / 25 = 3
10 7 1 7
X=3
35 3 − 14
Para Y = entre = 30 – 5 / 21- (-4 ) = 25/ 25
1 10 1 7
Y=1
Regla de Cramer
Al método de resolver un par de ecuaciones lineales de dos incógnitas se puede extender al caso
general de una ecuación con n incógnitas . Si Ax = h
La solución es X1 = A1 entre A
Observe que cuando la matriz A es singular, es decir, A = 0 no se puede usar la Regla de Cramer.
Ejemplo, encuentre los valores de las tres incógnitas (X, Y, Z ) de las siguientes ecuaciones usando
la Regla de Cramer:
x + y +z = 6
5x –y +27 = 9
3z +6y –5z = 0
1 1 1 x 6
5− 1 2 y = 9
3 6− 5 z 0
6 1 1 1 1 1
X = 9 − 1 2 entre 5 − 1 2 = 57/57 = 1
0 6 −5 3 6−5
1 6 1 1 1 1
Y = 5 9 2 entre 5 − 1 2 = 114/57 = 2
3 0− 5 3 6 −5
1 1 6 1 1 1
Z = 5 − 1 9 entre 5 − 1 2 = 171/57 = 3
3 6 0 3 6 −5
Sistema no lineal, también llamado solución de ecuaciones simultáneas cuando al menos una de
las ecuaciones es cuadrática.
Un sistema de ecuaciones simultáneas de un tipo más complejo se puede resolver usando el método
de sustitución, ejemplo:
X2 + 4y = 20 ...............(1)
Y 2x = 8 .............(2)
X2 + 4(8+2x) = 20 ............(1)
X2 + 32 + 8x = 20
X2 + 8x +12 = 0
(x+6)(x+2)=0
obtenemos ya sea x = -6 o x= -2
Y -2(-6) = 8 ...........(2)
Y +12 = 8
Y = -4
Y -2(-2) = 8 ..............(2)
Y +4 = 8
Y =4
3x –y + 1 = 0 ............(2)
y = 3x + 1 .........................(3)
X2 - 2x + ( 3x +1 ) -7 = 0
X2 + x -6 = 0
(x + 3 ) (x – 2 ) = 0
se obtiene X = -3 o bien X = 2
Como señalan E. Haeussler y R.S. Paul, el matemático G.W. Leibniz en el siglo XVII introdujo el
concepto de Función dentro del vocabulario matemático; una función es un tipo especial de relación
de entrada y salida, o dicho en otras palabras: insumo y producto.
Definición: una función es una regla que asigna a cada número de entrada exactamente un número
de salida. El conjunto de todos los números de entrada a los cuales se aplica la regla se le llama
dominio de la función. Al conjunto de todos los números de salida se le llama ámbito o
contradominio.
Ejemplo, al invertir dinero a una tasa de interés, el interés I, (salida), depende del tiempo t ( entrada )
en que se invierte el dinero. Para expresar esta dependencia decimos: “ I es función de t “ . Así,
supongamos que $ 100.00 producen interés simple a una tasa anual del 6%; escribimos:
I=100(i)t
I=100(0.06)t.............(1)
Donde I se expresa en pesos y t en años. Si t=1/2, obtenemos:
I=100(0.06)1/2...............(2)
En este caso, en (2) se asigna a la entrada t el valor ½ y a la salida 3. En (1) se define la regla: el
multiplicar t por 100(0.06). Dicha en otra forma t → I, también: t → 100(0.06)t.
De lo anterior observamos que el número de entrada t no puede ser negativo porque (-) no tiene
sentido. Luego entonces el dominio consiste en todos los números no negativos, t ≥ 0. En la ecuación
(2), cuando la entrada es ½, la salida es 3, es decir, es la parte del ámbito o contradominio.
A la variable t que representa números de entrada para una función se le llama variable
independiente y a la variable I que representa números de salida se le denomina dependiente, pues
su valor depende del valor de la variable independiente; decimos que la segunda es función de la
primera, en otras palabras, la salida es función de la entrada.
Por costumbre se usa la letra f para representar reglas de funciones, pero si lo deseamos, podemos usar otras letras. En el
caso anterior escribimos I=f(t).
Debe comentarse que f(t) no significa f multiplicado por t, sino que f(t) significa la salida que corresponde a t.
Lo anterior lo podemos generalizar diciendo que gráficamente lo expresamos de la siguiente manera; digamos si f(x)=
x 2 y si recordamos que una función es una correspondencia mediante la cual se asigna exactamente un número de
salida en el contradominio a solo uno de los números de la entrada del dominio, tenemos:
1 f 1=f(1)
2 4=f(2)
x x 2 =f(x)
Función constante:
Con base en lo anterior es que podemos decir que en una ecuación se establece una
relación particular entre dos o más expresiones algebraicas. Las ecuaciones pueden
contener cualquier número de variables. Con la terminología matemática se expresa
como Y=f(X).
Se dice que Y es función de X, es decir el valor de Y depende del valor que tome
X; cuando su valor depende de más de una variable escribimos: Y = f(x, z, h).
En este caso el valor de Y depende del valor que tomen las variables (x, z, h).
primer año, ( $105 más el interés producido por esa cantidad [105(0.05)] =
105+105(0.05) = $110.25.
En términos más generales, si se invierte un capital P a una tasa de 100r por ciento
compuesto anualmente ( por ejemplo, al 5%r es ( 0.05), el monto compuesto
después de un año será P + Pr o bien P ( 1 + r ) . Al final del segundo año, el
monto compuesto es
P(1+r) +P [ (1 + r )] = P(1+r) + [1 + r ] = P(1+r) 2
Ejemplo:
Calcule el valor de una inversión de $ 500.00 después 3 años si el interés simple se
paga anualmente a una tasa anual del 5%.
A = P + Prt
A = 500 + ( 500*5/100*3)
A = 575 pesos
8 − 2X2 X = 3Y
Y = 4−
3 2
Así, si nos interesan todos los valores de x entre x=a, y x=b, el rango es a<x < b o
hablando más estrictamente a≤x≤b donde x puede ser igual a cualquiera de los
límites o estos contenida a ellos.
II. 6 Simetría 3
y y = x2 y = x2
9
1
x
-3 -2 -1 -1 0 1 2 3
Definición: Una curva es simétrica con respecto al eje “y” ⇔ (-X 0 ,Y 0 ) queda en
la curva cuando (X 0 ,Y 0 ) también queda.
2.- De manera complementaria podemos decir que si tenemos la ecuación X=Y 2
podemos probar la simetría con respecto al eje “x”, dando valores a Y, digamos :
-1,0 y 1, en cuyo caso X toma los valores 1,0 y 1, que al graficarlos obtenemos una
curva en la que vemos que a cada punto en ella, con coordenadas (X 0 ,-Y 0 )
corresponde otro punto en la misma curva con coordenadas (X 0 , Y 0 ).
y
x = y2
2
0 x
0 1 2 3 4
-1
-2
Luego entonces decimos que una curva es simétrica con respecto al eje de las “x”
⇔ ( X 0 , - Y 0 ) está en la curva cuando ( X 0 , Y 0 ) también lo está.
3.- Cuando tenemos Y=X 3 y le damos valores a X de –1,0 y 1, obtenemos para Y
los valores de –1, 0 y 1
y
8
2 (1,1)
0 x
-2 (-1,-1) -1 0 1 2
-2
-4
-6
-8
II.7.1 Rectas
y 300
L1
250
200
150
100
50 L2
0
0 1 2 3 4
X
Y 10
9
8
7
6
5
4
3
2
1
0
X
0 2 4 6 8
Y 150
(x 2, y2)
100
50 (x 1, y1)
0 X
0 0,5 1 1,5 2
Donde x 1 = x 2
Para una recta horizontal, dos puntos cualquiera tiene Y 1 = Y 2 , por lo que el
numerador en (1) es cero; y decimos que m = 0
Y
150 (x 1,y1) (x 2,Y2 )
100
50
0 X
0 1 2 3 4
Y1 = Y2
II.7.1.1Ejercicios:
1.- Encontrar la ecuación de la recta que tiene pendiente 2 y pasa por (1,-3).
Sabemos que m=2 y que (X 1 ,Y 1 )=(1,-3), utilizando la forma punto-pendiente,
escribimos Y-(-3)=2(X-1), resolviendo tenemos:
Y+3=2X-2, luego llegamos a la forma lineal general 2X-Y-5=0.
2.- Hallar la ecuación de la recta que pasa por los puntos (-3,8) y (4,-2). Aquí
tenemos que m=-2-8/4-(-3)=-10/7
si tomamos las coordenadas del primer punto (-3.8) como (X 1 ,Y 1 ) en la forma
punto-pendiente, escribimos Y-8=-10/7 [ X − (− 3)] , haciendo operaciones tendremos
lo siguiente:
Y-8=-10/7(X+3)
7Y-56=-10X-30
o bien 10X+7Y+26=0
3.- Cuando tenemos el punto (0,b) decimos que una recta corta el eje “Y” y se
denomina intercepción Y; asimismo indicamos que b es la ordenada en el origen.
y = mx+b
pendiente m
(0,b)
x
Ejemplo económico:
1− 4 − 3 3
tenemos que m = 6 − 2 = 4 = − 4
p
10
5 (2, 4)
(6, 1)
0 q
-5 0 5 10 15
-5
ello significa que por cada aumento unitario en q, ocasiona una disminución de ¾
en P.
Un fabricante dispone de 100 kilos de material con el que puede producir dos
productos, A y B, que requieren de 4 y 2 kilos de material por unidad,
respectivamente. Si X y Y denotan A y B, entonces todos los niveles de producción
están dados por los cambios de X y Y que satisfacen la ecuación:
p
50
(0, 50)
40
30 (10, 30)
20
10
q
0
0 5 10 15
Uso de la sumatoria ∑
n
Como se usará mucho, sabemos que con propiedad se escribe ∑
i= 1
donde i=1,2,...n,
y que n = tamaño de la muestra; sin embargo, en lo sucesivo y por motivos
prácticos simplemente se escribirá ∑ , sin que se olvide su representatividad
apropiada.
Con base en los conceptos y supuestos básicos antes expuestos, ahora estamos en
condiciones de iniciar su aplicación al ámbito econo métrico, es decir, los utilizaremos
para expresar y desarrollar la terminología y métodos de esta disciplina aplicada a la
ciencia económica, mediante la construcción de mo delos. .
Esto nos índica la distribución que tienen las variables, si tienen la forma anterior,
inmediatamente se ve que el ajuste o ecuación a manejar es lineal.
Cualesquiera que sea la forma funcional seleccionada, y una vez determinada cuál
es la variable dependiente (Y) y cuál es la independiente (X), ésta tiene una
“ecuación de regresión” cuyos parámetros ( también llamados estimadores) o
coeficientes de regresión se obtienen con el método de denominado de “m ínimos
cuadrados”, porque está demostrado en párrafos adelante que la suma de las
diferencias elevadas al cuadrado entre los valores reales y los observados de una
muestra es un mínimo, es decir:
Y
Yˆ = a + bX
X
h
Valores
Valores reales estimados
Así, para hallar los valores de los estimadores ( en el caso de la recta, digamos
los valores de a y b) se usa el sistema de ecuaciones normales , cuya solución
mediante cualesquiera de los métodos para encontrar los valores de las
incógnitas en un sistema de ecuaciones simultaneas, permite hallar los valores
de a y b, mismos que constituyen la parte sustantiva de la ecuación de regresión
( en el caso de la recta: Y= a+bX) mediante la cual se obtiene un mínim o en la
diferencia entre los valores reales y estimados.
∑ (Y − a − bX i ) hacemos
2
Q= i
∂Q
∂a
= 0⇒ ∑ 2(Yˆi − a − bX i )(− 1) = 0
2∑ (Yˆi − a + bX i )(− 1) = 0
− 2∑ (Yˆi − ∑ a + b∑ X i )(− 1) = 0
− 2∑ Yi + 2∑ a + 2b∑ X i = 0
∑ Yi = na + b∑ X i
si dividimos entre n
Y = a + bX
∂Q
Ahora = 0 ⇒ 2∑ ( Yi − a − bX i ) (− X i )
∂b
∑ ( 2Y − 2a − 2bX ) (− X )
i i i
− 2∑ Y X + 2a ∑ X + 2b∑
i i i X2 = 0
∑ Yi X i = a ∑ X i + b∑ X 2
∑ Yi = na + b∑ X i (1)
∑ X i Yi = a ∑ X i + b∑ X i2 (2)
Ahora bien, en el caso de la correlación los valores del coeficiente oscilan entre 0,
1 y -1. Cuando r tiende a cero, se dice que hay una nula relación o correlación
entre X y Y.
Cuando r tiende a uno, se dice que hay una fuerte relación o correlación entre X y
Y, tal que X es una buena variable explicativa de Y. Es decir, podemos explicar el
comportamiento de Y basándonos en el comportamiento de X. En este caso se dice
que a medida que aumenta X, Y también lo hace.
Gráficamente:
Y
y=f(x)
Igualmente cuando r tiende a -1, también hay una fuerte correlación ó relación
entre X y Y, por lo que la primera sirve para explicar ó determinar adecuadamente
los cambios en Y. Pero en este caso a medida que X aumenta Y disminuye.
Gráficamente:
Título de l
e je y=f(x)
Título de l e je
∑ xy , ,
donde x , = x − x , y y , = y − y
r=
∑ x ∑ y
,2 ,2
x=
∑ xi
=
1178.40
= 196.40 y=
∑ xi
=
804.80
= 134.13
n 6 n 6
21234.22
r=
∑ x, y, r=
( 53987.54) (8423.3933)
= .9957
∑ x ,2 ∑ y' 2
Por lo tanto r=.9957 lo cual significa que hay una gran relación o correlación entre
X (circulación monetaria), y Y (nivel general de precios), a medida que aumenta X,
aumenta Y tal que si graficamos los datos anteriores obtenemos una curva con
pendiente positiva.
Gráficamente:
Y=f(x)
Título de l e je
La forma funcional Y=f(x) puede tener la forma funcional cuadrática cuya ecuación
es: Y=a+bx+cx 2 , exponencial Y=ab x etc. En cualquier caso, se le llama “ecuación
de regresión” y los valores de los parámetros se determinan con las “ecuaciones
normales”. El número de ecuaciones normales viene dado por el número de
parám etros a determinar. En el caso de la ecuación lineal los parámetros a
determinar son “a” y “b” luego se necesitan dos ecuaciones normales las cuales
son:
∑ y = na + b∑ x (1)
∑ xy = a ∑ x + b∑ x 2
(2)
∑ y = na + b∑ x + c∑ x 2 (1)
∑ xy = a ∑ x + b∑ x 2 + c ∑ x 3 (2)
∑ x y = a∑ x + b∑ x 3 + c ∑ x 4
2 2
(3)
En el caso de un polinomio:
Y=a +bx+cz+dQ
∑ y = na + b ∑ x + c ∑ z + d ∑ Q (1)
∑ xy = a ∑ x + b ∑ x 2 + c ∑ xz + d ∑ Qx (2)
∑ zy = a ∑ z + b ∑ xz + c ∑ z 2 + d ∑ Qz (3)
∑ Qy = a ∑ Q + b ∑ xQ + c ∑ zQ + d ∑ Q 2 (4)
Ejemplo adicional:
Añ o ( x ) P r o d u c c i ó n d e T r i g o ( y)
x2 y2 x* y ŷ e = y − yˆ
1 1 1 1 1 1.6 -0.6
2 3 4 9 6 2.5 0.5
3 2 9 4 6 3.4 -1.4
4 6 16 36 24 4.3 1.7
5 7 25 49 35 5.2 1.8
6 4 36 16 24 6.1 -2.1
Total 23 91 115 96 23.0 0.0
X
0 10 20 30
∑Y = Na+b∑X
∑YX =a∑X+b∑X 2
Sustituyendo:
23 = 6a + 21b
96 =21a + 91b
a = 96-91b/21 = 23-21b/6 = 576-546b = 483-441b = 93 = 105b de donde:
93
b= = 0.8857 , sustituyendo en
105
b∑ x + n∑ a = y que es igual a (0.8857)*21+ 6a = 23 quedando
6a=23-18.5997=4.4003
a = 4.4003/6 = 0.7333 así a = 0.7333
Ŷ 1 =0.8857(1) + 0.7333=1.6
Ŷ 2 =0.8857(2) + 0.7333=2.5
Ŷ 3 =0.8857(3) + 0.7333=3.4
Ŷ 4 =0.8857(4) + 0.7333=4.3
Ŷ 5 =0.8857(5) + 0.7333=5.2
Ŷ 6 =0.8857(6) + 0.7333=6.1
Como esto es una estimación podemos calcular el error estándar de la estim ación,
otros le llaman error estándar de la regresión, cuya fórmula es:.
∑ ( y − yˆ )
2
σˆ =
n− 2
e = y − yˆ e 2 = ( y − ŷ )
2
-0.6190 0.3832
0.4952 0.2453
-1.3905 1.9334
1.7238 2.9715
1.8381 3.3786
-2.0476 4.1927
0.0000 13.1047
σˆ =
(13.1047 ) =3.2761= 1.81
6− 2
Interpretación de σˆ : Su valor de 1.81 indica que el ajuste de la recta a los valores reales es
bueno, en otras palabras, todos ellos difieren en promedio en 1.81.Vemos que los valores de los
estimadores han permitido obtener diferencias mínimas entre los valores reales y estimados,
situación que da confianza porque la variación entre ellos es aceptable estadísticamente, dados los
valores reales de Y.
( y − yˆ ) 2
Derivado de lo anterior tendremos que también σ 2 = ∑ =3.2761 que sirve
n− 2
para hacer algunas manipulaciones algebraicas con las cuales posteriormente se
harán algunas demostraciones sobre las propiedades de los estimadores.
Donde x =
∑ xi = 21 = 35
. ;Y = ∑ yi
=
23
= 3.83
n 6 n 6
r=
∑ x, y ,
=
15.50
= r = 15.50 = 0.7152
∑ x,2 ∑ y2 (17.50) (26.8333) 21.6698
La fórmula de S. Shao es 6 :
σ 2
yx
El coeficiente de determinación R yx = 1 −
2
σ 2
y
R = 1−
2 ∑ e2
,R =
2 ∑ yˆ 2
R2 =
Varianza exp licada
2 ,
∑ y2 ∑ y
Varianza total
∑ ( y − yˆ )
2
13.1048
Donde: σ 2
yx = = = 2.1841
n 6
∑ ( y − y)
2
26.8333
σ 2
y = = = 4.4722
n n
2.1841
R2yx = 1 − = 1 − 0.4884 = 0.5116
4.4722
Con las referencias anteriores ahora podemos decir que existen tres tipos (idem,
91) de variaciones relacionadas entre si, las cuales son:
Por su importancia diremos también que SCE mide pues la desviación de cada valor
de Y real y el que da la línea de regresión verdadera ( pero no observada). Se
origina entre otras causas por: 1.- hay variables independientes que tienen efectos
parciales e irregulares sobre Y, que son omitidos de la relación lineal exacta ; 2.-
porque quizás existen errores en la medición de Y y 3.- por lo impredecible de la
conducta humana.
a = Yi − bX i
S YY = ∑ (Y − Y )
i i
2
= ∑ Yi 2 − nYi 2
S XY = ∑ (X − X i i )(Yi − Yi ) = ∑ X i Yi − nX i Yi
así como S XX = ∑ (Xi − Xi ) = 2
∑ X i2 − nX 12
S XY
La ecuación (3) se puede denotar como bS X X =S X Y obteniéndose b = así como
S XX
a = Yˆ − bXˆ
Ahora bien para obtener el coeficiente de determinación (r 2 ), recordemos que los
residuos estimados son ei = Yi − a − bX i , mismos que satisfacen ∑ ei = 0 y ∑ X i ei = 0
Si denotamos la suma de cuadrados residuales con RSS donde
RSS = ∑ ( Yi − a − bX i )
2
=∑ [Y − Y
i i − b( X i − X i ) ] 2
= ∑ ( Yi − Yi ) + b ∑ ( X i − X i ) + 2b∑ ( Yi − Yi )( X i − X i )
2 2 2
= S YY + b 2 S XX − 2bS XY
2
S XY S XY
Puesto que b = , se tiene RSS = S YY − = S YY − bS XY
S XX S XX
Si expresamos S Y Y como TSS= Suma de Cuadrados Total, también a bS X Y con ESS
como la suma de cuadrados explicada, decimos que:
TSS = ESS + RSS.
(Total)=(Explicada)(residual)
2 ESS
Ahora si denotamos con rXY =coeficiente de determinación de X en Y = y
TSS
RSS
1 − rXY
2
= decimos que rXY 2
explica el efecto de X en Y y que 1 − rXY 2
es la
TSS
proporción no explicada por X, o en otras palabras, éste último indica la
proporción del efecto de otras variables en Y, distintas a X. Derivado de lo anterior
2
S XY bS XY
rxy también se obtiene así: rXY =
2 2
=
S XX S YY S YY
En esta forma ahora se cuenta con nuevas fórmulas para obtener el coeficiente de
determinación.
Practica Número I
c) El diagrama de dispersión.
Yˆi = a + bX i
b) Forma estocástica;
Yˆi = a + bX i + ei
c) ¿Por qué se supone que la mayoría de los valores
observados de Y no caen exactamente sobre una línea recta?
Porqué hay otras variables explicativas omitidas que también tienen efecto en Y;
por errores de medición de Y i y por la aleatoriedad inherente a la conducta humana.
Para la verdadera: Yi = α + β X i + U i
Para la estimada: Yˆi = a + bX i + ei
n∑ X i Yi − ∑ X∑Y
i i (12)(225,14) − 1,740)(1,524) 49,728
b= = = = 0.86
n∑ X i2 − (∑ X )
2
i
(12)(257,112) − (1,740) 2 57,744
a = Yi − bX i =127-(0.86*145)=127-124.70=2.30
Luego la ecuación de regresión: Yˆi = 2.30 + 0.86 X i
Yˆ = 2.30 + 0.86 X i
160
CONSUMO Y
140
120
100
100 120 140 160 180
INGRESO X
Práctica Número 2.
1. ¿Qué es regresión?
Es aquella que expresa la dependencia de una variable (Y) con respecto a otra (X).
2. ¿Qué es correlación?
Es aquella que expresa, por medio del coeficiente de correlación (r), la relación o el grado de
relación entre dos variables, es decir, X e Y.
El valor de r oscila entre los valores –1 hasta + 1, pasando por el cero. En donde si r tiene un
valor de – 1, decimos que existe una fuerte relación o correlación negativa o inversa entre X e Y,
es decir, tiene una relación decreciente o lo que es lo mismo, a medida que X aumenta Y
disminuye. Si r toma el valor de + 1, entonces decimos que existe una fuerte relación positiva
entre X e Y, es decir, tiene una relación creciente, lo cual significa que a medida que X aumenta
Y también lo hace. Por último, si r tiene un valor de 0, se sostiene que existe nula relación o
correlación entre X e Y.
Para determinar la forma funcional adecuada que exprese la relación entre X e Y. Es decir, el
diagrama de dispersión nos ayuda a determinar si utilizamos, digamos, la forma funcional de la
línea recta, la parábola, la exponencial, la logarítmica, etc.
6. En Y = f (X), escriba las ecuaciones normales necesarias para hallar los valores de los
parámetros en una recta.
∑ Yi = na + b∑ X i (1)
∑ X i Yi = a ∑ X i + b∑ X i2 (2)
7. En Y = f (X), de una parábola escriba las ecuaciones normales necesarias para hallar los
valores de los parámetros.
∑ y = na + b∑ x + c ∑ x 2
(1)
∑ xy = a ∑ x + b∑ x + c ∑ x 2 3
(2)
∑ x y = a ∑ x + b∑ x + c ∑ x
2 2 3 4
(3)
d).- En una regresión múltiple , ¿ son mayores los valores de los coeficientes de
correlación, de determinación y el ajustado, que sus valores obtenidos en una
regresión simple? ¿ porqué?
∑ y = na + b∑ x + c ∑ x 2
(1)
∑ xy = a ∑ x + b∑ x + c ∑ x 2 3
(2)
∑ x y = a ∑ x + b∑ x + c ∑ x
2 2 3 4
(3)
Y=f(x)
Observar la siguiente tabla:
8a+30b+136c=40
30a+136b+684c=178
136a 684b+3652c=902
Y1 =3.5914-0.9127(6)+0.2842(6)2=8.3464
Para A
Y2 =3.5914-0.9127(5)+0.2842(5)2=6.1329
Para B
Y3 =3.5914-0.9127(3)+0.2842(3)2=3.4111
Para C
Y4=3.5914-0.9127(1)+0.2842(1)2=2.9629
Para D
Y5 =3.5914-0.9127(4)+0.2842(4)2=4.4878
Para E
Y6=3.5914-0.9127(3)+0.2842(3)2=3.4111
Para F
Y7=3.5914-0.9127(6)+0.2842(6)2=8.3464
Para G
Y8=3.5914-0.9127(2)+0.2842(2)2=2.9028
Para H
La estimación es buena y nos sirve para calcular las ventas de los vendedores y
también para calcular los coeficientes de correlación y de determinación, para esto
necesitamos hacer los siguientes cálculos:
ŷ e = ( y − yˆ ) e 2 = ( y − yˆ ) 2 (Y − Y ) (Y − Y )2
8.3464 0.6536 0.4272 4 16
6.1329 -0.1329 0.0177 1 1
3.4111 0.5889 0.3468 -1 1
2.9629 0.0371 0.0014 -2 4
4.4878 -1.4878 2.2135 -2 4
3.4111 1.5889 2.5246 0 0
8.3464 -0.3464 0.1200 3 9
2.9028 -0.9028 0.8150 -3 9
40 0.0 6.4662 0 44
∑ ( y − yˆ )
2
6.4662 luego σ 2 y x =0.8082
σ yx = = = 0.8082
n 8
2 ∑ (Y − Y ) 44
σ y = = = 5.5
n 8
σ 2
como: R y x = 1 −
2 yx
σ 2
y
En este caso: r yx = R 2 yx = 0.8530 = .9235 Lo cual revela que hay una alta
correlación o relación positiva entre X y Y, de tal forma que podemos utilizar a
(X) años de experiencia como variable independiente o explicativa de las
ventas (Y); no se tiene que recurrir a buscar otra variable independiente o
explicativa de Y, digamos quizá los precios (Z).
∑ Y = na + b∑ X 1 + c ∑ X 2 (1)
∑ YX 1 = a ∑ X 1 + b∑ X 12 + c ∑ X 1 X 2 (2)
∑ YX 2 = a ∑ X 2 + b∑ X 1 X 2 + c ∑ X 22 (3)
H 2 2 1 4 4 1 4 2 2
Total 40 30 16 24 136 38 178 94 68
4
8a+ 30b+16c= 40
30a+136b+68c=178
16a+ 68b+38c= 94
Ŷ (Y − Yˆ ) (Y − Yˆ ) 2
(Y − Y ) (Y − Y ) 2
8.0000 1.0000 1.0000 4 16
5.9091 0.0909 0.0083 1 1
4.4545 -0.4545 0.2066 -1 1
1.6364 1.3636 1.8595 -2 4
3.8182 -0.8182 0.6694 -2 4
5.8182 -0.8182 0.6694 0 0
8.0000 0.0000 0.0000 3 9
2.3636 -0.3636 0.1322 -3 9
40.0000 0.0000 4.5455 0.0 44
∑ (Y − Yˆ )
2
4.5455
0.5682 = 0.7537 por lo que σ 1 2 3 =0.5682
2
σ 123 = = =
n 8
∑ (Y − Y )
2 0.5682
2
σ 1= =
44
= 5.5 luego tendremos R 2123= 1− = .8966
n 8 5. 5
Indicando que el 89.66 % de los cambios en Y se deben a los cambios de X 1 y X 2 .
Igualmente el coeficiente de correlación será: R123= R
2
123 = 0.8966 =0.9468,
revelando que hay una fuerte correlación o relación positiva entre Y , X 1 , X 2 . Por lo
que podemos utilizar X 1 , X 2 para explicar adecuadamente a Y.
(
n xy −
∑ ∑ x∑ y )
2
n∑ y − ( ∑ y) −
2 2
n x2 −
∑ ∑ x ( )
2
2
s =
b
{
( n − 2) n ∑ x2 − ( ∑ x)
2
}
donde grados de libertad igual a n-k; k es el número de parámetros.
Más adelante observaremos que hay similitud de las literales y por consiguiente de
las cantidades entre paréntesis de esta fórmula con las que se usan para calcular a
y b , por el método de Cramer. Para encontrar S bˆ , simplemente le sacamos raíz a
esta cantidad, así:
S b
= S 2bˆ
Ejemplo:
Y X X2 XY Y2 Y e = (Y − Yˆ ) e2
5 10 100 50 25 3.3227 1.6773 2.8132
-4 -4 16 16 16 -6.6674 2.6674 7.1152
-6 4 16 -24 36 -0.9588 -5.0412 25.4141
-2 1 1 -2 4 -3.0995 1.0995 1.2089
5 16 256 80 25 7.6042 -2.6042 6.7821
-15 -10 100 150 225 -10.9489 -4.0511 16.4112
-8 -12 144 96 64 -12.3761 4.3761 19.1502
10 13 169 130 100 5.4635 4.5365 20.5799
-1 5 25 -5 1 -0.2452 -0.7548 0.5698
-10 -6 36 60 100 -8.0946 -1.9054 3.6306
ΣY=-26 ΣX= 17 ΣX 2 = 863 ΣXY=551 ΣY 2 = 596 -26.0000 0.0000 103.6751
Si la ecuación de regresión en la población es Y=a+bx.
a =
∑ x2 * ∑ y − ∑ x*∑ xy
b =
n* ∑ xy − ∑ x * ∑ y
n * ∑ x − ( ∑ x) n * ∑ x − ( ∑ x)
2 2
2 2
( 863)( − 26) − ( 17)( 551) − 31805 ( 10) ( 551) − ( 17) ( − 26) 5952
a = = = − 38131
. b = = = .7136
( 10)( 863) − ( 17) 2 8341 ( 10)( 863) − ( 17) 2 8341
Y =-3.8131+0.7136x
( n − 2) n∑ ( ∑ x)
2
x2 −
sustituyendo:
bˆ − b 0.7136 − 0
t = = = 5.7317
b S 0.1245
bˆ
Dado este valor empírico de t, nuestra tarea final es escoger la t teórica ( o de
tablas como le llaman otros autores ) con un nivel de significación al cual
probaremos la hipótesis nula Ho de que b=0. Supóngase que escogemos el 5% de
significación, con n-2=10-2=8 grados de libertad, la tabla indica que t α =±2.306,
cuya interpretación es que podemos esperar un valor positivo o negativo de b tan
grande como 2.306 si la hipótesis es cierta, es decir, sí el coeficiente de la
población es cero. Podemos esperar una diferencia entre cero y el empírico b , que
es el resultado de la selección aleatoria de la muestra, pero esta diferencia no
puede ser tan grande como para conducir a valores de t que exceden de 2.306
(positivos o negativos).
Ahora bien nuestra t empírica es mucho más grande que 2.306, por ello rechazamos
la hipótesis nula que b=0 (que no hay relación lineal entre X y Y en la población) y
aceptamos la hipótesis alternativa, Ha de que b≠0. Decimos que nuestro coeficiente
de regresión es significativo a un nivel de significación del 5%. Si la t empírica
hubiera sido menor que 2.306, diríamos que el coeficiente de regresión b =0.7136
no sería significativo. La diferencia entre b y cero sería pequeña. En este caso se
dice que hay relación lineal porque se rechazó que b=0; en concreto, aceptamos la
bondad o calidad de las estimaciones, aceptando Ha.
Aceptamos Ha Aceptamos Ha
Rechazamos Ho Rechazamos Ho
-2.306 b +2.306 tα
Por otra parte para calcular los límites o bandas de confianza, se parte del
razonamiento de que algunos parámetros poblacionales se pueden estimar
calculando el intervalo o banda de confianza en torno al valor del estimador; si el
valor hipotético del parámetro esta contenido dentro del intervalo, se acepta la
hipótesis; si no, se rechaza. Ahora bien si el nivel de significación es de 5%, ello
equivale al error de excluir el valor correcto del parámetro poblacional del
intervalo de confianza. Por ello la probabilidad de incluirlo en el intervalo de
confianza es de 95%. Decir que b es significativo al 5% de nivel de significación,
es decir que la probabilidad es de 95%, que los limites de confianza incluyen o
contengan el verdadero parámetro poblacional.
a) 0.7136-b=+2.306(0.1245)=0.2871
b=0.7136-0.2871=0.4265 = Límite inferior
b) 0.7136-b=-2.306(0.1245)=-0.2871
b=0.7136 + 0.2871=1.0007 = Límite superior
Comparación de S bˆ con σˆ
∑ (Y − Yˆ ) = 103.64 = 3.5999
2
Coeficiente de correlación:
Se prueba que Ho: r=0 y la contrastamos con la hipótesis alternativa de que Ha: r
es diferente de cero. Si verificamos que r=0 índica que X no explica a Y.
r n− 2
Se hace con la fórmula t= luego trabajando con los datos de la tabla
1− R2
anterior y sabiendo que n=10; r=0.897 y R 2 =0.805 tenemos
0.897 8 0.897( 2.37)
t= = = 5.74 .
1 − 0.805 0.442
Puesto que con α=5% y 8 grados de libertad la tabla dice que t α =±2.306
rechazamos la hipótesis que r=0 y decimos que r es significativo con α=5%; que x
explica el 80% de los cambios en Y, el 20% restante los explican otras variables
denotadas por “ ei ”.
De esta prueba de hipótesis se derivan dos propiedades:
1.-A medida que r crece es más probable que sea significativa.
2. Este valor de t=5.74 es igual al de t=5.74 cuando probamos la significación
estadística de b porqué la hipótesis de que b=0 implica la hipótesis que r=0.
8
VI. PROPIEDADES DE LOS ESTIMADORES
La inferencia que hacemos de una muestra sobre una población estadística en cierto
sentido pasa a través de la distribución de muchas muestras o de una muestra más
grande, aún cuando observamos una sola muestra de un tamaño fijo determinado.
En otras palabras, la bondad o calidad de un estimador obtenido de una muestra es
evaluada parcialmente en términos de lo que se espera que sucedería si muchas
muestras estuvieran disponibles o si el tamaño de muestra pudiera aumentarse a
nuestro antojo.
Hay cuatro propiedades que debe tener un buen estimador (o también llamado
“estadística” muestral).
I.-En las siguientes diez frases escriba en las celdas vacías correspondientes No cuando sean falsas
y SI cuando sean verdaderas:
2.- Los modelos multiecuacionales son los únicos que se usan: SI____;NO______
9.- El método de mínimos cuadrados no produce la variación mínima en los estimadores con
Suponga que el consumo (Y) y el ingreso (X) para los últimos 4 años (en millones de pesos) son los
siguientes:
Se desea probar la hipótesis de que el consumo en México depende de las variaciones que
experimenta el ingreso, ¿ es cierto? Calcule el error estándar de estimación e interprételo para
conocer la bondad en el ajuste de la recta de regresión con respecto a los valores reales u observados
de Y.
Requisitos para resolver el examen: Traer sus tablas estadísticas, calculadoras y demás
instrumentos que les ayuden a hacerlo correctamente y con eficiencia en el tiempo de dos horas.