Se sabe que el procedimiento de MCO es un procedimiento con el cual se trata de ajustar una línea de regresión sobre un conjunto de puntos que presentan un patrón de comportamiento específico, sea creciente o decreciente, la regresión que se obtiene a partir de MCO es tal que minimice la sumatoria de los residuales al cuadrado de la regresión, de eso se deduce que los residuos es una función de los estimadores,, donde es el residual, es el estimador del intercepto y , es el estimador de pendiente.
La línea recta que debe pasar por los puntos medios de la variable dependiente como de la variable independiente tiene la forma siguiente:
Ecuación 1
Pero dado que se tiene que estimar, entonces la ecuación 1, se debe reescribir en su versión muestral y se obtiene:
Para obtener la forma de los estimadores y primero tenemos que designar las observaciones muestrales por
De manera más compacta se puede escribir
Diferentes pares de valores de y darán diferentes líneas y, en consecuencia, valores diferentes para la suma de los cuadrados de los residuos respecto a la línea. Así tendremos:
Como se ha señalado anteriormente, el principio del método MCO es que los valores y deberán escogerse de tal forma que hagan a lo más pequeña posible. Una condición necesaria es que es que las condiciones de primer orden con respecto a y deberán ser iguales a cero. Podremos escribir por lo tanto,
de modo que
Simplificando estas dos ecuaciones se obtiene el sistema clásico de ecuaciones normales para una línea recta:
Ecuación 2
Ecuación 3
Con los valores conocidos de las observaciones muestrales se tiene un sistema de ecuaciones simultáneas (dos ecuaciones y dos variables) que pude resolverse con respecto a y
Por otra parte, si se divide la primera de las ecuaciones por , obtendremos:
Esta última ecuación confirma el hecho de que la estimación de la línea de regresión por el método MCO pasa por el punto cuyas coordenadas son las medias
De esta misma se puede obtener el valor de
Ecuación 4
Si a los valores estimados de se les sustraen los valores medios de se tiene:
Recordando la convención de representar las desviaciones por letras minúsculas, la última ecuación se puede escribir de la siguiente manera:
Recordando que los residuos se expresan de la siguiente manera;
De forma que la suma de los cuadrados de los residuos es
Minimizando esta última expresión y resolviendo con respecto a se tiene
Ecuación 5
y vemos también que
que es positiva, lo que se trata de un mínimo.
El resultado de la ecuación de puede también obtenerse simplemente escribiendo de nuevo la ecuación 3 en forma de desviaciones y recordando que para cualquier variable la suma de las desviaciones a la media es cero. Es decir,
Como ejemplo de cálculo de la regresión basada en MCO, consideremos los datos de la tabla siguiente
año
(1)
|
accidentes de carretera (en miles)
Y
(2)
|
vehículos matriculados
X
(3)
|
(4)
|
(5)
|
1947
|
166
|
352
|
-51.8
|
-167.2
|
1948
|
153
|
373
|
-64.8
|
-146.2
|
1949
|
177
|
411
|
-40.8
|
-108.2
|
1950
|
201
|
441
|
-16.8
|
-78.2
|
1951
|
216
|
462
|
-1.8
|
-57.2
|
1952
|
208
|
490
|
-9.8
|
-29.2
|
1953
|
227
|
529
|
9.2
|
9.8
|
1954
|
238
|
577
|
20.2
|
57.8
|
1955
|
268
|
641
|
50.2
|
121.8
|
1956
|
268
|
692
|
50.2
|
172.8
|
1957
|
274
|
743
|
56.2
|
223.8
|
De las columnas 2 y 3 calculamos las siguientes cantidades exigidas por las ecuaciones 2 y 3.
Sustituyendo en ecuación 2 y 3 se obtiene:
Sistema que resuelto da:
y la relación estimada se puede escribir
Como método alternativo calculamos las desviaciones a la media aritmética en las columnas 4 y 5 y, luego, de la Ecuación 4 y 5 obtenemos como antes
¿Ha sido clara esta sección? ¿Te ha sido de utilidad? Deja tu comentario!!!
Jilber Urbina