Continuando con la serie...
También es conveniente determinar el error estándar de la regresión para poder establecer un intervalo de confianza
Sea Se= error estándar de la regresión
Se=
raiz de
∑Y² - a ∑Y – b ∑ XY /
n - 2
Por lo tanto……….
raiz de
208250 – (110 * 1210) – (25,59 * 2815) /
Se = 11 - 2
Se = 18,6 ERROR ESTANDAR (DEL ESTIMADO DE LA REGRESION)
Este valor servirá para calcular el intervalo de confianza
Un intervalo de confianza se determina de la siguiente manera, con un
1° 68% de probabilidad (^Y +- Se)
2° 95% de probabilidad (^Y +-2Se)
3° 99% de probabilidad (^Y+-3Se)
Según la regresión, las ventas estimadas para 1990 son 263,54 millones
· con un 68% de probabilidad las ventas estarán entre:
(^Y - Se) ; (^Y + Se)
= ( 263.54 - 18.6 ) ; ( 263.54 + 18.6 )
= 244.94 ; 282.14
Con un 68% de probabilidad las ventas estarán entre: 244.94 y 282.14 millones
· con un 95% de probabilidad las ventas estarán entre:
(^Y - 2Se) ; (^Y + 2Se)
= ( 263.54 – ( 2 * 18.6 9 ) ; 263.54 + ( 2 * 18.6 ) )
= ( 226.34 ; 300.74 )
Con un 95% de probabilidad las ventas estarán entre: 226.34 y 300.74 millones
· con un 99% de probabilidad las ventas estarán entre:
(^Y - 3Se) ; (^Y + 3Se)
= ( 263.54 – ( 3 * 18.6 9 ) ; 263.54 + ( 3 * 18.6 ) )
= ( 207.74 ; 319.34 )
Con un 99% de probabilidad las ventas estarán entre: 207.74 y 319.34 millones
Podemos apreciar que mientras mayor sea el margen de error aceptado, más pequeños serán los intervalos. Por otra parte, mientras menor probabilidad de error (margen) aceptemos, más grandes serán los intervalos.
Regresión múltiple
En muchos casos las predicciones satisfactorias de las ventas pueden estar basadas en una sola variable, por ejemplo, las ventas históricas; esto sucede con aquellos productos cuya demanda depende fuertemente de la población, ya que la tasa de crecimiento se expresa como una función anual
Por ejemplo, ciertos tipos de ropa infantil, el pan, etc. Sin embargo, existen varios productos donde la exactitud puede mejorarse sustancialmente si la predicción se basa en dos o más variables independientes
Para estimaciones de eventos, puede haber 2 o más variables, por ejemplo, PNB, inversión publicitaria, precio de algún producto sustituto, etc.
Para resolver el modelo se utiliza cualquier paquete de aplicación estadística existente en el mercado el que entregará los resultados. Lo importante es saber analizar los datos obtenidos
Pruebas de significancia de una relación
¿Existe una relación significativa entre X e Y?
Recordemos el primer ejemplo:
^Y= 110 + 25.59 ^X
Lo anterior nos permite deducir que por cada año que pase, las ventas se incrementarán en 25,59%. El coeficiente de regresión 25,59% es un estimado de un parámetro de la población. Una muestra particular puede mostrar una relación aunque no exista ninguna, solamente por puro azar. Si no existe ninguna relación en la realidad, la pendiente de le línea de regresión sería 0 (recuérdese que la pendiente de la ecuación de la regresión está dada por el valor de b)
Podemos efectuar un test de hipótesis, que consiste básicamente en establecer una hipótesis nula y una hipótesis alternativa
Sea B parámetro de población (b es el parámetro muestral)
· 1° hipótesis nula : B = 0
No existe ninguna relación entre el comportamiento histórico y las ventas programadas
· 2° hipótesis alternativa: B ≠ 0
El comportamiento histórico si explica la variación en las ventas
Si aceptamos la hipótesis nula, rechazamos la hipótesis alternativa
La comprobar la hipótesis nula se determina el error estándar del coeficiente de regresión B (Sb)
Sb = Se /
raiz de ∑ ( X – PROM X)²
Sb = Se /
raiz de ∑ X² – PROM X ∑ X
Cualquiera de las dos fórmulas da lo mismo. Para el ejemplo ocuparemos la segunda
Sb = 18.6 /
raiz de 110 – 0 * 0
Sb = 18.6 /
raiz de 110
Sb = 1,77
Esto quiere decir que si la hipótesis nula es verdadera, b está a 25.59 unidades de B
En términos de su error estándar b /
Sb , es decir,
25.59 /
1.77
= 14.45
Esto indica que b está a 14,45 errores estándar de B.
Una desviación de mas de 2 errores estándar es comúnmente considerada como significativa, por lo tanto es bajísima la posibilidad que una desviación tan grande como 14,45 errores estándar pueda ocurrir al azar, luego se rechaza la hipótesis nula y se acepta la alternativa, es decir, existe una relación significativa entre el comportamiento histórico y las ventas futuras
Este valor de 14,45 se llama valor t del coeficiente DE REGRESIÓN
t = b /
Sb
Sintetizando:
Cuando t> o igual que 2, el coeficiente de regresión es significativo.
Mientras mas altos sean los valores de t, aumenta la confianza en el valor del coeficiente como un elemento de producción.
No hay comentarios:
Publicar un comentario