Una compañía local de energía seleccionó una residencia típica para desarrollar un modelo empírico para el consumo de energía (en kilo watts por día) como una función de la temperatura promedio diaria durante los meses de invierno. Se obtuvo la siguiente información durante un periodo de 15 días.
Temperatura (C) 0 8 7.5 13.5 14 8.5 4.5 -11
Consumo de energía 70 57 60 63 57 66 67 107
--------------------------------------------------------------------------------
Temperatura (C) -7.5 -8.5 1.5 0.5 2 -6 -4
Consumo de energía 96 88 80 64 79 82 97
a) Grafique los datos. ¿Sugiere la gráfica una asociación lineal?
b) Para un modelo lineal simple, obtener la ecuación estimada de regresión y grafíquese sobre la gráfica realizada en a).
c) Interpretar los coeficientes de regresión estimados.
d) Estimar los consumos individuales de energía para las siguientes temperaturas: -10, -8, -5, -2, 1, 4, 7, 10 y 13. Obtener intervalos de predicción del 95% para los estimadores.
Respuestas a la pregunta
Encontrarás una gráfica con la regresión lineal entre la temperatura y el consumo de energía.
- En la gráfica podemos notar una relación inversa entre la temperatura y el consumo de energía. Es decir, cuando aumenta la temperatura, disminuye el consumo de energía.
- La función de la recta obtenida es f(x) = -1,7775x + 78,259.
- El coeficiente de correlación de la regresión es R² = 0,7771.
- El intervalo de confianza del 95% para el consumo de energía es X ± 8.
Procedimiento:
Una vez organizados los datos en un programa como Excel, se puede realizar la gráfica de dispersión. A la gráfica obtenida se le puede agregar la línea de tendencia, la función de la recta y la correlación.
Otras formas de obtener la línea de tendencia es calculando la dispersión y obteniendo los valores medios. Esto también nos permitirá calcular la función de la regresión con la ecuación de la recta:
- El coeficiente de correlación indica el ajuste de la regresión lineal con los puntos en la dispersión. Al obtener la raíz cuadrada del valor, tenemos el coeficiente de dispersión , esto nos indica que los valores se encuentran centrados sobre la recta en un 88%, es decir sólo el 12% de los puntos están dispersos.
- Valores estimados:
En la tabla a la derecha de la gráfica, podemos encontrar los valores estimados a partir de la función de la recta. Por ejemplo para una temperatura de 1 ºC:
Es decir, el consumo estimado es de 76.
- Para calcular el intervalo de confianza:
A partir de los datos (en la tabla a la izquierda) calculamos la desviación estándar. Obtenemos S = 15,84. Para una confianza del 95% calculamos el valor de con α = 0,05 tenemos (1 - 0,05÷2 = 0,975). Este valor de Z lo podemos ubicar en una tabla de distribución normal o en Excel con la siguiente formula =DISTR. NORM. ESTAND. INV(0,975.). Así obtenemos Z = 1,96. Con n = 15 días, podemos calcular el intervalo con la siguiente expresión:
Sustituyendo los valores:
.
Así tenemos el intervalo X ± 8, es decir en el ejemplo anterior del consumo de energía para 1 ºC, el valor correcto sería 76 ± 8.