Получение оценок коэффициентов регрессии и проверка их достоверности не являются самоцелью, это лишь необходимый промежуточный этап. Основное – это использовать модель для анализа и прогноза значений изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в полученную формулу регрессии.
Используем полученное в примере 1.1 (прил.4) уравнение регрессии для прогноза объема товарооборота. Если намечается открыть магазин с численностью работников х =140 чел., то обоснованный объем товарооборота устанавливается по уравнению ŷ (х )= –0,974 + 0,01924×140=1,72 млрд. рублей.
Доверительный интервал для прогноза значения у (х )=a 0 +a 1 х определяется по формуле
где t p – критическая граница распределения Стьюдента с n – 2 степенями свободы, соответствующая уровню значимости р . Для получения доверительного интервала воспользуемся выражением (2.2).
Выберем уровень значимости 5%. Количество степеней свободы у нас 8 – 2 = 6, тогда по таблице распределения Стьюдента (приложение 1) находим
t 0.05 (6)=2,447.s= =0,089,
следовательно, с вероятностью 95% истинные значения объемов товарооборота будут лежать в пределах
1,72 – 2,447×0,048<y (x )<1,72+2,447×0,048, или 1,60<y (x )<1,84.
2.8. Практический блок
Пример. Построить уравнение регрессии между заданными переменными, проверить её адекватность, сделать прогноз методом экстраполяции.
1 . Построить диаграмму рассеяния в EXCELи сделать заключение о наличии корреляции.
Таблица 2.6Диаграмма 2.1
Y | x |
29,5 | 2,1 |
34,2 | 2,9 |
30,6 | 3,3 |
35,2 | 3,8 |
40,7 | 4,2 |
44,5 | 3,9 |
47,2 | 5,0 |
55,2 | 4,9 |
51,8 | 6,3 |
56,7 | 5,8 |
Из диаграммы 2.1 видно, что между переменнымиx и y имеется сильная линейная связь .
Таблица2.7
№ | xy | |||||||
29,5 | 2,1 | 61,95 | 4,41 | 870,25 | 27,91 | 0,054 | 1,59 | |
34,2 | 2,9 | 99,18 | 8,41 | 1169,64 | 33,46 | 0,022 | 0,74 | |
30,6 | 3,3 | 100,98 | 10,89 | 936,36 | 36,23 | 0,184 | -5,63 | |
35,2 | 3,8 | 133,76 | 14,44 | 1239,04 | 39,69 | 0,128 | -4,49 | |
40,7 | 4,2 | 170,94 | 17,64 | 1656,49 | 42,47 | 0,043 | -1,77 | |
44,5 | 3,9 | 173,55 | 15,21 | 1980,25 | 40,39 | 0,092 | 4,11 | |
47,2 | 5,0 | 2227,84 | 48,01 | 0,017 | -0,81 | |||
55,2 | 4,9 | 270,48 | 24,01 | 3047,04 | 47,32 | 0,143 | 7,88 | |
51,8 | 6,3 | 326,34 | 39,69 | 2683,24 | 57,02 | 0,101 | -5,22 | |
56,7 | 5,8 | 328,86 | 33,64 | 3214,89 | 53,55 | 0,056 | 3,15 | |
ИТОГО: | 42,2 | 1902,04 | 193,34 | 19025,04 | 0,840 | |||
Среднее | 42,6 | 4,22 | 190,204 | 19,334 | 1902,504 |
2.1.Теснота связи между переменными:
;
Вывод: сильная связь.
2.2.Проверим по критерию Стьюдента статистическую значимость:
По критерию Стьюдента: t выб <=t кр
Гипотеза Н о: r=0,t кр =2,31,
t выб =r выб *
Так какt выб =5,84
3. Записать систему нормальных уравнений для коэффициентов линейной регрессии. Используя метод наименьших квадратов, рассчитайте эти коэффициенты.
Подставляя в найденное уравнение регрессии значения (графа (3) табл.2.7), рассчитаем значения (графа (7) табл.2.7).
4. Для полученного уравнения регрессии между Х и У рассчитать среднюю ошибку аппроксимации. Сделать заключение об адекватности полученной модели.
Заполним 8-ю и 9-ю графу табл.2.7.
<Екр=12%
Модель признается удовлетворительной.
5 . Проверить значимость коэффициента a 1 уравнения регрессии, используя критерий Стьюдента.
Решение: Таблица 2.8
№ | ||||||
29,5 | 2,1 | 27,91 | 214,623 | 2,5281 | 170,564 | |
34,2 | 2,9 | 33,46 | 82,81 | 0,5476 | 69,8896 | |
30,6 | 3,3 | 36,23 | 40,069 | 31,6969 | 143,0416 | |
35,2 | 3,8 | 39,69 | 8,237 | 20,1601 | 54,1696 | |
40,7 | 4,2 | 42,47 | 0,008 | 3,1329 | 3,46 | |
44,5 | 3,9 | 40,39 | 4,709 | 16,8921 | 3,7636 | |
47,2 | 48,01 | 29,703 | 0,6561 | 21,5296 | ||
55,2 | 4,9 | 47,32 | 22,658 | 62,0944 | 159,7696 | |
51,8 | 6,3 | 57,02 | 209,092 | 27,2484 | 85,3776 | |
56,7 | 5,8 | 53,55 | 120,78 | 9,9225 | 199,9396 | |
ИТОГО: | 425,6 | 42,2 | 426,1 | 732,687 | 174,8791 | 911,504 |
Среднее | 42,56 | 4,22 |
Статистическая проверка:
Выводы: С доверительной вероятностью 0.9 коэффициент a 1 является статистически значимым, таким образом, гипотеза отвергается.
6. Проверить адекватность уравнения регрессии в целом, применив F-критерий Фишера-Снедекора.
Статистическая проверка:
:модель не адекватна
Так какF выб >F кр, то отвергается гипотеза (принимается альтернативная)с доверительной вероятностью 0.95. Данная модель адекватна и может использоваться для прогнозирования при принятии управленческих решений.
(таб. 2.8).
Доля вариации.
Таким образом, 80% вариации объясняемой переменной объясняется включенным в модель фактором, а 20% факторами, не включенными в модель.
Тесноту связи между переменными для произвольной связи показывает эмпирическое корреляционное отношение, при линейной связи , и коэффициент корреляции равен коэффициенту детерминации.
9 . Выполнить точечный прогноз для .
Исходные данные,
Точечный прогноз,
Линию регрессии,
90% доверительные интервалы.
Сформулировать общие выводы относительно полученной регрессионной модели.
-математическое ожидание среднего.
Чтобы выполнить интервальный прогноз рассмотрим две области.
а) доверительные границы уравнения регрессии дляy из области значений переменнойx рассчитаем по формуле:
б) для прогнозных значений доверительный интервал для рассчитаем по формуле:
Имеем:n=10, t=2,31(таб. Приложение 1),
19,334-4,22 2)=1,53.
: 27,9; 42,6; 57,0; 66,7
Таблица 2.9
№ | |||||||||||
1 | 2,1 | -2,12 | 1,74 | 3,03 | 4,49 | 2,31 | 4,68 | 27,9 | 18,81 | 9,10 | 46,72 |
4,22 | 0,00 | 0,32 | 0,1 | 0,00 | 2,31 | 4,68 | 42,6 | 3,46 | 39,10 | 46,02 | |
6,3 | 2,08 | 1,71 | 2,93 | 4,33 | 2,31 | 4,68 | 57,0 | 18,49 | 38,53 | 75,51 | |
7,7 | 3,48 | 9,02 | 12,11 | 2,31 | 4,68 | 66,7 | 32,43 | 34,29 | 99,15 |
Т.к. 90% точек наблюдения находится в 90% - доверительном интервале, данная модель с ее доверительными границами может использоваться для прогнозирования с доверительной вероятностью 0,9.
Контрольные вопросы
1. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.
2. Виды автокорреляции и их краткая характеристика.
3. Автокорреляция в остатках и порядок её обнаружения.
4. Виды автокорреляции в остатках.
5. Порядок использования критерия Дарбина-Уотсона.
6. Автокорреляция в исходных данных и порядок определения её наличия.
7. Методы устранения влияния автокорреляции на результаты прогнозирования.
8. Обобщенный метод наименьших квадратов (ОМНК).
9. Что понимается под гомоскедастичностью?
10. Как проверяется гипотеза о гомоскедастичности ряда остатков?
11. Оценка качества регрессии. Проверка адекватности и достоверности модели.
12. Значимость коэффициентов регрессии (критерий Стъюдента).
13. Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).
14. Коэффициенты и индексы корреляции. Мультиколлениарность.
15. Оценка значимости корреляции. Детерминация.
16. Средняя ошибка аппроксимации.
17. Принятие решений на основе уравнений регрессии.
18. В каких задачах эконометрики используется распределение Фишера?
19. Таблицы каких распределений используются при оценке качества линейной регрессии?
20. Каковы особенности практического применения регрессионных моделей?
21. Как осуществляется прогнозирование экономических показателей с использованием моделей линейной регрессии?
22. Как можно оценить «естественный» уровень безработицы с использованием модели линейной регрессии?
23. В каких случаях необходимо уточнение линейной регрессионной модели и как оно осуществляется?
24. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?
Задания и задачи
1 . Имеются данные о показателях деятельности компаний США в 2006г.
№ п/п | Чистая прибыль, млрд$,у | Использованный капитал, млрд $,х 1 | Оборот капитала, млрд$,х 2 | Капитализация компании, млрд$, х 4 | Численность сотрудников, тыс.чел., х 3 |
0,9 | 18,9 | 31,3 | 40,9 | 43,0 | |
1,7 | 13,7 | 13,4 | 40,5 | 64,7 | |
0,7 | 18,5 | 4,5 | 38,9 | 24,0 | |
1,7 | 4,8 | 10,0 | 38,5 | 50,2 | |
2,6 | 21,8 | 20,0 | 37,3 | 106,0 | |
1,3 | 5,8 | 15,0 | 26,5 | 96,6 | |
4,1 | 99,0 | 137,1 | 37,0 | 347,0 | |
1,6 | 20,1 | 17,9 | 36,8 | 85,6 | |
6,9 | 60,6 | 165,4 | 36,3 | 745,0 | |
0,4 | 1,4 | 2,0 | 35,3 | 4,1 | |
1,3 | 8,0 | 6,8 | 35,3 | 26,8 | |
1,9 | 18,9 | 27,1 | 35,0 | 42,7 | |
1,9 | 13,2 | 13,4 | 26,2 | 61,8 | |
1,4 | 12,6 | 9,8 | 33,1 | 212,0 | |
0,4 | 12,2 | 19,5 | 32,7 | 105,0 | |
0,8 | 3,2 | 6,8 | 32,1 | 33,5 | |
1,8 | 13,0 | 27,0 | 30,5 | 142,0 | |
0,9 | 6,9 | 12,4 | 29,8 | 96,0 | |
1,1 | 15,0 | 17,7 | 25,4 | 140,0 | |
1,9 | 11,9 | 12,7 | 29,3 | 59,3 | |
-0,9 | 1,6 | 21,4 | 29,2 | 131,0 | |
1,3 | 8,6 | 13,5 | 29,2 | 70,7 | |
2,0 | 11,5 | 13,4 | 29,1 | 65,4 | |
0,6 | 1,9 | 4,2 | 27,9 | 23,1 | |
0,7 | 5.8 | 15,5 | 27,2 | 80,8 |
2. Имеются данные о показателях деятельности компаний США в 2009г.
№ п/п | Чистая прибыль, млрд $, у | Использованный капитал, млрд $.х 1 | Оборот капитала, млрд$, х 2 | Численность, тыс. чел., х 3 |
6,6 | 83,6 | 6,9 | 222,0 | |
3,0 | 6,5 | 18.0 | 32,0 | |
6,5 | 50,4 | 107,9 | 82,0 | |
3,3 | 15,4 | 16,7 | 45,2 | |
0,1 | 29,6 | 79,6 | 299,3 | |
3,6 | 13,3 | 16,2 | 41,6 | |
1,5 | 5,9 | 5,9 | 17,8 | |
5,5 | 27,1 | 53,1 | 151,0 | |
2,4 | 11,2 | 18,8 | 82,3 | |
3,0 | 16,4 | 35,3 | 103,0 | |
4,2 | 32,5 | 71,9 | 225,4 | |
2,7 | 25,4 | 93,6 | 675,0 | |
1,6 | 6,4 | 10,0 | 43,8 | |
2,4 | 12,5 | 31,5 | 102,3 | |
3,3 | 14,3 | 36,7 | 105,0 | |
1,8 | 6,5 | 13,8 | 49,1 | |
2,4 | 22,7 | 64,8 | 50,4 | |
1,6 | 15,8 | 30,4 | 480,0 | |
1,4 | 9,3 | 12,1 | 71,0 | |
0,9 | 18,9 | 31,3 | 43,0 |
Одна из базовых задач, возникающих при прогнозировании, состоит в определении доверительных интервалов прогноза. Интуитивно понятно, что в базе расчета доверительности интервала прогноза должен быть положен измеритель колеблемости ряда. Чем выше эта колеблемость, тем шире интервал для прогноза. Следовательно, вопрос о доверительном интервале прогноза следует начать с рассмотрения измерителя колеблемости. Обычно таким измерителем является среднее квадратическое отклонение:
где - соответственно фактическое и расчетное значения ряда;
f – число степеней свободы, определяемое исходя из числа наблюдений (n ) и числа оцениваемых параметров.
f = n – z,
где z – число оцениваемых параметров.
К примеру, для параболы второй степени f = n – 3, третьей степени f = n – 4 и т.д.
Сумму квадратов отклонений от тренда можно разложить следующим образом:
Последнее выражение можно упростить. Допустим, что начало отсчета находится в середине ряда, тогда , а параметры а и b будут равны:
После преобразований получим:
Разность первых двух членов правой стороны равна сумме квадратов отклонений от средней арифметической, ᴛ.ᴇ. .
Таким образом,
Последнее выражение показывает, что сумма квадратов отклонений от линий тренда меньше, чем от средней арифметической.
Сумма квадратов отклонений от линий тренда, ᴛ.ᴇ. и среднее квадратическое отклонение от тренда Sy является основой при определении средней квадратической ошибки параметров.
Прежде чем приступить к определению доверительного интервала прогноза, следовало бы сделать оговорку. Дело в том, что предположение о нормальности распределения отклонений вокруг линии регрессии не может ни утверждаться и не быть проверено при анализе рядов. Дискуссии еще в 30-40-х годах пролили свет на трудности, связанные с этой проблемой. В итоге, принципиальный новый подход так и не был найден. Все предложения так или иначе связаны с определением доверительного интервала на базе оценки среднего квадратического отклонения членов ряда.
Полученные в ходе оценивания параметры не свободны от погрешности. Расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.
В общем виде доверительный интервал прогноза определяется как
где - средняя квадратическая ошибка;
Расчетное значение у t ;
Значение t -критерия Стьюдента.
В случае если t = I + L , то последнее определит значение доверительного интервала на L единиц времени.
Доверительный интервал прогноза должен учитывать не только неопределенность, но возможность отклонения, ᴛ.ᴇ. диапазон варьирования. В случае если обозначим среднюю квадратическую ошибку как S p , тогда доверительный интервал прогноза составит:
Доверительные интервалы прогноза - понятие и виды. Классификация и особенности категории "Доверительные интервалы прогноза" 2017, 2018.
При определении прогнозных значений того или иного явления с помощью экстраполяции наибольший интерес представляет, по-видимому, не сама экстраполяция – это более или менее механический прием, а определение доверительных интервалов прогноза.
Доверительные интервалы могут быть определены двояко: формально и неформально. Что касается последнего, то это дело экспертного суждения, которое выносится при качественном осмыслении результатов прогноза, сопоставлении их с другими имеющимися у эксперта данными. При этом, естественно, эксперт должен учитывать не только степень колеблемости фактических уровней вокруг тренда в прошлом, но и возможность деформации тренда в будущем (соответственно могут быть получены различные варианты прогноза).
Формальный доверительный интервал учитывает лишь ту неопределенность, которая связана с ограниченностью числа наблюдений и соответствующей неточностью найденных оценок параметров кривой. Основной вопрос, – в какой мере в будущем сохранится найденная тенденция, – естественно, не может быть решен с помощью таких доверительных интервалов. Это дело содержательного экономического анализа и экспертной оценки.
Основное внимание в данном учебном пособии уделим оценке формальных доверительных интервалов, базирующихся на статистическом анализе.
Соответствующая погрешность имеет следующие источники:
1) выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной, а тем более лучшей для экстраполяции в данных конкретных условиях;
2) оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению в пространстве свойственна некоторая неопределенность;
3) тренд характеризует средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.
Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения.
Погрешность, связанная со вторым и третьим источниками, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный прогноз преобразуется в интервальный.
Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень - время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Традиционно в качестве такого измерителя колеблемости используется среднее квадратическое (стандартное) отклонение (3.11).
Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае, смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.
В общем виде доверительный интервал для тренда определяется как:
, (4.1)
где – средняя квадратическая ошибка тренда; –расчетное значение уровня ряда; –значение t -статистики Стьюдента.
В STATISTICA при расчете доверительных интервалов прогноза величину среднего квадратического отклонения S y можно определить, воспользовавшись таблицей дисперсионного анализа (см. рис. 3.17). Рассчитанное в ячейке Residual Mean Squares значение соответствует подкоренному выражению в формуле (3.11) для S y , то есть остаточной дисперсии.Остается только извлечь из него квадратный корень ( тыс.чел.).
Один из наиболее распространенных методов прогнозирования заключается в экстраполяции, т.е. в предсказании будущего на основе данных прошлого.
Экстраполяция базируется на следующих допущениях:
§ развитие явления может быть с достаточным основанием охарактеризовано плавной траекторией - трендом;
§ общие условия, определяющие тенденцию развития в прошлом, не претерпят существенных изменений в будущем.
Таким образом, экстраполяция дает описание некоторого общего будущего развития объекта прогнозирования. Причем если развитие в прошлом носило перманентно скачкообразный характер, то при достаточно продолжительном периоде наблюдений скачки оказываются «зафиксированными» в самом тренде, и последний опять-таки можно применить в прогнозировании.
Проведем прогнозирование на основе экстраполяции лучшей формы тренда (линейной) для экспорта за период 2001-2007 гг:
Напомним, что у текущей переменной 7 уровней ряда, обозначенных натуральными числами. Соответственно прогноз динамики экспорта в 2008 (t=8) составит:
(млрд. долл)
Проведем прогнозирование на основе экстраполяции лучшей формы тренда (линейной) для импорта за период 2001-2007 гг:
Напомним, что у текущей переменной 7 уровней ряда, обозначенных натуральными числами. Соответственно прогноз динамики импорта в 2008 (t=8) составит:
(млрд. долл)
Экстраполяция дает возможность получить точечное значение прогноза, что может быть признано удовлетворительным только при наличии функциональной зависимости. Однако для экономических явлений характерна корреляционная зависимость и переменные, как правило, являются непрерывными. Следовательно, указание точечных значений прогноза, строго говоря, лишено содержания. Отсюда следует, что прогноз должен быть дан в виде интервала значений, т.е. необходимо определение доверительного интервала прогноза.
Доверительные интервалы прогноза
При составлении прогноза погрешность имеет следующие источники:
§ выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной, а тем более лучшей для экстраполяции в данных конкретных условиях;
§ оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению в пространстве свойственна некоторая неопределенность;
§ тренд характеризует средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом.
Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.
Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения.
Погрешность, связанная со вторым и третьим источниками, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный прогноз преобразуется в интервальный.
Во всяком случае, смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.
В общем виде доверительный интервал для тренда определяется как:
где - средняя квадратическая ошибка тренда;
Расчетное значение y t ;
Значение t-статистики Стьюдента.
В STATISTICA при расчете доверительных интервалов прогноза величину среднего квадратического отклонения S y можно определить, воспользовавшись таблицей дисперсионного анализа. Рассчитанное в ячейке Residual Mean Squares значение соответствует подкоренному выражению в формуле для S y , то есть остаточной дисперсии. Остается только извлечь из него квадратный корень.
Для экспорта (см. таблицу 77), для импорта (см. таблицу 80).
Значит, для экспорта S y = 18,11,для импорта S y = 25,45.
Значение коэффициента доверия t находим по таблице Стьюдента с учетом доверительной вероятности 95%. При использовании линейной и степенной функций число степеней свободы равно 4, соответственно значение критерия равно 2,776.
Таким образом, доверительный интервал прогноза для экспорта на 2008 год определяется как:
Этот прогноз можно интерпретировать следующим образом: количество экспорта Японии в 2008 году с вероятностью 95% будет составлять от 704,542 млрд. долл. до 805,089 млрд. долл.
Доверительный интервал прогноза для импорта на 2008 год определяется как:
Этот прогноз можно интерпретировать следующим образом: количество импорта Японии в 2008 году с вероятностью 95% будет составлять от 596,072 млрд. долл. до 737,371 млрд. долл.
Графическое представление результатов прогнозирования
Завершающим этапом прогнозирования является построение графических изображений, дающих представление о точности прогноза и наглядно демонстрирующих размах доверительных интервалов.
Таблица 89. Данные прогнозирования для экспорта
Рис. 63.
Таблица 90. Данные прогнозирования для экспорта
Рис. 64.
К сожалению, в нашем случае реальные значения вышли за пределы доверительного интервала прогноза, что лишний раз подчёркивает трудности выбора модели тренда.
Экстраполяция на основе среднего темпа роста и среднего абсолютного прироста
В данном пункте рассмотрим прогнозирование на основе среднего темпа роста. Значения будущих периодов получают, руководствуясь формулой:
где - средний темп роста; - уровень, принятый за базу для экстраполяции.
Средний темп роста определяется как:
где y n - данные за последний год периода, а y 1 - данные по первому году в рассматриваемом периоде.
Рассчитаем для экспорта:
Доверительный интервал:
Таблица 91. Расчеты по формуле, средний темп роста для экспорта Японии
КОНТРОЛЬНАЯ РАБОТА
по дисциплине «Планирование и прогнозирование
в условиях рынка»
на тему: Доверительные интервалы прогноза
Оценка адекватности и точности моделей
Глава
1. Теоретическаячасть
Доверительные интервалы прогноза. Оценка адекватности и точности моделей
1.1 Доверительные интервалы прогноза
Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t , соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.
На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать "вилку" возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.
Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:
1. субъективной ошибочностью выбора вида кривой;
2. погрешностью оценивания параметров кривых;
3. погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.
Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:
где n- длина временного ряда;
L -период упреждения;
y n + L -точечный прогноз на момент n+L;
t a - значение t-статистики Стьюдента;
S p - средняя квадратическая ошибка прогноза.
Предположим, что тренд характеризуется прямой:
Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра а о приводит к вертикальному сдвигу прямой, погрешность параметра a 1 - к изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию можно представить в виде:
(1.2.),
где - дисперсия отклонений фактических наблюдений от расчетных;
t 1 - время упреждения, для которого делается экстраполяция;
t 1 = n + L ;
t - порядковый номер уровней ряда, t = 1,2,..., n;
Порядковый номер уровня, стоящего в середине ряда,
Тогда доверительный интервал можно представить в виде:
(1.3.),
Обозначим корень в выражении (1.3.) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:
(1.4.),
Выражение, аналогичное (1.3.), можно получить для полинома второго порядка:
(1.5.),
(1.6.),
Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:
(1.7.),
где y t - фактические значения уровней ряда,
Расчетные значения уровней ряда,
n - длина временного ряда,
k - число оцениваемых параметров выравнивающей кривой.
Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.
Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения
Рисунок 1.1. Доверительные интервалы прогноза для линейного тренда
Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.
По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).
В таблице 1.1. приведены значения К* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n ) значения К* уменьшаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L .
Таблица 1.1.
Значения К* для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7).
Линейный тренд | Параболический тренд | ||
Длина ряда (п) | Период упреждения (L) |
длина ряда (п) | период упреждения (L) |
7 | 2,6380 2,8748 3,1399 | 7 | 3,948 5,755 8,152 |
8 | 2,4631 2,6391 2,8361 | 8 | 3,459 4,754 6,461 |
9 | 2,3422 2,4786 2,6310 | 9 | 3,144 4,124 5,408 |
10 | 2,2524 2,3614 2,4827 | 10 | 2,926 3,695 4,698 |
11 | 2,1827 2,2718 2,3706 | 11 | 2,763 3,384 4,189 |
12 | 2,1274 2,2017 2,2836 | 12 | 2,636 3,148 3,808 |
13 | 2,0837 2,1463 2,2155 | 13 | 2,536 2,965 3,516 |
14 | 2,0462 2,1000 2,1590 | 14 | 2,455 2,830 3,286 |
15 | 2,0153 2,0621 2,1131 | 15 | 2,386 2,701 3,100 |
16 | 1,9883 2,0292 2,0735 | 16 | 2,330 2,604 2,950 |
17 | 1,9654 2,0015 2,0406 | 17 | 2,280 2,521 2,823 |
18 | 1,9455 1,9776 2,0124 | 18 | 2,238 2,451 2,717 |
19 | 1,9280 1,9568 1,9877 | 19 | 2,201 2,391 2,627 |
20 | 1,9117 1,9375 1,9654 | 20 | 2,169 2,339 2,549 |
21 | 1,8975 1,9210 1,9461 | 21 | 2,139 2,293 2,481 |
22 | 1,8854 1,9066 1,9294 | 22 | 2,113 2,252 2,422 |
23 | 1,8738 1,8932 1,9140 | 23 | 2,090 2,217 2,371 |
24 | 1,8631 1,8808 1,8998 | 24 | 2,069 2,185 2,325 |
25 | 1,8538 1,8701 1,8876 | 25 | 2,049 2,156 2,284 |
Глава 2. Практическая часть
Задание 1.5. Использование адаптивных методов в экономическом прогнозировании
1. Рассчитать экспоненциальную среднюю для временного ряда курса акций фирмы ЮМ. В качестве начального значения экспоненциальной средней взять среднее значение из 5 первых уровней ряда. Значение параметра адаптации а принять равным 0,1.
Таблица 1.2.
Курс акций фирмы IBM
t | y t | t | y t | t | y t |
1 | 510 | 11 | 494 | 21 | 523 |
2 | 497 | 12 | 499 | 22 | 527 |
3 | 504 | 13 | 502 | 23 | 523 |
4 | 510 | 14 | 509 | 24 | 528 |
5 | 509 | 15 | 525 | 25 | 529 |
6 | 503 | 16 | 512 | 26 | 538 |
7 | 500 | 17 | 510 | 27 | 539 |
8 | 500 | 18 | 506 | 28 | 541 |
9 | 500 | 19 | 515 | 29 | 543 |
10 | 495 | 20 | 522 | 30 | 541 |
2. По данным задания №1 рассчитать экспоненциальную среднюю при значении параметра адаптации а равным 0,5. Сравнить графически исходный временной ряд и ряды экспоненциальных средних, полученные при а =0,1 и а =0,5. Указать, какой ряд носит более гладкий характер.
3. Прогнозирование курса акций фирмы IBM осуществлялось на основе адаптивной полиномиальной модели второго порядка
,
где - период упреждения.
На последнем шаге получены следующие оценки коэффициентов:
На 1 день вперед (=1);
На 2 дня вперед (=2).
Решение задания 1.5
1. Определим
Найдем значения экспоненциальной средней при а =0,1.
. а =0,1 – по условию;
; S 1 = 0,1 х 510 + 0,9 х 506 = 506,4;
; S 2 = 0,1 х 497 + 0,9 х 506,4 = 505,46;
; S 3 = 0,1 х 504 + 0,9 х 505,46 = 505,31 и т.д.
а =0,5 – по условию.
; S 1 = 0,5 х 510 + 0,5 х 506 = 508;
; S 2 = 0,5 х 497 + 0,5 х 508 = 502,5 и т.д.
Результаты расчетов представлены в таблице 1.3.
Таблица 1.3.
Экспоненциальные средние
t | Экспоненциальная средняя | t | Экспоненциальная средняя | ||
а =0,1 | а =0,5 | а =0,1 | а =0,5 | ||
1 | 506,4 | 508 | 16 | 505,7 | 513,3 |
2 | 505,5 | 502,5 | 17 | 506,1 | 511,7 |
3 | 505,3 | 503,2 | 18 | 506,1 | 508,8 |
4 | 505,8 | 506,6 | 19 | 507,0 | 511,9 |
5 | 506,1 | 507,8 | 20 | 508,5 | 517 |
6 | 505,8 | 505,4 | 21 | 509,9 | 520 |
7 | 505,2 | 502,7 | 22 | 511,6 | 523,5 |
8 | 504,7 | 501,4 | 23 | 512,8 | 523,2 |
9 | 504,2 | 500,7 | 24 | 514,3 | 525,6 |
10 | 503,4 | 497,8 | 25 | 515,8 | 527,3 |
11 | 502,4 | 495,9 | 26 | 518,0 | 532,7 |
12 | 502,0 | 497,5 | 27 | 520,1 | 525,8 |
13 | 502,0 | 499,7 | 28 | 522,2 | 538,4 |
14 | 502,7 | 504,4 | 29 | 524,3 | 540,7 |
15 | 505,0 | 514,7 | 30 | 525,9 | 540,9 |
Рисунок 1.2. Экспоненциальное сглаживание временного ряда курса акций: А – фактические данные; В – экспоненциальная средняя при альфа = 0,1; С – экспоненциальная средняя при альфа = 0,5
При а =0,1 экспоненциальная средняя носит более гладкий характер, т.к. в этом случае в наибольшей степени поглощаются случайные колебания временного ряда.
3. Прогноз по адаптивной полиномиальной модели второго порядка формируется на последнем шаге, путем подстановки в уравнение модели последних значений коэффициентов и значения - времени упреждения.
Прогноз на 1 день вперед (= 1):
Прогноз на 2 дня вперед (= 2):
Список используемой литературы
1. Дуброва Т.А. Статистические методы прогнозирования в экономике: Учебное пособие / Московский государственный университет экономики, статистики и информатики. – М.: МЭСИ, 2003. – 52с.
2. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование М.: Финансы и статистика, 2001.
3. Лукашин Ю.П. Регрессионные и адаптивные методы прогнозирования. Учебное пособие. – М.: МЭСИ, 1997.