Основные задачи анализа временных рядов. Эконометрика временных рядов Особенности стационарных временных рядов и тесты на стационарность

22.05.2022

Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов.

Временной ряд y t (t= 1,2,…,n) называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей n наблюдений y 1 ,y­ 2 ,…..,y n такое же, как и n наблюдений y 1+ t ,y 2+ t ,....y n + t при любых n, t и t. Другими словами, свойства строго стационарных рядов y t не зависит от момента t, т.е. закон распределения и его числовые характеристики не зависят от t. Следовательно, математическое ожидание a y (t) = a, среднее квадратическое отклонение s у (t) = s могут быть оценены по наблюдениям y t (t= 1,2,…,n) по формулам:

(6.3)

Простейшим примером стационарного временного ряда , у которого математическое ожидание равно нулю, а ошибок e t некоррелированы , является «белый шум» . Следовательно, можно сказать, что возмущения (ошибки) e t в классической линейной регрессионной модели образуют белый шум , а в случае их нормального распределения – нормальный (гауссовский ) белый шум.

Степень тесноты связи между последовательностями наблюдений временного ряда y 1 ,y­ 2 ,…..,y n и y 1+ t ,y 2+ t ,....y n + t (сдвинутых относительно друг от друга на e единиц, или, как говорят, с лагом t) может быть определена с помощью коэффициента корреляции

(6.4)

ибо

Так как коэффициент r(t) измеряет корреляцию между членами одного и того же ряда, его называют коэффициентом автокорреляции , а зависимость r(t) – автокорреляционной функцией . В силу стационарности временного ряда y t (t= 1,2,…,n) автокорреляционная функция r(t) зависит только от лага t, причем корреляционная функция r(- t) = r(t) , т.е. при изучение r(t) можно ограничиться рассмотрением только положительных значений t.

Статистической оценкой r(t) является выборочный коэффициент автокорреляции r(t), определяемый по формуле коэффициента корреляции (3.20), в которой x i = y t , y i = y t + t , a n заменяется на n - t:

Функцию r(t) называют выборочной автокорреляционной функцией , а ее график - коррелограммой .

При расчете r(t) следует помнить, что с увеличением t число n - t пар наблюдений y t ,y t + t уменьшается, поэтому лаг t должен быть таким, чтобы число n - t было достаточным для определения r(t). Обычно ориентируются на соотношение t £ n/4.

Для стационарного временного ряда с увеличением лага t взаимосвязь членов временного ряда y t и y t + t ослабевает и автокорреляционная функция r(t) должна убывать (по абсолютной величине). В тоже время для ее выборочного (эмпирического) аналога r(t), особенно при небольшом числе пар наблюдений n - t , свойство монотонного убывания, (по абсолютной величине) при возрастании t может нарушаться.

Наряду с автокорреляционной функцией при исследовании стационарных временных рядов рассматривается частная автокорреляционная функция r част (t), где r част (t) есть частный коэффициент корреляции между членами временного ряда y t и y t + t при устранении (элиминировании) влияния промежуточных (между y t и y t + t) членов.

Статистической оценкой r част (t) является выборочная частная автокорреляционная r част (t) где r част (t) – выборочный частный коэффициент корреляции, определяемый по формуле (5.21) или (5.22).Например, выборочный частный коэффициент автокорреляции 1-го порядка между членами временного ряда y t и y t + t при устранении влияния y t +1 может быть вычислен по формулу (5.22):

Где r(1) , r (1,2) ,r(2) – выборочные коэффициенты автокорреляции между y t и y t +1 , y t +1 и y t +2 , y t и y t +2 , t = 1,….,n.

Пример 6.1. По данным табл. 6.1 для временного ряда y t найти среднее значение, среднее квадратическое отклонение, коэффициенты автокорреляции 1-го порядка.

Решение. Среднее значение временного ряда находим по формуле (6.2):

Дисперсию и среднее квадратическое отклонение можно вычислить по формуле (6.3), но в данном случае проще использовать соотношение

где

Найдем коэффициент автокорреляции r(t) временного ряда (для лага t = 1), т.е. коэффициент корреляции между последовательностями семи пар наблюдений y t и y t + t (t = 1,2….,7).

Важное значение в анализе и прогнозировании на основе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Временной ряду { = (1,2,..., п) называется строго стационарным, если совместное распределение вероятностей п наблюдений у { ,у 2 , ???,у п такое же, как у« наблюдений у 1+т, у 2+т, ???,У п+Т (при любых«, /их). Свойства строго стационарных рядов не зависят от момента времени Итак, для стационарного случайного процесса характерна неизменность во времени его основных вероятностных характеристик, таких, как математическое ожидание и дисперсия.

Под стационарными рядами понимаются однородные во времени случайные процессы, характеристики которых не меняются с течением времени /. Характеристики этих процессов и определяют особенности процессов и являются предметом исследования. Если эти характеристики (математическое ожидание, дисперсия и пр.) удалось с заданной степенью точности найти, то задача прогноза таких стационарных процессов становится чрезвычайно простой. В то же время стационарные процессы могут иметь самый различный характер динамики - изменение одной части из них не имеет ярко выраженных тенденций во времени, динамика другой части имеет явно выраженную тенденцию изменения во времени, которая может носить и очень сложный нелинейный характер. Таким образом, стационарная группа типов динамики временного ряда может быть, в свою очередь, разделена на две подгруппы: 1) простые стационарные; 2) сложные стационарные. Для первой группы факторов, простого стационарного типа, выполняется условие неизменности во времени их математического ожидания и других характеристик случайных процессов. Если же математическое ожидание и иные характеристики вероятностного процесса претерпевают изменение во времени, то такие ряды являются сложными стационарными.

Модели стационарных и нестационарных временных рядов

Простые стационарные процессы применительно к социально-экономическим объектам анализируются и прогнозируются с помощью простейших методов математической статистики (точечный и интервальный прогнозы динамики временного ряда). Чаще всего можно утверждать наличие закона нормального распределения, и поэтому основные усилия должны быть направлены на доказательство этого положения с помощью соответствующих статистических гипотез и методов их проверки, а после этого - на вычисление характеристик процесса. Если удалось подтвердить гипотезу о нормальном характере распределения изучаемого ряда, то лучшей оценкой его математического ожидания выступает средняя арифметическая, а лучшей оценкой дисперсии - выборочная дисперсия. Причем здесь уместен основной принцип выборочного метода - чем больше наблюдений, тем лучше оценки модели.

Сложные стационарные процессы свидетельствуют о наличии множества факторов, воздействующих на объект, показатели которого меняются во времени. Поэтому задачей прогнозиста является выявление главных из этих факторов и построение модели, описывающей влияние главных факторов на объект прогнозирования. Если этих факторов много, и выделить главные по каким-то соображениям невозможно, считают, что время выступает таким обобщающим фактором, и находят модель зависимости между прогнозным показателем и временем. Как правило, в этих случаях исследователю неизвестно большинство основных характеристик случайного динамического стационарного процесса. Он должен по данным наблюдений за процессом найти эти характеристики. Здесь исследователь вынужден прибегать к некоторым априорным предположениям - допускать наличие того или иного закона распределения вероятностей, свойств процесса и его взаимосвязей, характера динамики и т.п. В данном случае наиболее эффективно может использоваться тот раздел экономической науки, который получил название эконометрики.

Так как статистические свойства сложных стационарных рядов не

изменяются со временем, то эти их свойства можно накопить и выявить с помощью вычисления некоторых функций отданных. Функция, которую впервые использовали для этой цели, является автокорреляционной функцией (АКФ). Степень тесноты связи между последовательностями наблюдений временногорядау р у 2 , -,у иу 1+т, у 2+х, Уп+х обычно определяют с помощью выборочного коэффициента корреляции г(т). Его формула приведена ниже:

/7-Т ( /7-Т Л ^

(л-т)2>, 2 - 5>,

Хп-"шАЪ.

  • (6.5)

где т - число периодов, по которым рассчитывается коэффициент автокорреляции (лаг).

Этот коэффициент оценивает корреляцию между уровнями одного и того же ряда, поэтому иногда его называют коэффициентом автокорреляции. Формулу расчета коэффициента автокорреляции 1-го порядка (при т = 1) можно представить следующим образом:

  • (6.6)
  • 1=2 1=2

Коэффициент автокорреляции 2-го порядка определяется по формуле

  • (6.8)
  • - 2
  • 5> н
  • (6.9)

С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило - максимальный лаг должен быть не больше п/6. Функция г(т) называется выборочной автокорреляционной функцией, а ее график - коррелограм-мой. Вид выборочной автокорреляционной функции тесно связан со

; у, = " 3

структурой ряда.

  • 1. Автокорреляционная функция г(т) для «белого шума» при т > О также образует стационарный временной ряд со средним значением нуль.
  • 2. Для стационарного ряда АКФ быстро убывает с ростом т. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой.
  • 3. В случае выраженной сезонности в графике АКФ также присутствуют «выбросы» для запаздываний, кратных периоду сезонности, но эти «выбросы» могут быть завуалированы наличием тренда или большой дисперсией случайной компоненты.

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка т, то ряд содержит циклические колебания с периодичностью в т моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположении относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит ярко выраженную нелинейную тенденцию, для выявления которой необходимо провести дополнительный анализ. Поэтому коэффициент автокорреляции и автокорреляционную функцию целесообразно использовать для выявления во временном ряде трендовой компоненты и циклической (сезонной) компоненты. Таким образом, при изучении сложных стационарных временных рядов основной задачей является выявление и устранение автокорреляции.

Нестационарные процессы в противоположность стационарным отличаются тем, что они меняют во времени все свои характеристики. Причем это изменение может быть столь существенным, что динамика одного показателя будет отражать развитие совершенно разных процессов. Все взаимосвязи и взаимозависимости объекта прогнозирования меняются во времени. Более того, меняется во времени и структура и направление взаимодействия элементов, составляющих объект прогнозирования. В зависимости от того, насколько меняются во времени приращения АУ(Т), нестационарные процессы также могут быть выделены в две подгруппы: 1) эволюционные процессы; 2) хаотические процессы.

Если приращения АУ(Т) постепенно увеличиваются с течением времени в результате количественных и качественных изменений, происходящих в системе, отражением которой реализацией является нестационарный ряд, то эти процессы могут быть названы эволюционными. При этом отношение Д К(7)/Т(? + 7), характеризующее нарастание неопределенности, имеет увеличивающуюся со временем Т динамику - от нуля до бесконечности. В случае, когда приращения АУ(Т) не имеют какой-либо достаточно выраженной тенденции во времени и их изменения хаотичны (например, при первом же наблюдении АУ(Т) может быть достаточно велико в сравнении с самим показателем У(Т)), то такие процессы могут быть отнесены к хаотическим. Хаотический характер динамики возникает в тех случаях, когда или сам процесс неинерционен и динамика его развития легко меняется под воздействием внешних или внутренних факторов, или же когда на инерционный процесс воздействуют внешние факторы такой силы, что под их воздействием «ломаются» и внутренняя структура процесса, и его взаимосвязи, и его динамика. Иначе говоря, эволюционная динамика характеризует процесс адаптации объекта к внешним и внутренним воздействиям, а хаотическая динамика - отсутствие способности объекта к адаптации.

Сложный характер нестационарной динамики предопределяет и сложность аппарата моделирования и прогнозирования этой динамики. Прогнозирование эволюционных составляющих экономической конъюнктуры до последнего времени не попадало в поле зрения специалистов по социально-экономическому прогнозированию - только в последние годы в учебники по прогнозированию стали включаться соответствующие разделы. На практике эволюционные процессы просто не выделяли в отдельную группу и для их анализа и прогнозирования использовали приемы классической эконометрики, не задумываясь над корректностью такого применения. Именно использование аппарата прогнозирования, методологически несовместимого со свойствами объекта прогнозирования, и приводит к серьезным ошибкам при выборе инструментария и существенной дисперсии прогноза в практике прогнозирования социально-экономической динамики. Для прогнозирования временных рядов социально-экономических показателей эволюционного типа методологически обоснованным является применение адаптивных методов прогнозирования. Вопросы прогнозирования хаотических рядов социально-экономической динамики в настоящее время решаются с использованием теории хаоса и теории катастроф.

Далее рассмотрим методы прогнозирования часто наблюдаемых в практике социально-экономических исследований сложных стационарных и эволюционных нестационарных динамических процессов. Для рядов выше упомянутых типов английскими статистиками Д. Боксом и В. Дженкинсом в середине 1990-х гг. разработан алгоритм прогнозирования. В иерархию алгоритмов Бокса - Дженкинса входит несколько алгоритмов, самым известным и используемым из них является алгоритм АЯ1МА. Он встроен практически в любой специализированный пакет для прогнозирования. В классическом варианте ЛЯ1МА не используются независимые переменные. Модели опираются только на информацию, содержащуюся в предыстории прогнозируемых рядов, что ограничивает возможности алгоритма. В настоящее время в научной литературе часто упоминаются варианты моделей АЯ1МА, позволяющие учитывать независимые переменные.

Модели АЯ1МА опираются в основном на автокорреляционную структуру данных. В методологии АЯ1МА не предусматривается какой-либо четкой модели для прогнозирования данного временного ряда. Задается лишь общий класс моделей, которые описывают временной ряд и позволяют как-то выражать текущее значение переменной через ее предыдущие значения. Потом алгоритм АЯ1МА, задавая параметры моделей, сам избирает наиболее приемлемую модель прогнозирования. Существует целая иерархия моделей Бокса - Дженкинса. Логично ее можно определить так:

АЯ(р) + МА(д) -> АЯМА(р, д) АЯМА(р, д)(Р , 0 ->

-? АЯ1МА(р, д, г)(Р, 0 Я) ... (6.10)

где АЯ(р) - авторегрессионная модель порядка р МА(д) - модель скользящей средней порядка д ; АЯМА(р, д) - комбинированная модель авторегрессии и скользящей средней; АЯМА(р , д) (Р, О) - модель экспоненциального сглаживания; АЯ1МА{р , д, г) (Р, 0 Я) - моделирование нестационарного эволюционного процесса с линейным трендом.

Первые три модели аппроксимируют динамику сложных стационарных временных рядов, последующие две - динамику эволюционных нестационарных временных рядов. Модель считается приемлемой, если остатки (в основном малые) распределены случайно и не содержат полезной информации. Если заданная модель неудовлетворительна, процесс повторяется, но уже с использованием новой улучшенной модели. Подобная итерационная процедура повторяется до тех пор, пока не будет найдена удовлетворительная модель. Из этого момента заданная модель может использоваться для целей прогнозирования.

В модели АШМА уровень динамического ряда у определяется как взвешенная сумма предыдущих его значений и значений остатков е г - текущих и предыдущих. Она объединяет модель авторегрессии порядкар и модель скользящей средней порядка ц. Тренд включается в ЛШМА с помощью оператора конечных разностей ряда у г Для фильтрации линейного тренда используют разницы 1-го порядка, для фильтрации параболического тренда - разницы 2-го порядка и т.д. Разница й должна быть стационарной. Вид модели АШМА, адекватность ее реальному процессу и прогнозные свойства зависят от порядка авторегрессии р и порядка скользящей средней

Ключевым моментом моделирования считается процедура идентификации - обоснования вида модели. В стандартной методике АШМА идентификация сводится к визуальному анализу авто-коррелограмм и основывается на принципе экономии, по которому {р + АШМА порядка , (1 , (Ря, А?, 05). Таким образом, идентификацией временного ряда называется построение для ряда остатков адекватной модели, в которой остатки представляют собой «белый шум», а все регрессоры значимы.

Рассмотрим некоторые модели АШМА подробнее. Авторегрессионная модель порядка р имеет вид

У, = Ро + Р1 У ,-1 + Р 2 Т/- 2 + + Р Р У,- Р + е, {* = I 2, ..., п), (6.11)

где Р 0 , р., ..., р - некоторые константы; г (- уровень «белого шума», который может быть опущен.

Если исследуемый процесс у в момент Г определяется его значениями только в предыдущий период 7-1, то получаем авторегрессионную модель первого порядка

У, =Р 0 +Р1Л-1 + е, (7 = 1,2,...,«), (6.12)

В моделях скользящей средней моделируемая величина задается линейной функцией от возмущений (остатков) в предыдущие моменты времени. Модель скользящей средней порядка д имеет вид

У,= е 1 -У 1 е,-1-У 2 е,- 2 - - -У,е,-, (7 = 1,2,...,«), (6.13)

где у р у., ..., у - некоторые константы; е - ошибки.

Нередко используется комбинированная модель авторегрессии и скользящей средней, которая имеет вид

У, = Ро + Р.Л-, + РзЯ-2+- + РрУ"-р +?1 - У&-1 - У 2^-2 -???- У&-Я (6.14)

Параметры р и

  • 1) один параметр (р), если автокорреляционная функция (АКФ) экспоненциально убывает;
  • 2) два параметра авторегрессии (р), если АКФ имеет форму синусоиды или экспоненциально убывает;
  • 3) один параметр скользящего среднего (
  • 4) два параметра скользящего среднего (д), если АКФ имеет резко выделяющиеся значения на лагах 1 и 2 и нет корреляции на других лагах.

Адаптивное прогнозирование

При изучении нестационарных эволюционных временных рядов применяется адаптивное прогнозирование. Адаптивные методы прогнозирования - это совокупность моделей дисконтирования данных, способные приспосабливать свою структуру и параметры к изменению условий. При оценке параметров адаптивных моделей наблюдениям (уровням ряда) присваиваются различные веса в зависимости от того, насколько сильным признается их влияние на текущий уровень. Это позволяет учитывать изменения в тенденции, а также любые колебания, в которых прослеживается закономерность. Адаптивные методы прогнозирования представляют собой подбор и адаптацию моделей прогнозирования на основании вновь поступившей информации. К самым распространенным из них относится метод экспоненциального сглаживания и метод гармонических весов Хель-вига.

Метод экспоненциального сглаживания. Особенность его состоит в том, что в процедуре выравнивания каждого наблюдения используются только значения предыдущих уровней ряда динамики, взятых с определенным весом. Вес каждого наблюдения уменьшается по мере его удаления от момента, для которого определяется сглаженное значение. Сглаженное значение уровня ряда 5 на момент / определяется по формуле

5, = ау, + (1-а)5,_ 1 , (6.15)

где 5 - значение экспоненциальной средней в момент /; 5 / _ 1 - значение экспоненциальной средней в момент (/- 1); ? - значение экономического процесса в момент времени /; а - вес /-го значения ряда динамики (или параметр сглаживания, значения которого изменяются от нуля до единицы).

Последовательное применение формулы (6.15) позволяет вычислить экспоненциальную среднюю через значения всех уровней данного ряда динамики. Кроме того, на основе формулы (6.15) определяются экспоненциальные средние 1-го порядка, т.е. средние полученные непосредственно при сглаживании исходных данных ряда динамики. В тех случаях, когда тенденция после сглаживания исходного ряда определена недостаточно ясно, процедуру сглаживания повторяют, т.е. вычисляют экспоненциальные средние второго, третьего порядка и т.д., пользуясь выражениями (6.16-6.18):

^ 2] = ос?, [,] +(1-а)?, [ 3;

^ ] = а5, !2] + (1-а)^];

5 1 , 1 * 1 = а^* -1] + (1 - а)5^,

где 5^ - экспоненциальная средняя к-то порядка в точке I (к = 1,

2, 3,..., п ).

Для линейной модели у = а 0 + а и начальные условия следующие:

? - а - а 2 (1 ~ а) а ^О(у) “О “р (у) “О а "

Экспоненциальные средние первого и второго порядка для этой модели:

5,1" = ау, + (1 ?- а)5™5,1" = а5|" + (1 - а)5Й

Прогноз осуществляется по формуле у * = я 0 + я,/. Причем параметры а 0 и а { соответственно равны

  • (6.19)
  • (6.20)

Ошибка прогноза определяется по формуле

)/{Г-а)[* -4(1 -а) + 5(1 - а) 2 + 2а(4-3а)

/ + 2 а ч

где ъу - средняя квадратическая ошибка отклонения от линейного тренда.

Метод гармонических весов. Этот метод был разработан польским статистиком 3. Хельвигом. Он близок к методу простого экспоненциального сглаживания, использует тот же принцип. В его основе лежит взвешивание скользящего показателя, но вместо скользящей средней используется идея скользящего тренда. Экстраполяция про-

водится по скользящему тренду, отдельные точки ломаной линии взвешиваются с помощью гармонических весов, что позволяет более поздним наблюдениям придавать больший вес. Метод гармонических весов базируется на следующих предпосылках:

  • период времени, за который изучается экономический процесс, должен быть достаточно длительным, чтобы можно было определить его закономерности;
  • исходный ряд динамики не должен иметь скачкообразных изме-
  • социально-экономическое явление должно обладать инерционностью, т.е. для наступления существенного изменения в характеристиках процесса необходимо, чтобы прошло значительное время;
  • отклонения от скользящего тренда имеют случайный характер;
  • автокорреляционная функция, рассчитанная на основе последовательных разностей, должна уменьшаться с ростом /, т.е. влияние более поздней информации должно сильнее отражаться на прогнозируемой величине, чем на исходной информации.

Для получения точного прогноза методом гармонических весов необходимо выполнение всех вышеуказанных предпосылок для исходного ряда динамики. Для использования данного метода исходный ряд разбивается на фазы к. Число фаз должно быть меньше числа членов ряда п , т.е. к Обычно фаза равна трем-пяти уровням. Для каждой фазы рассчитывается линейный тренд, т.е.

У т = а, + V 0" = 1, 2,п - к + 1).

При этом для /, равного единице, Г = 1, 2,..., к; для /, равного двум, Г = 2, 3,..., к + 1; для /, равного п - к + 1, г = я - к + ,п - к +2 ,..., п. Для оценки параметров а. { и Ь ш используется метод наименьших квадратов. С помощью полученных (п - к + 1) уравнений определяются значения скользящего тренда. С этой целью выделяются те значения у (цу для которых Г = /, их обозначают у.^. Пусть их будет Пу Затем находится среднее значение у т по формуле

После этого необходимо проверить гипотезу о том, что отклонения от скользящего тренда представляют собой стационарный процесс. С этой целью рассчитывается автокорреляционная функция. Если значения автокорреляционной функции уменьшаются от периода к периоду, то пятая предпосылка данного метода выполняется. Далее рассчитываются приросты по формуле

Средняя приростов вычисляется по формуле

где С" +| - гармонические коэффициенты, удовлетворяющие условиям С” +1 > 0 (/ = 1,2,п - 1) и ^С," (= 1.

Выражение (6.25) позволяет более поздней информации придавать большие веса, так как приросты обратно пропорциональны времени, которое отделяет исходную информацию от более поздней для момента Г = п. Если исходная информация имеет вес т 2 = /[п - 1), то

вес информации, относящейся к следующему моменту времени, равен

т,=т 2 - 1--- = --I---. (6.26)

3 2 п-2 п- 1 /7-2

В общем виде ряд гармонических весов определяют как

= т, л --

  • (/ = 2, 3, , п 1),
  • (6.27)

^ т, +1 =/7 -1. (6.29)

Чтобы получить гармонические коэффициенты С,", удовлетворяющие двум вышеуказанным условиям, гармонические веса т 1 +1 необходимо разделить на (п - 1), т.е.

У, = У/ + Ю (6.31)

при начальном условии У* = Уд,у Данный метод прогнозирования применяется, когда есть уверенность, что тенденция в будущем описывается плавной кривой, т.е. в ряду отсутствуют сезонные и циклические колебания. Таким образом, перед предвидением развития изучаемого объекта необходимо сделать вывод о стационарности или нестационарности временного ряда. Данное положение можно проверить с помощью теста Дики - Фуллера. Базовый порождающий данный процесс, который используется в тесте,- авторегрессионный процесс первого порядка:

у (= т 0 + т { / + г- у (_ { + е /? (6.32)

где т 0 , т { иг - постоянные коэффициенты, которые могут быть найдены с помощью МНК; ? - случайная ошибка, которая в расчет может не приниматься.

Если выполняется условие 0 г 1, то ряд является стационарным. При г 0 и г> 1, то изучаемый временной ряд не является стационарным.

Глава 6. Эконометрика временных рядов

6.1. Модели стационарных и нестационарных временных рядов, их идентификация

Пусть Рассмотрим временной ряд X(t). Пусть сначала временной ряд принимает числовые значения. Это могут быть, например, цены на батон хлеба в соседнем магазине или курс обмена доллара на рубли в ближайшем обменном пункте. Обычно в поведении временного ряда выявляют две основные тенденции - тренд и периодические колебания.

При этом под трендом понимают зависимость от времени линейного, квадратичного или иного типа, которую выявляют тем или иным способом сглаживания (например, экспоненциального сглаживания) либо расчетным путем, в частности, с помощью метода наименьших квадратов. Другими словами, тренд - это очищенная от случайностей основная тенденция временного ряда.

Временной ряд обычно колеблется вокруг тренда, причем отклонения от тренда часто обнаруживают правильность. Часто это связано с естественной или назначенной периодичностью, например, сезонной или недельной, месячной или квартальной (например, в соответствии с графиками выплаты заплаты и уплаты налогов). Иногда наличие периодичности и тем более ее причины неясны, и задача эконометрика - выяснить, действительно ли имеется периодичность.

Элементарные методы оценки характеристик временных рядов обычно достаточно подробно рассматриваются в курсах "Общей теории статистики" (см., например, учебники ), поэтому нет необходимости подробно разбирать их здесь. (Впрочем, о некоторых современных методах оценивания длины периода и самой периодической составляющей речь пойдет ниже.)

Характеристики временных рядов . Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X(t) рассматривается как случайный процесс (с дискретным временем) основными характеристиками являются математическое ожидание X(t) , т.е.

дисперсия X(t) , т.е.

и автокорреляционная функция временного ряда X(t)

т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X(t) и X(s).

В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k , а потому и все перечисленные выше характеристики временного ряда не меняются со временем . В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s . Временные ряды, не являющиеся стационарными, называются нестационарными.

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными, независимыми и автокоррелированными остатками. Как видно из сказанного выше, основное - это "очистка" временного ряда от случайных отклонений, т.е. оценивание математического ожидания. В отличие от простейших моделей регрессионного анализа, рассмотренных в главе 5, здесь естественным образом появляются более сложные модели. Например, дисперсия может зависеть от времени. Такие модели называют гетероскедастичными, а те, в которых нет зависимости от времени - гомоскедастичными. (Точнее говоря, эти термины могут относиться не только к переменной "время", но и к другим переменным.)

Далее, в главе 5 предполагалось, что погрешности независимы между собой. В терминах настоящей главы это означало бы, что автокорреляционная функция должна быть вырожденной - равняться 1 при равенстве аргументов и 0 при их неравенстве. Ясно, что для реальных временных рядов так бывает отнюдь не всегда. Если естественный ход изменений наблюдаемого процесса является достаточно быстрым по сравнению с интервалом между последовательными наблюдениями, то можно ожидать "затухания" автокорреляции" и получения практически независимых остатков, в противном случае остатки будут автокоррелированы.

Идентификация моделей. Под идентификацией моделей обычно понимают выявление их структуры и оценивание параметров. Поскольку структура - это тоже параметр, хотя и нечисловой (см. главу 8), то речь идет об одной из типовых задач эконометрики - оценивании параметров.

Проще всего задача оценивания решается для линейных (по параметрам) моделей с гомоскедастичными независимыми остатками. Восстановление зависимостей во временных рядах может быть проведено на основе методов наименьших квадратов и наименьших модулей, рассмотренных в главе 5 моделей линейной (по параметрам) регрессии. На случай временных рядов переносятся результаты, связанные с оцениванием необходимого набора регрессоров, в частности, легко получить предельное геометрическое распределение оценки степени тригонометрического полинома.

Однако на более общую ситуацию такого простого переноса сделать нельзя. Так, например, в случае временного ряда с гетероскедастичными и автокоррелированными остатками снова можно воспользоваться общим подходом метода наименьших квадратов, однако система уравнений метода наименьших квадратов и, естественно, ее решение будут иными. Формулы в терминах матричной алгебры, о которых упоминалось в главе 5, будут отличаться. Поэтому рассматриваемый метод называется "обобщенный метод наименьших квадратов (ОМНК)" (см., например, ).

Замечание. Как уже отмечалось в главе 5, простейшая модель метода наименьших квадратов допускает весьма далекие обобщения, особенно в области системам одновременных эконометрических уравнений для временных рядов. Для понимания соответствующей теории и алгоритмов необходимо профессиональное владение матричной алгеброй. Поэтому мы отсылаем тех, кому это интересно, к литературе по системам эконометрических уравнений и непосредственно по временным рядам , в которой особенно много интересуются спектральной теорией, т.е. выделением сигнала из шума и разложением его на гармоники. Подчеркнем в очередной раз, что за каждой главой настоящей книги стоит большая область научных и прикладных исследований, вполне достойная того, чтобы посвятить ей много усилий. Однако из-за ограниченности объема книги мы вынуждены изложение сделать конспективным.

Предыдущая

Характеристики временных рядов. Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X(t) рассматривается как случайный процесс (с дискретным временем) основными характеристиками являются математическое ожидание X(t), т.е.

дисперсия X(t), т.е.

и автокорреляционная функция временного ряда X(t)

т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X(t) и X(s).

В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k, а потому и все перечисленные выше характеристики временного ряда не меняются со временем. В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s. Временные ряды, не являющиеся стационарными, называются нестационарными.

Под временным рядом понимают упорядоченную во времени последовательность значений одной или конечного множества случайных величин. В первом случае говорят об одномерном временном ряде, во втором - о многомерном временном ряде. Здесь будут рассматриваться только одномерные временные ряды. Одномерный временной ряд называется стационарным, если его вероятностные характеристики постоянны. Временной ряд называется нестационарным, если хотя бы одна из вероятностных характеристик непостоянна. Последовательность случайных величин у 1 , у 2 , . . . или у -1 , у 0 , у 1 , . . называется случайным процессом с дискретным параметром времени.

Поскольку важна последовательность во времени появления следующего значения временного ряда, а не конкретное значение времени появления, то во временных рядах в качестве аргумента используют номер отсчета значения временного ряда. Например:

x(1), x(2), ... ,x(k), ...

где x(k) - значение временного ряда в k-том по порядку наблюдении; k - номер наблюдения.

В большинстве практических приложений рассматривают стационарные и нестационарные по математическому ожиданию временные ряды с нормальным законом распределения значений ряда. Это означает, что:

стационарный ряд: x(k) є (µ, у 2) , µ = const, у 2 = const;

нестационарный ряд: x(k) є (µ, у 2) , µ = var, у 2 = const.

Ниже приведена реализация стационарного временного ряда:

Прогнозируемость временного ряда.

Для прогнозирования временного ряда необходимо построить его модель. Прогнозируемость ряда возможна лишь тогда, когда существует вероятностная (аналитическая) связь последующих значений ряда от предыдущих. Прогнозируемость стационарного временного ряда определяется с помощью автокорреляционной функции (АКФ):

с(m) = M[(x(k) - µ)*(x(k + m) - µ)]/у 2

где: с(m) - значение автокорреляционной функции на сдвиге m временного ряда x(k)

Оценки АКФ ряда имеют вид:

Очевидно, что с(0) = 1, поскольку это корреляция временного ряда на самого себя.

Стационарный временной ряд прогнозируем, если m>0 существует с(m) ? 0.

Стационарный временной ряд непрогнозируем, если для любого m>0 с(m) = 0. Такой ряд называют "белым шумом".

Поскольку, АКФ это значения коэффициентов корреляции, то она является функцией неслучайных значений.

Оценивание АКФ осуществляется по реализации временного ряда. Если реализация содержит n значений, то оценка автокорреляционной функции имеет вид:

где: r(m) - оценка АКФ; x - среднее значение реализации временного ряда; S 2 - оценка дисперсии реализации временного ряда.

При проверке прогнозируемости временного ряда длина реализации должна быть не менее 20 - 30 наблюдений.

Следует обратить внимание, что прогнозирование временных рядов рассмотренным методом предполагает выполнение двух условий:

  • 1. Случайная величина е(k) "белого шума", как составляющая моделей, должна подчиняться нормальному закону распределению с нулевым математическим ожиданием и конечной дисперсией у е 2 .
  • 2. Дисперсия "белого шума" у е 2 должна быть величиной постоянной.

Формула вычисления прогноза имеет вид:

x(k) = 27,2661 - 0,900766*

где x(k) - прогноз по модели k-го значения временного ряда.

Идентификация модели стационарного временного ряда

Идентификация модели. Для прогнозирования будущих показателей на основе имеющихся временных рядов необходимо идентифицировать модель, которая наилучшим образом описывает процесс порождения выборочного временного ряда. Для идентификации такой модели можно воспользоваться расчетной автокорреляционной функцией. Из множества моделей для описания динамики временных рядов чаще всего используются три: модель белого шума, авторегрессионная модель первого порядка и авторегрессионная модель второго порядка. Если расчетная автокорреляционная функция представляет собой совокупность незначимых автокорреляций, это явное указание на то, что изменчивость данного времени n-ого ряда лучше всего охарактеризовать как "белый шум", или случайные флуктуации.

Основная идея, лежащая в основе идентификации модели временного ряда, остается одной и той же и для простых, и для сложных моделей: соответствие структуры наблюдаемых данных известной структуре, связываемой с определенным классом моделей. После того как модель предварительно идентифицирована, производится оценка ее параметров.

Диагностическая проверка. Так как в основе идентификации модели временного ряда лежит до некоторой степени субъективная процедура, иногда рекомендуется оценить адекватность идентифицированной модели путем проверки значимости автокорреляционной функции остатков данной модели. Это целесообразно, поскольку остатки модели временного ряда не являются автокоррелированными.

Однако автокорреляционная функция стационарного временного ряда не позволяет однозначно идентифицировать модель ряда. Это возможно с использованием второй дополнительной функции - частной автокорреляционной функции (ЧАКФ). Значения ЧАКФ - это значение m-го коэффициента в представлении временного ряда процессом авторегрессии порядка m. Пусть имеется стационарный временной ряд x(k). Рассмотрим следующие представления временного ряда через процесс авторегрессии:

x(k) - м = a 11 *

x(k) - м = a 12 * + a 22 *

x(k) - м = a 13 * + a 23 * + a 33 *

... ... ... ... ... ... ... ... ...

x(k) - м = a 1 * + a 2 * + a 33 * + ... + a mm *

Значениями ЧАКФ для сдвигов 1, 2, 3, ..., m являются значения коэффициентов: a 11 , a 22 , a 33 , ..., a mm . График ЧАКФ может иметь вид:

После оценивания ЧАКФ необходимо для каждого m проверить гипотезу о равенстве нулю соответствующего коэффициента частной автокорреляции. В программах статистической обработки данных для каждого из коэффициентов вычисляются критические значения, которые на графике оценки ЧАКФ приобретают вид контрольных границ.

При идентификации модели как правило пользуются следующими правилами:

  • 1. Если h первых значений АКФ отличны от нуля, а ЧАКФ по модулю асимптотически стремится к нулю, то имеет место процесс АРСС(0,h) - скользящего среднего порядка h.
  • 2. Если h первых значений ЧАКФ отличны от нуля, а АКФ по модулю асимптотически стремится к нулю, то имеет место процесс АРСС(h,0) - авторегрессии порядка h.
  • 3. Если значения АКФ и ЧАКФ по модулю асимптотически стремятся к нулю, то имеет место смешанный процесс АРСС(p,q).

Введение……………………………………………………….2

1. Основные задачи анализа временных рядов…………….4

2. Анализ временных рядов………………………………….9

2.2 Неслучайная составляющая временного ряда и методы его сглаживания…………………………………………………11

2.3 Модели стационарных временных рядов и их индефикация…13

2.3.2. Модели скользящего среднего порядка q (MA (q) –модели)….17

Заключение………………………………………………………21

Литература………………………………………………………..23

Введение

В последние годы в эконометрической литературе большое внимание уделяется исследованию рядов динамики временных показателей. Разнообразные содержательные задачи экономического анализа требуют использования статистических данных, характеризующих исследуемые экономические процессы и развернутых во времени в форме временных рядов. При этом нередко одни и те же временные ряды используются для решения разных содержательных проблем.

Далеко не всегда значения временного ряда формируются только под воздействием каких-либо факторов. Нередко бывает, что развитие того или иного процесса обусловлено его внутренними закономерностями, а отклонения от детерминированного процесса вызваны ошибками измерений или случайными флуктуациями. Особый интерес представляют процессы, находящиеся в «переходном» режиме, т.е. процессы, являющиеся по существу «стационарными», но на исследуемом промежутке времени проявляющие свойства нестационарного временного ряда, что объясняется далекими от стационарного режима начальными условиями. В ситуациях, когда временной ряд формируется под воздействием некоторого набора случайных и неслучайных факторов, анализ отдельных временных рядов, как результирующих, так и факторных, имеет огромное значение. Это необходимо для правильной идентификации моделей, которые строятся по информации об исследуемых процессах (векторные авторегрессии, модели коррекции ошибок, динамические модели с распределенными запаздываниями и т.п.).

При анализе временных рядов основное внимание уделяется исследованию, описанию и/или моделированию их структуры. Цель таких исследований, как правило, шире просто моделирования исследования соответствующих процессов. Построенная модель обычно используется для экстраполяции или прогнозирования временного ряда, и тогда качество прогноза может служить полезным критерием при выборе среди нескольких альтернативных моделей. Построение хороших моделей ряда необходимо и для других приложений, таких, как корректировка сезонных эффектов и сглаживание. Наконец, построенные модели могут использоваться для статистического моделирования длинных рядов наблюдений при исследовании больших систем, для которых временной ряд рассматривается как входная информация.

В связи с наличием ошибок измерения экономических показателей, наличием случайных флуктуаций, свойственных наблюдаемым системам, при исследовании временных рядов широко применяется вероятностно-статистический подход. В рамках такого подхода наблюдаемый временной ряд понимается как реализация некоторого случайного процесса. При этом неявно предполагается, что временной ряд имеет какую-то структуру, отличающую его от последовательности независимых случайных величин, так что наблюдения не являются набором совершенно независимых числовых значений. (Некоторые элементы структуры ряда иногда можно выявить уже на основании простого визуального анализа графика ряда. Это относится, например, к таким компонентам ряда, как тренд и циклы.) Обычно предполагается, что структуру ряда можно описать моделью, содержащей небольшое число параметров по сравнению с количеством наблюдений, это практически важно при использовании модели для прогнозирования. Примерами таких моделей служат модели авторегрессии, скользящего среднего и их комбинации - модели AR(p), MA(q), ARMA(p, q), ARIMA(p, k, q).

При построении моделей связей в долгосрочной перспективе необходимо учитывать факт наличия или отсутствия у анализируемых макроэкономических рядов стохастического (недетерминированного) тренда. Иначе говоря, приходится решать вопрос об отнесении каждого из рассматриваемых рядов к классу рядов, стационарных относительно детерминированного тренда (или просто стационарных) - TS (trend stationary) ряды, или к классу рядов, имеющих стохастический тренд (возможно, наряду с детерминированным трендом) и приводящихся к стационарному (или стационарному относительно детерминированного тренда) ряду только путем однократного или k-кратного дифференцирования ряда - DS (difference stationary) ряды. Принципиальное различие между этими двумя классами рядов выражается в том, что в случае TS ряда вычитание из ряда соответствующего детерминированного тренда приводит к стационарному ряду, тогда как в случае DS ряда вычитание детерминированной составляющей ряда оставляет ряд нестационарным из-за наличия у него стохастического тренда.

Глава 1. Основные задачи анализа временных рядов.

Принципиальные отличия временного ряда от последовательности наблюдений, образующих случайную выборку, заключаются в следующем:

во-первых, в отличие от элементов случайной выборки члены временного ряда не являются независимыми;

во-вторых, члены временного ряда не обязательно являются одинаково распределенными, так что P{xt < x} P{xt < x} при t t.

Это означает, что свойства и правила статистического анализа случайной выборки нельзя распространять на временные ряды. С другой стороны, взаимозависимость членов временного ряда создает свою специфическую базу для построения прогнозных значений анализируемого показателя по наблюденным значениям.

Генезис наблюдений, образующих временной ряд (механизм порождения данных). Речь идет о структуре и классификации основных факторов, под воздействием которых формируются значения временного ряда. Как правило, выделяются 4 типа таких факторов.

Долговременные, формирующие общую (в длительной перспективе) тенденцию в изменении анализируемого признака xt. Обычно эта тенденция описывается с помощью той или иной неслучайной функции fтр(t) (аргументом которой является время), как правило, монотонной. Эту функцию называют функцией тренда или просто - трендом.

Сезонные, формирующие периодически повторяющиеся в определенное время года колебания анализируемого признака. Поскольку эта функция (е) должна быть периодической (с периодами, кратными «сезонам»), в ее аналитическом выражении участвуют гармоники (тригонометрические функции), периодичность которых, как правило, обусловлена содержательной сущностью задачи.

Циклические (конъюнктурные), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов экономической или демографической природы (волны Кондратьева, демографические «ямы» и т.п.) Результат действия циклических факторов будем обозначать с помощью неслучайной функции (t).

Случайные (нерегулярные), не поддающиеся учету и регистрации. Их воздействие на формирование значений временного ряда как раз и обусловливает стохастическую природу элементов xt, а, следовательно, и необходимость интерпретации x1,…, xT как наблюдений, произведенных над случайными величинами 1,…, Т. Будем обозначать результат воздействия случайных факторов с помощью случайных величин («остатков», «ошибок ») t.

Конечно, вовсе не обязательно, чтобы в процессе формирования значений всякого временного ряда участвовали одновременно факторы всех четырех типов. Выводы о том, участвуют или нет факторы данного типа в формировании значений конкретного ряда, могут базироваться как на анализе содержательной сущности задачи, так и на специальном статистическом анализе исследуемого временного ряда. Однако во всех случаях предполагается непременное участие случайных факторов. Таким образом, в общем виде модель формирования данных (при аддитивной структурной схеме влияния факторов) выглядит как:

xt = 1f(t) + 2(t) +3(t) + t. (1)

где i = 1, если факторы i-го типа участвуют в формировании значений ряда и i = 0 - в противном случае.

Основные задачи анализа временных рядов. Базисная цель статистического анализа временного ряда заключается в том, чтобы по имеющейся траектории этого ряда:

определить, какие из неслучайных функций присутствуют в разложении (1), т.е. определить значения индикаторов i;

построить «хорошие» оценки для тех неслучайных функций, которые присутствуют в разложении (1);

подобрать модель, адекватно описывающую поведение случайных остатков t, и статистически оценить параметры этой модели.

Успешное решение перечисленных задач, обусловленных базовой целью статистического анализа временного ряда, является основой для достижения конечных прикладных целей исследования и, в первую очередь, для решения задачи кратко- и среднесрочного прогноза значений временного ряда. Приведем кратко основные элементы эконометрического анализа временных рядов.

· Большинство математико-статистических методов имеет дело с моделями, в которых наблюдения предполагаются независимыми и одинаково распределенными. При этом зависимость между наблюдениями чаще всего рассматривается как помеха в эффективном применении этих методов. Однако разнообразные данные в экономике, социологии, финансах, коммерции и других сферах человеческой деятельности поступают в форме временных рядов, в которых наблюдения взаимно зависимы, и характер этой зависимости как раз и представляет главный интерес для исследователя. Совокупность методов и моделей исследования таких рядов зависимых наблюдений называется анализом временных рядов. Главная цель эконометрического анализа временных рядов состоит в построении по возможности простых и экономично параметризованных моделей, адекватно описывающих имеющиеся ряды наблюдений и составляющих базу для решения, в первую очередь, следующих задач:

(a) вскрытие механизма генезиса наблюдений, составляющих анализируемый

(b) временной ряд;

(c) построение оптимального прогноза для будущих значений временного ряда;

выработка стратегии управления и оптимизации анализируемых процессов.

· Говоря о генезисе образующих временной ряд наблюдений, следует иметь в виду (и по возможности модельно описать) четыре типа факторов, под воздействием которых могут формироваться эти наблюдения: долговременные, сезонные, циклические (или конъюнктурные) и случайные. При этом не обязательно в процессе формирования значений конкретного временного ряда должны одновременно участвовать факторы всех четырех типов. Успешное решение задач выявления и моделирования действия этих факторов является основой, базисным отправным пунктом для достижения конечных прикладных целей исследования, главные из которых упомянуты в предыдущем пункте.

· Приступая к анализу дискретного ряда наблюдений, расположенных в хронологическом порядке, следует в первую очередь убедиться, действительно ли в формировании значений этого ряда участвовали какие-либо факторы, помимо чисто случайных. При этом под «чисто случайными» понимаются лишь те случайные факторы, под воздействием которых генерируются последовательности взаимно не коррелированных и одинаково распределенных случайных величин, обладающих постоянными (не зависящими от времени) средними значениями и дисперсиями.

Если в результате проверки такой статистической гипотезы выяснилось, что имеющиеся наблюдения взаимно зависимы (и, возможно, неодинаково распределены), то приступают к подбору подходящей модели для этого ряда. Множество моделей, в рамках которого ведется этот подбор, ограничивается обычно следующими классами моделей: (а) классом стационарных временных рядов (которые используются, в основном, для описания поведения «случайных остатков»), (б) классом нестационарных временных рядов, которые являются суммой детерминированного тренда и стационарного временного ряда, (в) классом нестационарных временных рядов, имеющих стохастический тренд, который можно удалить последовательным дифференцированием ряда (т.е. путем перехода от ряда уровней к ряду разностей первого или более высокого порядка).

В рамках эконометрического анализа временных рядов макроэкономических показателей российской экономики, проводимого в настоящей работе, мы объединяем ряды, входящие в классы (а) и (б), в один класс, который, следуя общепринятой в последнее время практике[см., например, Maddala, Kim (1998), называем классом TS-рядов (trend stationary series - ряды, стационарные относительно детерминированного тренда). Адекватным методом остационаривания временных рядов, принадлежащих классу (б), является вычитание из ряда детерминированного тренда. Напротив, для рядов, принадлежащих классу (в), адекватным методом остационаривания ряда является переход от ряда уровней к ряду разностей (первого или более высокого порядка).

· Стационарные (в широком смысле) временные ряды xt характеризуются тем, что их средние значения Ext, дисперсии Dxt и ковариации () = E не зависят от t, для которого они вычисляются. Взаимозависимости, существующие между членами стационарного временного ряда, как правило, могут быть адекватно описаны в рамках моделей авторегрессии порядка p (AR(p)-моделей), моделей скользящего среднего порядка q (MA(q)-моделей) или моделей авторегрессии со скользящими средними в остатках порядка p и q (ARMA(p, q)-моделей) .

· Временной ряд xt называется интегрированным (проинтегрированным) порядка k, если последовательные разности kxt этого ряда порядка k (но не меньшего порядка!) образуют стационарный временной ряд. Поведение таких рядов, в том числе рядов, содержащих сезонную компоненту, в эконометрических прикладных задачах достаточно успешно описывают с помощью моделей авторегрессии проинтегрированного скользящего среднего порядка p, k и q (ARIMA(p, k, q)-моделей) и некоторых их модификаций. К этому классу относится и простейшая модель стохастического тренда - процесс случайного блуждания (ARIMA(0, 1, 0)). Приращения случайного блуждания образуют последовательность независимых, одинаково распределенных случайных величин (“белый шум”). Поэтому процесс случайного блуждания называют также “проинтегрированным белым шумом”.

В настоящее время в класс интегрированных рядов порядка k включают также ряды, у которых разность порядка k (но не меньшего!) является процессом, стационарным относительно детерминированного тренда. В нашей работе используется именно такое определение. При этом если сам временной ряд является стационарным или стационарным относительно детерминированного тренда (TS-рядом), то он определяется как интегрированный ряд нулевого порядка.

При наличии сезонности получить стационарный ряд иногда возможно, переходя к разностям не соседних значений ряда, а значений, отстоящих на соответствующее число единиц времени. Например, при квартальных данных для достижения стационарности бывает достаточно перейти к последовательности разностей значений ряда, отстоящих на 4 единицы времени.

Подобрать модель для конкретного временного ряда {xt}, t = 1, 2,…, T это значит определить подходящее параметрическое семейство моделей в качестве допустимого множества решений, а затем статистически оценить параметры модели на основании имеющихся наблюдений x1, x2,…, xT. Весь этот процесс принято называть процессом идентификации модели, или просто идентификацией. Для правильной идентификации модели временного ряда необходимо решить вопрос о том, является ли исследуемый временной ряд стационарным, стационарным относительно детерминированного тренда (т.е. суммой детерминированных компонент и стационарного ряда) или в его составе содержится стохастический тренд. Решению этой задачи для ряда российских макроэкономических рядов посвящена основная часть настоящей работы.

В ситуациях, когда временные ряды {xt} и {yt}, t = 1, 2,…, T, являются исходными данными для построения регрессии y на x, причем воздействие единовременного изменения одной из них (x) на другую (y) растянуто (распределено) во времени, большой прикладной интерес представляют так называемые модели с распределенными лагами. В рамках этого специального класса моделей проводится, в частности, эконометрический анализ таких важных экономических явлений, как «процесс частичного приспособления», «модели адаптивных ожиданий» и др.

Важную роль в системах поддержки принятия экономических решений играет прогнозирование экономических показателей. Методы автопрогноза, основанные на анализе временных рядов, экстраполируют имеющийся в наличии ряд только на основании информации, содержащейся в нем самом. Такого рода прогноз может оказаться эффективным лишь в кратко- и, максимум, в среднесрочной перспективе. Серьезное решение задач долгосрочного прогнозирования требует использования комплексных подходов, и в первую очередь привлечения различных (в том числе, статистических) технологий сбора и анализа экспертных оценок.

Эффективный подход к решению задач кратко- и среднесрочного автопрогноза это прогнозирование, основанное на использовании «подогнанных» (идентифицированных) моделей типа ARIMA(p, k, q), включая, в качестве частных случаев, и модели AR-, MA- и ARMA.

Весьма широко распространены в решении прикладных задач кратко- и среднесрочного автопрогноза и так называемые адаптивные методы, позволяющие по мере поступления новых данных обновлять ранее сделанные прогнозы с минимальной задержкой и с помощью относительно несложных математических процедур.

Глава 2. Анализ временных рядов

2.1. Стационарные временные ряды и их основные характеристики

Поиск модели, адекватно описывающей поведение случайных остатков t анализируемого временного ряда xt, производят, как правило, в рамках класса стационарных временных рядов.

Определение 2.1. Ряд xt называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей m наблюдений такое же, как и для m наблюдений, при любых, и t1,…, tm.

Другими словами, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени. В частности, при m = 1 из предположения о строгой стационарности временного ряда xt следует, что закон распределения вероятностей случайной величины xt не зависит от t, а значит, не зависят от t и все его основные числовые характеристики, в том числе: среднее значение Ext = и дисперсия Dxt = 2.

Очевидно, значение определяет постоянный уровень, относительно которого колеблется анализируемый временной ряд xt, а постоянная величина характеризует размах этих колебаний. Поскольку закон распределения вероятностей случайной величины xt одинаков при всех t, то он сам и его основные числовые характеристики могут быть оценены по наблюдениям x1,…, xT. В частности:

оценка среднего значения, оценка дисперсии.

Автоковариационная функция (). Значения автоковариационной функции статистически оцениваются по имеющимся наблюдениям временного ряда по формуле

где = 1,… T 1, а вычислено по формуле (2.1).

Очевидно, значение автоковариационной функции при = 0 есть не что иное, как дисперсия временного ряда.

Автокорреляционная функция r(). Одно из главных отличий последовательности наблюдений, образующих временной ряд, от случайной выборки заключается в том, что члены временного ряда являются, вообще говоря, статистически взаимозависимыми. Степень тесноты статистической связи между двумя случайными величинами может быть измерена парным коэффициентом корреляции. Поскольку в нашем случае коэффициент измеряет корреляцию, существующую между членами одного и того же временного ряда, его принято называть коэффициентом автокорреляции. При анализе изменения величины r() в зависимости от значения принято говорить об автокорреляционной функции r(). График автокорреляционной функции иногда называют коррелограммой. Автокорреляционная функция (в отличие от автоковариационной) безразмерна, т.е. не зависит от масштаба измерения анализируемого временного ряда. Ее значения, по определению, могут колебаться от 1 до +1. Кроме того, из стационарности следует, что r() = r(), так что при анализе поведения автокорреляционных функций ограничиваются рассмотрением только положительных значений.

Существуют общие характерные особенности, отличающие поведение автокорреляционной функции стационарного временного ряда. Другими словами, можно описать в общих чертах схематичный вид коррелограммы стационарного временного ряда. Это обусловлено следующим общим соображением: очевидно, чем больше разнесены во времени члены временного ряда xt и xt+, тем слабее взаимосвязь этих членов и, соответственно, тем меньше должно быть по абсолютной величине значение r(). При этом в ряде случаев существует такое пороговое значение r0, начиная с которого все значения будут тождественно равны нулю.

Частная автокорреляционная функция rчаст(). С помощью этой функции реализуется идея измерения автокорреляции, существующей между разделенными тактами времени членами временного ряда xt и xt+, при устраненном опосредованном влиянии на эту взаимозависимость всех промежуточных членов этого временного ряда. Частная автокорреляция 1-го порядка может быть подсчитана с использованием соотношения:

где среднее значение анализируемого стационарного процесса.

Частные автокорреляции более высоких порядков могут быть подсчитаны аналогичным образом по элементам общей корреляционной матрицы R = ||rij||, в которой rij = = r(xi, xj) = r(|i j|), где i, j = 1,…, T и r(0) = 1. Так, например, частная автокорреляция 2-го порядка определяется по формуле:

Эмпирические (выборочные) версии автокорреляционных функций получаются с помощью тех же соотношений (2.4), (2.5) при замене участвующих в них теоретических значений автокорреляций r() их статистическими оценками.

Полученные таким образом частные автокорреляции rчаст(1),rчаст (2),… можно нанести на график, в котором роль абсциссы выполняет величина сдвига. Знание автокорреляционных функций r() и rчаст() оказывает существенную помощь в решении задачи подбора и идентификации модели анализируемого временного ряда.

Использование свойств этой функции в прикладном анализе временных рядов определяется как «спектральный анализ временных рядов». Достаточно полное описание этого подхода приведено, например, в [Дженкинс, Ватс (1971, 1972)] и [Ллойд, Ледерман (1990)]. Применительно к статистическому анализу экономических рядов динамики этот подход не получил широкого распространения, т.к. эмпирический анализ спектральной плотности требует в качестве своей информационной базы либо достаточно длинных стационарных временных рядов, либо нескольких траекторий анализируемого временного ряда (и та и другая ситуация весьма редки в практике статистического анализа экономических рядов динамики).

Для содержательного анализа важно, что величина спектральной плотности характеризует силу взаимосвязи, существующей между временным рядом xt и гармоникой с периодом 2/. Это позволяет использовать спектр как средство улавливания периодичностей в анализируемом временном ряду: совокупность пиков спектра определяет набор гармонических компонентов в разложении. Если в ряде содержится скрытая гармоника частоты, то в нем присутствуют также периодические члены с частотами /2, /3 и т.д. Это так называемое «эхо», повторяемое спектром на низких частотах. Эффект «эха» анализировался в статье на примере ряда ежемесячных безналичных расчетов между банками США за 1875-1958 гг.

Можно несколько расширить класс моделей стационарных временных рядов, используемых при анализе конкретных рядов экономической динамики.

Определение 2.2. Ряд называется слабо стационарным (или стационарным в широком смысле), если его среднее значение, дисперсия и ковариации не зависят от t.

2.2. Неслучайная составляющая временного ряда и методы его сглаживания.

Существенную роль в решении задач выявления и оценивания трендовой, сезонной и циклической составляющих в разложении (1.1.1) играет начальный этап анализа, на котором:

выявляется сам факт наличия/отсутствия неслучайной (и зависящей от времени t) составляющей в разложении (1.1.1); по существу, речь идет о статистической проверке гипотезы

H0: Ext = = const (2.6)

(включая утверждение о взаимной статистической независимости членов исследуемого временного ряда) при различных вариантах конкретизации альтернативных гипотез типа

строится оценка (аппроксимация) для неизвестной интегральной неслучайной составляющей f(t) = 1fтр(t) + 2(t) +3(t), т.е. решается задача сглаживания (элиминирования случайных остатков t) анализируемого временного ряда xt.

Методы выделения неслучайной составляющей в траектории, отражающей поведение временного ряда, подразделяются на два типа.

Методы первого типа (аналитические) основаны на допущении, что известен общий вид неслучайной составляющей в разложении

f(t) = 1fтр(t) + 2(t) +3(t). (2.8)

Например, если известно, что неслучайная составляющая временного ряда описывается линейной функцией времени f(t) = 0 + 1t, где 0 и 1 некоторые неизвестные параметры модели, то задача ее выделения (задача элиминирования случайных остатков или задача сглаживания временного ряда) сводится к задаче построения хороших оценок и для параметров модели.

Методы второго типа (алгоритмические) не связаны ограничительным допущением о том, что общий аналитический вид искомой функции (2.8) известен исследователю. В этом смысле они являются более гибкими, более привлекательными. Однако «на выходе» задачи они предлагают исследователю лишь алгоритм расчета оценки для искомой функции f(t) в любой наперед заданной точке t и не претендуют на аналитическое представление функции.

Аналитические методы выделения (оценки) неслучайной составляющей временного ряда. Эти методы реализуются в рамках моделей регрессии, в которых в роли зависимой переменной выступает переменная xt, а в роли единственной объясняющей переменной время t. Таким образом, рассматривается модель регрессии вида

xt = f(t,) + t, t = 1,…, T, в которой общий вид функции f(t,) известен, но неизвестны значения параметров = (0, 1,…, m). Оценки параметров строятся по наблюдениям. Выбор метода оценивания зависит от гипотетического вида функции f(t,) и стохастической природы случайных регрессионных остатков t.

Алгоритмические методы выделения неслучайной составляющей временного ряда (методы скользящего среднего). В основе этих методов элиминирования случайных флуктуаций в поведении анализируемого временного ряда лежит простая идея: если «индивидуальный» разброс значений члена временного ряда xt около своего среднего (сглаженного) значения a характеризуется дисперсией 2, то разброс среднего из N членов временного ряда (x1 + x2 +…+ xT) / N около того же значения a будет характеризоваться гораздо меньшей величиной дисперсии, а именно дисперсией, равной 2 / N. А уменьшение меры случайного разброса (дисперсии) и означает как раз сглаживание соответствующей траектории. Поэтому выбирают некоторую нечетную «длину усреднения» N = 2m + 1, измеренную в числе подряд идущих членов анализируемого временного ряда. А затем сглаженное значение временного ряда xt вычисляют по значениям xtm, xtm+1,…, xt, xt+1,…, xt+m

где wk (k = m, m + 1,…, m) некоторые положительные «весовые» коэффициенты, в сумме равные единице, т.е. wk > 0 и. Поскольку, изменяя t от m + 1 до T m, мы как бы «скользим» по оси времени, то и методы, основанные на формуле (2.9), принято называть методами скользящей средней (МСС).

Очевидно, один МСС отличается от другого выбором параметров m и wk.

Определение параметров wk основано на следующей процедуре. В соответствии с теоремой Вейерштрасса любая гладкая функция f(x) при самых общих допущениях может быть локально представлена алгебраическим полиномом подходящей степени p. Поэтому берем первые 2m + 1 членов временного ряда x1,…, x2m+1, строим с помощью МНК полином степени p, аппроксимирующий поведение этой начальной части траектории временного ряда, и используем этот полином для определения оценки сглаженного значения f(t) временного ряда в средней (т.е. (m + 1)-й) точке этого отрезка ряда, т.е. полагаем. Затем «скользим» по оси времени на один такт и таким же способом подбираем полином той же степени p к отрезку временного ряда x2,…, xm+2 и определяем оценку сглаженного значения временного ряда в средней точке сдвинутого на единицу отрезка временного ряда, т.е., и т.д.

В результате мы найдем оценки для сглаженных значений анализируемого временного ряда при всех t, кроме t = 1,…, m и t = T,… T m + 1.

Подбор наилучшего (в смысле критерия МНК) аппроксимирующего полинома к траектории анализируемого временного ряда приводит к формуле вида, причем результат не зависит от того, для какого именно из «скользящих» временных интервалов был осуществлен этот подбор.

Метод экспоненциально взвешенного скользящего среднего (метод Брауна ). В соответствии с этим методом оценка сглаженного значения в точке t определяется как решение оптимизационной задачи вида

где 0 < < 1. Следовательно, веса k в критерии Q(f) обобщенного («взвешенного») МНК уменьшаются экспоненциально по мере удаления наблюдений xtk в прошлое. Решение оптимизационной задачи (2.10) дает:

В отличие от обычного МСС здесь скользит только правый конец интервала усреднения и, кроме того, веса экспоненциально уменьшаются по мере удаления в прошлое. Формула (2.11) дает оценку сглаженного значения временного ряда не в средней, а в правой конечной точке интервала усреднения.

2.3. Модели стационарных временных рядов и их идентификация.

В 2.2 рассматривался класс стационарных временных рядов, в рамках которого подбирается модель, пригодная для описания поведения случайных остатков исследуемого временного ряда (1). Здесь рассматривается набор линейных параметрических моделей из этого класса и методы их идентификации. Таким образом, речь здесь идет не о моделировании временных рядов, а о моделировании их случайных остатков t, получающихся после элиминирования из исходного временного ряда xt его неслучайной составляющей (2.8). Следовательно, в отличие от прогноза, основанного на регрессионной модели, игнорирующего значения случайных остатков, в прогнозе временных рядов существенно используется взаимозависимость и прогноз самих случайных остатков.

Введем обозначения. Так как здесь описывается поведение случайных остатков, то моделируемый временной ряд обозначим t, и будем полагать, что при всех t его математическое ожидание равно нулю, т.е. Et, 0. Временные последовательности, образующие «белый шум», обозначим t.

Описание и анализ, рассматриваемых ниже моделей, формулируется в терминах общего линейного процесса, представимого в виде взвешенной суммы настоящего и прошлых значений белого шума, а именно:

Таким образом, белый шум представляет собой серию импульсов, в широком классе реальных ситуаций генерирующих случайные остатки исследуемого временного ряда.

Временной ряд t можно представить в эквивалентном виде, при котором он получается в виде классической линейной модели множественной регрессии, в которой в качестве объясняющих переменных выступают его собственные значения во все прошлые моменты времени:

При этом весовые коэффициенты 1, 2,… связаны определенными условиями, обеспечивающими стационарность ряда t. Переход от (2.14) к (2.13) осуществляется с помощью последовательной подстановки в правую часть (2.14) вместо t1, t2,… их выражений, вычисленных в соответствии с (2.14) для моментов времени t 1, t 2 и т.д.

Рассмотрим также процесс смешанного типа, в котором присутствуют как авторегрессионные члены самого процесса, так и скользящее суммирование элементов белого шума:

Будем подразумевать, что p и q могут принимать и бесконечные значения, а также то, что в частных случаях некоторые (или даже все) коэффициенты или равны нулю.

Рассмотрим сначала простейшие частные случаи.

Модель авторегрессии 1-го порядка AR(1) (марковский процесс). Эта модель представляет собой простейший вариант авторегрессионного процесса типа (2.14), когда все коэффициенты кроме первого равны нулю. Соответственно, она может быть определена выражением

t = t1 + t, (2.15)

где некоторый числовой коэффициент, не превосходящий по абсолютной величине единицу (|| < 1), а t последовательность случайных величин, образующая белый шум. При этом t зависит от t и всех предшествующих, но не зависит от будущих значений. Соответственно, в уравнении (2.15) t не зависит от t1 и более ранних значений. В связи с этим, t называют инновацией (обновлением).

Последовательности, удовлетворяющие соотношению (2.15), часто называют также марковскими процессами. Это означает, что

r(t, tk) = k, (2.17)

cov(t, tk) = kDt. (2.19)

Одно важное следствие (2.19) состоит в том, что если величина || близка к единице, то дисперсия t будет намного больше дисперсии. А это значит, что если соседние значения ряда t сильно коррелированы, то ряд довольно слабых возмущений t будет порождать размашистые колебания остатков t.

Условие стационарности ряда (2.15) определяется требованием к коэффициенту: || < 1, или, что то же, корень z0 уравнения 1 z = 0 должен быть по абсолютной величине больше единицы.

Автокорреляционная функция марковского процесса определяется соотношением (2.17):

r() = r(t, t) =. (2.20)

Отсюда же, в частности, следует простая вероятностная интерпретация параметра: = r(t, t1), т.е. значение определяет величину корреляции между двумя соседними членами ряда t.

Из (2.20) видно, что степень тесноты корреляционной связи между членами последовательности (2.15) экспоненциально убывает по мере их взаимного удаления друг от друга во времени.

Частная автокорреляционная функция rчаст() = r(t, t+ | t+1 = t+2 =…= t+1 = 0) может быть подсчитана с помощью формул (2.4)-(2.5). Непосредственное вычисление по этим формулам дает следующий простой результат: значения частной корреляционной функции rчаст() равны нулю для всех = 2, 3,…. Это свойство может быть использовано при подборе модели: если вычисленные выборочные частные корреляции статистически незначимо отличаются от нуля при = 2, 3,…, то использование модели авторегрессии 1-го порядка для описания поведения случайных остатков временного ряда не противоречит исходным статистическим данным.

Спектральная плотность марковского процесса (2.15) может быть подсчитана с учетом известного вида автокорреляционной функции (2.20):

В случае значения параметра близкого к 1, соседние значения ряда t близки друг к другу по величине, автокорреляционная функция экспоненциально убывает оставаясь положительной, а в спектре преобладают низкие частоты, что означает достаточно большое среднее расстояние между пиками ряда t. При значении параметра близком к -1, ряд быстро осциллирует (в спектре преобладают высокие частоты), а график автокорреляционной функции экспоненциально спадает до нуля с попеременным изменением знака.

Идентификация модели, т.е. статистическое оценивание ее параметров и по имеющейся реализации временного ряда xt (а не его остатков, которые являются ненаблюдаемыми), основана на соотношениях (2.16)(2.19) и может быть осуществлена с помощью метода моментов. Для этого следует предварительно решить задачу выделения неслучайной составляющей, что позволит оперировать в дальнейшем остатками.

Затем подсчитывается выборочная дисперсия остатков по формуле

где, а «невязки» (остатки) вычислены по формуле.

Оценку параметра получаем с помощью формулы (2.18), подставляя в нее вместо коэффициента корреляции его выборочное значение, т.е. .

Наконец, оценка параметра основана на соотношении (2.19), в котором величины Dt и заменяются оценками, соответственно, и:

Модели авторегрессии 2-го порядка - AR(2) (процессы Юла). Эта модель, как и AR(1), представляет собой частный случай авторегрессионного процесса, когда все коэффициенты j в правой части (2.14) кроме первых двух, равны нулю. Соответственно, она может быть определена выражением

t = 1t1 + 2t2 + t, (2.22)

где последовательность 1, 2,… образует белый шум.

Условия стационарности ряда (2.22) (необходимые и достаточные) определяются как:

В рамках общей теории моделей те же самые условия стационарности получаются из требования, чтобы все корни соответствующего характеристического уравнения лежали бы вне единичного круга. Характеристическое уравнение для модели авторегрессии 2-го порядка имеет вид:

Автокорреляционная функция процесса Юла подсчитывается следующим образом. Два первых значения r(1) и r(2) определены соотношениями

а значения для r(), = 3, 4,… вычисляются с помощью рекуррентного соотношения

r() = 1r(1) + 2r(2).

Частная автокорреляционная функция временного ряда, сгенерированного моделью авторегрессии 2-го порядка, обладает следующим отличительным свойством:rчаст() = 0 при всех = 3, 4,…

Спектральная плотность процесса Юла может быть вычислена с помощью формулы:

По значениям вычисляются оценки и, соответственно, дисперсии Dt и автокорреляций r(1) и r(2). Это делается с помощью соотношений (2.2) и (2.3):

Модели авторегрессии p-го порядка - AR(p) (p 3). Эти модели, образуя подмножество в классе общих линейных моделей, сами составляют достаточно широкий класс моделей. Если в общей линейной модели (2.14) полагать все параметры j, кроме первых p коэффициентов, равными нулю, то мы приходим к определению AR(p)-модели:

где последовательность случайных величин 1, 2,… образует белый шум.

Условия стационарности процесса, генерируемого моделью (2.23), также формулируются в терминах корней его характеристического уравнения

1 1z 2z2 … pzp = 0.

Для стационарности процесса необходимо и достаточно, чтобы все корни характеристического уравнения лежали бы вне единичного круга, т.е. превосходили бы по модулю единицу.

Автокорреляционная функция процесса (2.23) может быть вычислена с помощью рекуррентного соотношения по первым p ее значениям r(1),…, r(p). Это соотношение имеет вид:

r () = 1r(1) + 2r(2) +…+ pr(p), = p + 1, p + 2,… (2.24)

Частная автокорреляционная функция процесса (2.23) будет иметь ненулевые значения лишь при p; все значения rчаст(p) при > p будут нулевыми см., например, [Бокс, Дженкинс (1974)]… Это свойство частной автокорреляционной функции AR(p)-процесса используется, в частности, при подборе порядка в модели авторегрессии для конкретных анализируемых временных рядов. Если, например, все частные коэффициенты автокорреляции, начиная с порядка k, статистически незначимо отличаются от нуля, то порядок модели авторегрессии естественно определить равным p = k 1.

Идентификация модели авторегрессии p-го порядка основана на соотношениях, связывающих между собой неизвестные параметры модели и автокорреляции исследуемого временного ряда. Для вывода этих соотношений последовательно подставляются в (2.24) значения = 1, 2,…, p. Получается система линейных уравнений относительно 1, 2,…, p:

называемая уравнениями Юла-УокераYule (1927), Walker (1931)… Оценки для параметров k получим, заменив теоретические значения автокорреляций r(k) их оценками и решив полученную таким образом систему уравнений.

Оценка параметра получается из соотношения заменой всех участвующих в правой части величин их оценками.

2.3.2. Модели скользящего среднего порядка q (МА(q)-модели).

Рассмотрим частный случай общего линейного процесса (2.13), когда только первые q из весовых коэффициентов j ненулевые. В это случае процесс имеет вид

t = t 1t1 2t2 … qtq, (2.26)

где символы 1,…, q используются для обозначения конечного набора параметров, участвующих в (2.13). Процесс (2.26) называется моделью скользящего среднего порядка q (МА(q)).

Двойственность в представлении AR- и МА-моделей и понятие обратимости МА-модели. Из (2.13) и (2.14) видно, что один и тот же общий линейный процесс может быть представлен либо в виде AR-модели бесконечного порядка, либо в виде МА-модели бесконечного порядка.

Соотношение (2.26) может быть переписано в виде

t =t + 1t1 + 2t2 +…+ qtq.

t = t 1t1 2t2 …, (2.27)

где коэффициенты j (j = 1, 2,…) определенным образом выражаются через параметры 1,…, q. Соотношение (2.27) может быть записано в виде модели авторегрессии бесконечного порядка (т.е. в виде обращенного разложения)

Известно (см., например, [Бокс, Дженкинс, (1974)]), что условие обратимости МА(q)-модели (т.е. условие сходимости ряда) формулируется в терминах характеристического уравнения модели (2.26) следующим образом:

Все корни характеристического уравнения должны лежать вне единичного круга, т.е. |zj| > 1 для всех j = 1, 2,…, q.

Основные характеристики процесса МА(q). Таким образом, автокорреляционная функция r() процесса МА(q) равна нулю для всех значений, больших порядка процесса q. Это важное свойство используется при подборе порядка МА(q)-модели по экспериментальным данным;

Спектральная плотность процесса МА(q) может быть вычислена с помощью соотношения:

Идентификация модели МА(q) производится на базе соотношений (2.29), а именно: 1) по значениям с помощью формулы подсчитываются значения; 2) в соотношения последовательно подставляются значения = 1,…, q с заменой в левой их части величин r() полученными ранее оценками; 3) полученная таким образом система из q уравнений разрешается относительно неизвестных значений 1,…, q; решения этой системы и дадут оценки неизвестных параметров модели; 4) оценка параметра может быть получена с помощью первого из соотношений (2.28) подстановкой в него вместо (0), 1,…, q их оценок.

Заметим, что в отличие от системы уравнений ЮлаУокера (2.25), уравнения для определения оценок параметров МА(q)-модели нелинейны. Поэтому эти уравнения приходится решать с помощью итерационных процедур см., например, Бокс, Дженкинс (1974).

Взаимосвязь процессов AR(q) и МА(q). Сделаем ряд замечаний о взаимосвязях между процессами авторегрессии и скользящего среднего.

Для конечного процесса авторегрессии порядка p t может быть представлено как конечная взвешенная сумма предшествующих, или t может быть представлено как бесконечная сумма предшествующих. В то же время, в конечном процессе скользящего среднего порядка q t может быть представлено как конечная взвешенная сумма предшествующих или t как бесконечная взвешенная сумма предшествующих.

Конечный процесс МА имеет автокорреляционную функцию, обращающуюся в нуль после некоторой точки, но так как он эквивалентен бесконечному процессу AR, его частная автокорреляционная функция бесконечно протяженная. Главную роль в ней играют затухающие экспоненты и (или) затухающие синусоиды. И наоборот, процесс AR имеет частную автокорреляционную функцию, обращающуюся в нуль после некоторой точки, но его автокорреляционная функция имеет бесконечную протяженность и состоит из совокупности затухающих экспонент и или затухающих синусоид.

Параметры процесса авторегрессии конечного порядка не должны удовлетворять каким-нибудь условиям для того, чтобы процесс был стационарным. Однако для того чтобы процесс МА был обратимым, корни его характеристического уравнения должны лежать вне единичного круга.

Спектр процесса скользящего среднего является обратным к спектру соответствующего процесса авторегрессии.

Представление процесса типа МА в виде процесса авторегрессии неэкономично с точки зрения его параметризации. Аналогично процесс AR не может быть экономично представлен с помощью модели скользящего среднего. Поэтому для получения экономичной параметризации иногда бывает целесообразно включить в модель как члены, описывающие авторегрессию, так и члены, моделирующие остаток в виде скользящего среднего. Такие линейные процессы имеют вид

t = 1t1 +…+ ptp + t 1t1 … qtq (2.30)

Стационарность и обратимость ARMA(p, q)-процессов. Записывая процесс (2.30) в виде (2.31) где, можно провести анализ стационарности (2.31) по той же схеме, что и для AR(p)-процессов. При этом различие “остатков” и е никак не повлияет на выводы, определяющие условия стационарности процесса авторегрессии. Поэтому процесс (2.30) является стационарным тогда и только тогда, когда все корни характеристического уравнения AR(p)-процесса лежат вне единичного круга.

Аналогично, обозначив и рассматривая процесс (2.30) в виде, получаем те же выводы относительно условий обратимости этого процесса, что и для процесса МА(q): для обратимости ARMA(p, q)-процесса необходимо и достаточно, чтобы все корни характеристического уравнения МА(q)-процесса лежали бы вне единичного круга.

Автокорреляционная функция анализируется аналогично, тому как это делалось для AR- и МА-процессов, что позволяет сделать следующие выводы.

1) Из соотношений () = 1(1) +…+ p(p) + () 1(1) … q(q), (где (k) = E(tkt) «перекрестная» ковариационная функция последовательностей t и t) для = 0, 1,…, q следует, что ковариации (0), (1),…, (q) и, соответственно, автокорреляции r(1),…, r(q) связаны определенной системой зависимостей с q параметрами скользящего среднего 1,…, q и p параметрами авторегрессии 1,…, p. При этом перекрестные ковариации (), (1),…, (q) при положительных значениях сдвига по времени равны нулю, а при отрицательных тоже могут быть выражены в терминах параметров 1,…, p,1,…, q с помощью следующего приема: пусть k > 0; тогда (k) = E(tkt); в произведении tkt с помощью (k + 1)-кратной последовательной подстановки первого сомножителя по формуле (2.30) он заменяется линейной комбинацией t1, элементов белого шума и параметров модели, что после применения к получившемуся произведению операции усреднения E дает выражение, зависящее только от параметров модели (поскольку E(t1t) = 0).

2) Значения автокорреляционной функции r() для q + 1 вычисляются по рекуррентному соотношению r() = 1r(1) + 2r(2) +…+ pr(p) при q + 1, которое в точности повторяет аналогичное рекуррентное соотношение (2.24) для автокорреляционной функции процесса AR(p). Это значит, что, начиная с = q + 1, автокорреляционная функция процесса ARMA(p, q) ведет себя так же, как и автокорреляционная функция процесса AR(p), т.е. она будет состоять из совокупности затухающих экспонент и (или) затухающих синусоид, и ее свойства определяются коэффициентами 1,…, p и начальными значениями r(1),…, r(p).

Частная автокорреляционная функция процесса ARMA(p, q) при больших ведет себя как частная автокорреляционная функция МА(q)-процесса. Это значит, что в ней преобладают члены типа затухающих экспонент и (или) затухающих синусоид (соотношение между теми и другими зависит от порядка скользящего среднего q и значений параметров процесса).

Спектральная плотность процесса ARMA(p, q) может быть вычислена с помощью соотношения:

Идентификация процесса ARMA(p, q) базируется (так же как и AR-и МА-моделях) на статистическом оценивании параметров модели с помощью метода моментов. Процедура оценивания параметров k (k = 1, 2,…, p), j (j = 1, 2,…, q)и разбивается на два этапа. На 1-м этапе получаются оценки параметров k, на 2-м оценки параметров j и.

1-й этап. Параметры автокорреляционной составляющей модели (2.30) удовлетворяют системе линейных уравнений:

Подставляя в (2.32) вместо r(k) их выборочные значения и решая получившуюся систему относительно j (j = 1,…, p), получаем оценки.

2-й этап. Подставляя полученные оценки в (2.30) получаем набор из q + 1 соотношений:

Эта система позволяет получить нелинейные зависимости, связывающие искомые параметры, 1,…, q с автоковариациями и построенными на 1-м этапе оценками.

Заключение

Эконометрика - метод экономического анализа, который объединяет экономическую теорию со статистическими и математическими методами анализа. Это попытка улучшить экономические прогнозы и сделать возможным успешное планирование экономической политики. В эконометрике экономические теории выражаются в виде математических соотношений, а затем проверяются эмпирически статистическими методами. Данная система используется, чтобы создать модели с целью прогнозирования таких важных показателей, как валовой национальный продукт, уровень безработицы, темп инфляции и дефицит федерального бюджета. Эконометрика используется все более широко, несмотря на то, что полученные с помощью нее прогнозы не всегда оказывались достаточно точными.

Проблемы в эконометрики многочисленны и разнообразны. Экономика - это сложный, динамический, многомерный и эволюционирующий объект, поэтому изучать ее трудно. Как общество, так и общественная система изменяются со временем, законы меняются, происходят технологические инновации, поэтому найти в этой системе инварианты непросто. Временные ряды коротки, сильно агрегированы, разнородны, нестационарны, зависят от времени и друг от друга, поэтому мы имеем мало эмпирической информации для изучения. Экономические величины измеряются неточно, подвержены значительным позднейшим исправлениям, а важные переменные часто не измеряются или ненаблюдаемы, поэтому все выводы неточны и ненадежны. Экономические теории со временем меняются, соперничающие объяснения сосуществуют друг с другом, и поэтому надежная теоретическая основа для моделей отсутствует. И среди самих эконометристов, по-видимому, нет согласия по поводу того, как следует заниматься их предметом.

В последние годы большое внимание в эконометрической литературе уделяется анализу структурных свойств экономических временных рядов. Это вызвано тем, что далеко не всегда значения временного ряда формируются под воздействием некоторых факторов. Нередко бывает, что развитие того или иного процесса обусловлено его внутренними закономерностями, а отклонения от детерминированного процесса вызваны ошибками измерений или случайными флуктуациями. В последнее время появилось достаточно большое количество работ, в которых рассматриваются различные эконометрические аспекты развития Российской экономики.

Для временных рядов главный интерес представляет описание или моделирование их структуры. Цель таких исследований, как правило, шире моделирования, хотя некоторую информацию можно получить и непосредственно из модели, делая выводы о выполнении тех или иных экономических законов (скажем, закона паритета покупательной способности) и проверяя различные гипотезы. Построенная модель может использоваться для экстраполяции или прогнозирования временного ряда, и тогда качество прогноза может служить полезным критерием при выборе среди нескольких моделей. Построение хороших моделей ряда необходимо и для других приложений, таких, как корректировка сезонных эффектов и сглаживание. Наконец, построенные модели могут использоваться для статистического моделирования длинных рядов наблюдений при исследовании больших систем, для которых временной ряд рассматривается как входная информация.

Литература

1. Ефимова М. Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики, М.: Инфра-Н, 2000г.

2. Елисеева И.И. Юзбашев М.М. Общая теория статистики. Москва, «Финансы и статиска» 2005.

3. А.О.Крыштановский. Методы анализа временных рядов // Мониторинг общественного мнения: экономические и социальные перемены. 2000. № 2 (46). С. 44-51. [Статья]

4. Шмойлова Р. А. Теория статистики, М.: Финансы и статистика, 1996г.

5. Теория статистики. Учебник./Под ред. Шмойлова Р. А. 3-е изд., перераб.-М.: Финансы и статистика, 2002

6. Гусаров В.М. Теория статистики. - М.: Аудит, 2001. - 248 с.

7. Кильдишев Г.С., Овсиенко В.Е., Рабинович П.М., Рябушкин Т.В. Общая теория статистики. - М.: Статистика, 2001. - 423 с.

8. Практикум по статистике: Учебное пособие для вузов (Под ред. В.М. Симчеры). ВЗФЭИ. - М.: ЗАО «Финстатинформ», 2001. - 259 с.

© shcool3murom.ru, 2024
35-я параллель - Образовательный портал