3. О чем пойдет речь в этой лекции 1 1 . Классическая линейная регрессия 2. Нелинейная модель 3. Специальные виды переменных Виды множественной регрессии
4. Интерпретация линейной модели регрессии 1 Интерпретация: коэффициент регрессии при переменной X 1 выражает предельный прирост зависимой переменной при изменении переменной X 1 , при условии постоянства других переменных. Классическая линейная регрессия Интерпретация регрессии Пример: LS GASO C DPI PRELGASO
5. Интерпретация логарифмической модели регрессии 1 Интерпретация: коэффициент регрессии при переменной log X 1 выражает эластичность зависимой переменной по переменной X 1 , при условии постоянства других переменных. Нелинейная логарифмическая регрессия Интерпретация регрессии Пример: LS LGGASO C LGDPI LGPRGASO
6. Оценка коэффициентов множественной регрессии 1 Величина оценки коэффициента регрессии формируется под влиянием не только связи изучаемого фактора с зависимой переменной, но и структуры связей между независимыми переменными. Классическая линейная регрессия Оценка коэффициента регрессии
7. Структура связей в множественной регрессии 1 Проявление множественных связей в парной регрессии Пример: LS GASO C PRELGASO
8. Смысл и роль замещающих переменных 1 Замещающие переменные Пример: LS GASO C TIME PRELGASO Замещающая переменная: переменная, коррелированная с отсутствующей переменной уравнения множественной регрессии, и выполняющая за счет этого функции этой отсутствующей переменной Включение замещающей переменной позволяет правильно оценить роль других факторов, освободив их от функции замещения отсутствующих переменных
9. Определение предельного вклада факторов 1 Анализ предельного вклада факторов Пример: LS HOUS C DPI LS HOUS C DPI PHOUS LS HOUS C DPI PHOUS TIME Множественная регрессия позволяет разложить суммарное влияние факторов на составные части, точнее выявив предельный вклад каждого фактора.
10.
11. Показатели качества коэффициентов регрессии 1 1. Стандартные ошибки коэффициентов 2. Значения t- статистик 3. Вспомогательные показатели ( P-value, ...) Показатели качества коэффициентов регрессии
12. Свойства коэффициентов регрессии 1 1. Оценки коэффициентов регрессии метода являются несмещенными 2. Оценки коэффициентов регрессии являются наилучшими среди несмещенных линейных оценок (BLUE) Свойства коэффициентов регрессии
13. Стандартные ошибки 1 Расчет стандартной ошибки коэффициента для случая двух факторов Стандартные ошибки
14. t- статистики 1 t -статистики Незначимость коэффициента регрессии не всегда может служить основанием для исключения соответствующей переменной из модели t- тесты обеспечивают проверку значимости предельного вклада каждой переменной при допущении, что все остальные переменные уже включены в модель
15. Показатели качества уравнения регрессии в целом 1 1. Показатель R 2 2. Скорректированный R 2 3. Значения F - статистики 4. Сумма квадратов остатков ( RSS) 5. Стандартная ошибка регрессии ( SEE ) Показатели качества уравнения в целом
16. Коэффициент детерминации Показывает долю объясненной дисперсии зависимой переменной R-squared или R 2 Коэффициент детерминации R 2 всегда увеличивается с включением новой переменной Показатели R 2 в разных моделях с разным числом переменных (и наблюдений) несравнимы Низкое значение R 2 не свидетельствует о низком качестве модели, и может объясняться наличием существенных факторов, не включенных в модель
17. Скорректированный R 2 Показывает долю объясненной дисперсии c учетом числа переменных уравнения регрессии (R-squared bar) Скорректированный коэффицент детерминации Скорректированные R 2 в разных моделях с разным числом переменных (и наблюдений) ограниченно сравнимы
18. F- статистика для проверки качества уравнения Представляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы) F - статистика где k - число объясняющих переменных
19. F- статистика для проверки качества уравнения F - статистика рассчитывается на основе коэффициента детерминации Использование F - статистики Для проверки значимости F - статистики используются таблицы F - распределения с k и ( n-k- 1 ) степеней свободы
20. Сумма квадратов остатков ( RSS ) Измеряет необъясненную часть вариации зависимой переменной Используется как основная минимизируемая величина в методе наименьших квадратов, и для расчета других показателей. Сумма квадратов остатков Показатели RSS в разных моделях с разным числом наблюдений (и переменных) несравнимы
21. Стандартная ошибка регрессии ( SEE ) Измеряет величину (квадрата) ошибки, приходящейся на одну степень свободы модели Используется в качестве основной величины для измерения качества оценивания модели (чем она меньше, тем лучше) Стандартная ошибка уравнения регрессии Показатели SEE в однотипных моделях с разным числом наблюдений (и переменных) сравнимы
22. Прямой доступ к показателям качества регрессии Все показатели качества регрессии в целом доступны с помощью вызова функций после расчета оцениваемой регрессии Показатели качества регрессии в MicroTSP @R2, @RBAR2, @F, @SSR, @SE SQR( ) При необходимости извлечения корня используется функция
23.
24. Регрессия в форме многочлена 36 Появляется возможность исследования зависимостей, для которых существенно наличие максимумов и минимумов и прямой анализ нелинейных эффектов Пример: GENR P=PGASO GENR P2=P^2 LS GASO C P P2 Многочлены от независимых переменных
25. Лаговые переменные 36 Пример: LS HOUS C DPI DPI(-1) X ( - 1), X ( - 2), X ( - 3),... Лаговые переменные
26.
27. Тест Чоу на структурный сдвиг 36 Тест Чоу F- cтатистика здесь представляет собой отношение меры улучшения качества уравнения в расчете на одну использованную степень свободы к мере необъясненной дисперсии в расчете на одну оставшуюся степень свободы. RSS T - сумма квадратов остатков для регрессии по всей выборке, RSS 1 , RSS 2 - по ее частям Статистика имеет F- распределение с k+ 1 и n-2k- 2 степенями свободы.
28. Вычисление и применение теста Чоу на структ. сдвиг 36 Тест Чоу Пример: SMPL 59 83 LS GASO C PGASO (RSS T ) SMPL 59 72 LS GASO C PGASO (RSS 1 ) SMPL 73 83 LS GASO C PGASO (RSS 2 ) =(RSS T -RSS 1 -RSS 2 )/2/(RSS 1 +RSS 2 )*21
29. Фиктивные переменные 36 Фиктивные переменные сдвига и наклона Значения D 1 равны нулю на первой части выборки и равны 1 на второй части выборки Переменная D 2 определяется как произведение D 1 на переменную X LS Y C D1 X D2
30. Интерпретация коэффиц. при фиктивных переменных 36 Фиктивные переменные сдвига и наклона На первой части выборки регрессия имеет коэффициенты a и b. На второй части выборки они возрастают, соответственно, на величину коэффициентов при фиктивных переменных сдвига и наклона Использование фиктивных переменных эквивалентно расчету регрессий на отдельных частях выборки Интерпретация коэффициентов Значимость коэффициентов при фиктивных переменных определяется с помощью t - статистики
31. Пример использования фиктивных переменных 36 Фиктивные переменные сдвига и наклона Пример: SMPL 59 83 GENR D1=0 SMPL 73 83 GENR D1=1 SMPL 59 83 GENR D2=D1*PGASO LS GASO C D1 PGASO D2