Эконометрический анализ влияния социально-экономических факторов на уровень рождаемости в Москве
Казарян Гаяне Аленовна
e-mail: gayanegayane2000@mail.ru
В настоящее время анализ демографических проблем является одним из наиболее актуальных направлений исследований. Как известно, главным демографическим показателем является коэффициент рождаемости. Наряду с коэффициентом смертности, он является составляющей частью естественного прироста населения. В совокупности данные коэффициенты влияют на социально-экономическую ситуацию в России, а также и на дальнейшее развитие страны в целом. Необходимо подчеркнуть: проблема рождаемости продолжает беспокоить российское правительство, о чем свидетельствуют утверждение в 2007 г. Концепции демографической политики РФ до 2025 г. и введение в 2006 г. программы материнского капитала, призванной к повышению рождаемости в стране.
Для дальнейшего анализа были выбраны наиболее значимые факторы, как среднедушевые доходы населения, число разводов на 1000 браков, доступность медицинской помощи, материнский капитал.
Для реализации данной цели был выбран субъект Российской Федерации, а именно Москва. Статистическая выборка данных была сформирована из открытых баз данных Федеральной службы государственной статистики Росстат. В качестве регрессоров модели использованы:
1. Общий коэффициент рождаемости (на 1000 чел. населения);
2. Среднедушевые доходы населения, руб.;
3. Число разводов на 1000 браков;
4. Доступность медицинской помощи
5. Материнский капитал
В качестве результативного фактора выступает показатель рождаемости в Москве (Y), на данный показатель влияет множество факторов. Для исследования было отобрано пять переменных: среднедушевой доход населения (Х1), число разводов на 1000 браков (Х2), уровень безработицы (Х3),доступность медицинской помощи (Х4), материнский капитал (Х5).
Спецификация модели имеет следующий вид:
Y=B0+B1*X1+B2*X2+B3*X3+В4*Х4+В5*Х5
Данные представлены в таблице 1.
Таблица 1. Динамика демографических, социально-экономических, биологических факторов
Год | Результат | Факторы | ||||
среднедушевой доход населения | число разводов на 1000 браков | уровень безработицы, в среднем за год | Доступность медицинской помощи | Материнский капитал | ||
Рождаемость, Чел. | ||||||
Y | X1 | Х2 | Х3 | Х4 | Х5 | |
2005 | 92188 | 24958 | 552 | 0,8 | 0,42885 | 0 |
2006 | 94271 | 29803 | 549 | 1,6 | 0,44897 | 0 |
2007 | 100955 | 35490 | 547 | 0,8 | 0,45526 | 250000 |
2008 | 107781 | 34207 | 545 | 0,9 | 0,47570 | 276250 |
2009 | 116081 | 43099 | 543 | 2,7 | 0,50477 | 312163 |
2010 | 122962 | 43876 | 527 | 1,7 | 0,51346 | 343379 |
2011 | 126655 | 47319 | 522 | 1,4 | 0,53967 | 365698 |
2012 | 134653 | 48935 | 490 | 0,8 | 0,56160 | 387640 |
2013 | 136021 | 54869 | 473 | 1,7 | 0,56903 | 408961 |
2014 | 137583 | 55473 | 457 | 1,5 | 0,57740 | 429409 |
2015 | 142390 | 60535 | 421 | 1,8 | 0,62650 | 453026 |
2016 | 145252 | 62004 | 415 | 1,8 | 0,65334 | 453026 |
2017 | 133653 | 65471 | 434 | 1,4 | 0,61907 | 453026 |
2018 | 132192 | 68386 | 427 | 2,1 | 0,63627 | 453026 |
2019 | 135637 | 74053 | 420 | 1,9 | 0,64388 | 466617 |
Для того, чтобы определить связь между результативным и факторными признаками, построим корреляционную матрицу с помощью операции «Анализ данных — корреляция» в Excel. Полученные результаты оформлены в таблице 2.
Таблица 2. Корреляционная матрица
У | Х1 | Х2 | Х3 | Х4 | ||
У | 1 | |||||
Х1 | 0,882028 | 1 | ||||
Х2 | -0,86608 | -0,9409 | 1 | |||
Х3 | 0,38358 | 0,480275 | -0,35738 | 1 | ||
Х4 | 0,925398 | 0,971295 | -0,97219 | 0,451345 | 1 | |
0,930447 | 0,88599 | -0,78985 | 0,369963 | 0,865828 | 1 |
По результатам анализа можно сделать вывод, практически все факторные признаки оказывают сильное влияние на результативный. Исключение составляют фактор Х3, значение корреляции которых по модулю меньше 0,5, что свидетельствует не о сильной, а о очень слабой связи.
Важно проанализировать характер связи. Прямая связь наблюдается между результативным фактором и факторами Х1, Х3, Х4, Х5, обратная – с факторами Х2. Прямая связь говорит о том, что на увеличение показателя рождаемости повлияло: увеличение среднедушевого дохода населения ,доступность медицинской помощи, такой фактор как уровень безработицы очень слабо влияет на увеличение рождаемости. Важно отметить, что фактор числа разводов находится в обратной связи с показателем рождаемости, т. е. с уменьшением числа разводов, показатель рождаемости возрос.
Исходя из этого можно предположить, что показатели Х2 и Х3 являются статистически незначимыми для фактора У. Данное положение подтвердим с помощью процедуры оценивания параметров линейной модели множественной регрессии, сформулированной в теореме Гаусса – Маркова. Для этого проверим статистическую значимость модели с помощью функции ЛИНЕЙН.(См. Таблицу 3)
Таблица 3. Результаты операции ЛИНЕЙН для пяти факторов
Условные обозначения | Характеристика | А5 | а4 | а3 | а2 | а1 | а0 |
ai | Коэффициенты | 0,076552217 | 274544,4499 | 601,3005502 | 1,428650261 | -0,998667449 | -5299,836009 |
Sai | Ошибки | 0,020861033 | 116587,7431 | 3022,077291 | 123,114918 | 0,40031681 | 113236,0839 |
R^2 | Процент правильно объясненных отклонений | 0,956388326 | 4558,678206 | #Н/Д | #Н/Д | #Н/Д | #Н/Д |
F | Число Фишера, характеризует качество модель (ее статистическую значимость) | 39,4733526 | 9 | #Н/Д | #Н/Д | #Н/Д | #Н/Д |
4101586658 | 187033922,8 | #Н/Д | #Н/Д | #Н/Д | #Н/Д | ||
tai | Дроби Стьюдента (Коэффициент делим на ошибку) tai = a / Sai | 3,669627291 | 2,354831156 | 0,198969282 | 0,011604201 | -2,494692764 | 3,669627291 |
taivs t крит. | t крит. =2,22813 | > t критич | > t критич | < t критич. | < t критич | < t критич |
Проведем тест Стьюдента, для этого рассчитаем дроби Стьюдента (tai)и сравним их с t критич. Если tai< tкритич.,то данная переменная несущественна и ее надо удалить из модели. В результате было подтверждено теоретическое предположение о том, что факторы Х2 и Х3 оказались несущественными, фактор Х1 также относится к показателям несущественным. Проведем редуцирование модели, оставив в ней только существенные переменные (Х4 и Х5).При удалении несущественной переменной, число Фишера и дроби Стьюдента должны увеличится. Проверим это с помощью функции ЛИНЕЙН (См. таблицу 4).
Таблица 4. Результаты операции ЛИНЕЙН для двух факторов
а2 | а1 | а0 | |
ai | 0,059125955 | 113132,3141 | 41492,96925 |
Sai | 0,018333851 | 37838,79477 | 15911,62968 |
R^2 | 0,92305191 | 5244,053468 | #Н/Д |
F | 71,97464525 | 12 | #Н/Д |
3958619420 | 330001161,3 | #Н/Д | |
tai | 3,224960991 | 2,98984983 | 2,607713358 |
> t критич. | > t критич. | ||
t критич. | 2,178813 |
Действительно, число Фишера (F) увеличилось со 39,47 до 71,97, также увеличились и дроби Стьюдента. Это подтверждает наш вывод о том, что факторы Х4 и Х5 статистически значимы. Факторная модель выглядит следующим образом:
Yi = 41492,96925 + 113132,3141*Х1i + 0,059125955*X2i + ei
Таким образом, было выявлено, что для объяснения модели влияние числа разводов на 1000 браков и уровень безработицы были несущественны, такой же вывод можно сделать и по фактору среднедушевого дохода. Наиболее значимым фактором в этой модели является увеличение материнского капитала, влияющий на рождаемость населения Москвы. В этой связи именно влияние данного фактора на рождаемость населения будет проанализировано в дальнейшем более подробно.
Проведем анализ влияния материнского капитала (факторный признак Х) на рождаемость населения (результативный признак У).
Для этого проведем тест Стьюдента и проверим качество модели по Fкритич. Результаты представлены в таблице 5 — 7
Таблица 5. Данные для определения качественности модели
а1 | а0 | |
ai | 0,106586732 | 87984,95159 |
Sai | 0,011642022 | 4281,217154 |
R^2 | 0,8657307 | 6655,420472 |
F | 83,82034568 | 13 |
3712790499 | 575830081,6 | |
tai | 9,155345197 | 20,55138724 |
tai> t критич. | Коэффициенты статистически значимы | |
t критич. | 2,160369 | |
Fкритич | 4,667192732 | |
F >Fкритич | Модель качественная |
Таблица 6. Вывод итогов операции РЕГРЕССИЯ
Регрессионная статистика | |
Множественный R | 0,930446506 |
R-квадрат | 0,8657307 |
Нормированный R-квадрат | 0,855402293 |
Стандартная ошибка | 6655,420472 |
Наблюдения | 15 |
Таблица 7. Вывод итогов операции РЕГРЕССИЯ — 2
Регрессионная статистика | |||||||||||
Множественный R | 0,930446506 | ||||||||||
R-квадрат | 0,8657307 | ||||||||||
Нормированный R-квадрат | 0,855402293 | ||||||||||
Стандартная ошибка | 6655,420472 | ||||||||||
Наблюдения | 15 | ||||||||||
Дисперсионный анализ | |||||||||||
df | SS | MS | F | Значимость F | |||||||
Регрессия | 1 | 3712790499 | 3712790499 | 83,82034568 | 4,95893E-07 | ||||||
Остаток | 13 | 575830081,6 | 44294621,66 | ||||||||
Итого | 14 | 4288620581 | |||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | ||||
Y-пересечение | 87984,95159 | 4281,217154 | 20,55138724 | 2,69426E-11 | 78735,94424 | 97233,95895 | 78735,94424 | 97233,95895 | |||
Переменная X 1 | 0,106586732 | 0,011642022 | 9,155345197 | 4,95893E-07 | 0,081435672 | 0,131737792 | 0,081435672 | 0,131737792 | |||
Результаты проведенного анализа говорит о том, что модель качественная и коэффициенты статистически значимы. Коэффициент корреляции rxy =0,93045, что говорит о высокой связи между показателями.
Модель: Yi = 87984,95159 + 0,106586732*Х1i + ei
Вывод: при увеличении материнского капитала, рождаемость увеличивается на 0,106586732.
Проиллюстрируем данную зависимость графически:

Рисунок 2. Зависимость рождаемости от материнского капитала
Далее, проверим модель на гетероскедастичность. Для этого проведем тест Голдфелда — Квандта, предварительно отсортировав значения по Х. (См. таблицу 8)
Таблица 8 – Тест Голдфелда — Квандта
№ | Год | Y | X | Результаты ЛИНЕЙН | |
1 | 2005 | 92188 | 0 | 0,057669171 | 92585,08347 |
2 | 2006 | 94271 | 0 | 0,015649479 | 3401,807924 |
3 | 2007 | 100955 | 250000 | 0,819054978 | 4840,536526 |
4 | 2008 | 107781 | 276250 | 13,57962164 | 3 |
5 | 2009 | 116081 | 312163 | 318181315,2 | 70292381,57 |
6 | 2010 | 122962 | 343379 | ESS1 (Дисперсия) | |
7 | 2011 | 126655 | 365698 | ||
8 | 2012 | 134653 | 387640 | ||
9 | 2013 | 136021 | 408961 | ||
10 | 2014 | 137583 | 429409 | ||
11 | 2015 | 142390 | 453026 | -0,201217718 | 229528,6077 |
12 | 2016 | 145252 | 453026 | 0,52874815 | 240991,0465 |
13 | 2017 | 133653 | 453026 | 0,046050955 | 6427,547089 |
14 | 2018 | 132192 | 453026 | 0,144822058 | 3 |
15 | 2019 | 135637 | 466617 | 5983086,05 | 123940084,8 |
ESS2 (Дисперсия) |
GQ = ESS2 / ESS1 = 123940084,8/70292381,57 = 1,763207932
Сравниваем GQcFкритическим. Fкритич. = 9,276628153. GQ<Fкритич. Следовательно, гетероскедастичность не обнаружена.
Следующим этапом анализа является проведение теста Дарбина-Уотсона и устранение автокорреляции при ее наличии. Для этого необходимо определить показатель е (остатки) с помощью функции РЕГРЕССИЯ. (См. таблицу 9).
Таблица 9. Тест Дарбина-Уотсона
е | e-1 | |
1 | 4203,048405 | — |
2 | 6286,048405 | 2083 |
3 | -13676,63461 | -19962,68302 |
4 | -9648,536329 | 4028,098283 |
5 | -5176,385638 | 4472,150691 |
6 | -1622,597066 | 3553,788572 |
7 | -308,5063388 | 1314,090727 |
8 | 5350,767586 | 5659,273925 |
9 | 4446,231872 | -904,5357144 |
10 | 3828,746374 | -617,4854973 |
11 | 6118,487523 | 2289,741149 |
12 | 8980,487523 | 2862 |
13 | -2618,512477 | -11599 |
14 | -4079,512477 | -1461 |
15 | -2083,132752 | 1996,379724 |
CУММКВ | 575830081,6 | 640747224,6 |
Знаменатель | Числитель |
DW = 640747224,6/575830081,6=1,11. Построим диапазон изменений DW, чтобы определить, в какую область попадает рассчитанный показатель (рисунок 4) . При K = 1, N = 15, нижняя граница dl = 1,08; верхняя граница du = 1,36
положительная автокорреляция | зона неопределенности | нет автокорреляции | зона неопределенности | Отрицательная автокорреляция | ||||||
Диапазон изменения QW (от 0 до 4) | ||||||||||
dl | du | 4-du | 4-dl | |||||||
0 | 1,08 | 1,36 | 2 | 2,64 | 2,92 | 4 |
Рисунок 4. Диапазон изменений DW
DW попадает в зону неопределенности, следовательно, проведем процедуру по ее устранению. Рассчитаем значение Yt-1, и найдем остатки е(См. таблицу 10).
Таблица 10. Устранение автокорреляции.
Yt-1 | Y | e | e-1 |
92188 | |||
92188 | 94271 | -5742,459801 | — |
94271 | 100955 | -822,7093431 | 4919,750458 |
100955 | 107781 | 342,1077779 | 1164,817121 |
107781 | 116081 | 2860,654407 | 2518,546629 |
116081 | 122962 | 2711,75945 | -148,8949574 |
122962 | 126655 | 576,7224372 | -2135,037012 |
126655 | 134653 | 5446,842669 | 4870,120232 |
134653 | 136021 | 40,73425082 | -5406,108418 |
136021 | 137583 | 444,0720458 | 403,337795 |
137583 | 142390 | 3928,096633 | 3484,024588 |
142390 | 145252 | 2718,686385 | -1209,410248 |
145252 | 133653 | -11304,35691 | -14023,0433 |
133653 | 132192 | -2941,290453 | 8363,066459 |
132192 | 135637 | 1741,140454 | 4682,430908 |
135637 | 241798722,6 | 391704017,6 |
Новое значение DW = 391704017,6/241798722,6 = 1,619959003 – попадает в зону отсутствия автокорреляции.
Выводы: таким образом, были проведены все тесты, подтверждающие качество анализируемой модели. В результате анализа влияния материнского капитала (факторный признак Х) на рождаемость населения (результативный признак У) была установлена сильная связь между признаками и рассчитано, что при увеличении материнского каптала рождаемость увеличивается на 0,106586732.
Государство выделяет большие средства на увеличение материнского капитала, а также на различные пособия по беременности и уходу за ребенком. Но чтобы улучшить демографическую ситуацию недостаточно концентрироваться на одной сфере, необходимо комплексно подходить к решению обозначенной проблемы, а именно решать проблемы в социально-экономической сфере.