Эконометрический анализ влияния социально-экономических факторов на уровень рождаемости в Москве

Казарян Гаяне Аленовна
e-mail: gayanegayane2000@mail.ru

В настоящее время анализ демографических проблем является одним из наиболее актуальных направлений исследований. Как известно, главным демографическим показателем является коэффициент рождаемости. Наряду с коэффициентом смертности, он является составляющей частью естественного прироста населения. В совокупности данные коэффициенты влияют на социально-экономическую ситуацию в России, а также и на дальнейшее развитие страны в целом. Необходимо подчеркнуть: проблема рождаемости продолжает беспокоить российское правительство, о чем свидетельствуют утверждение в 2007 г. Концепции демографической политики РФ до 2025 г. и введение в 2006 г. программы материнского капитала, призванной к повышению рождаемости в стране.

Для дальнейшего анализа были выбраны наиболее значимые факторы, как среднедушевые доходы населения, число разводов на 1000 браков, доступность медицинской помощи, материнский капитал.

Для реализации данной цели был выбран субъект Российской Федерации, а именно Москва. Статистическая выборка данных была сформирована из открытых баз данных Федеральной службы государственной статистики Росстат. В качестве регрессоров модели использованы:

1. Общий коэффициент рождаемости (на 1000 чел. населения);

2. Среднедушевые доходы населения, руб.;

3. Число разводов на 1000 браков;

4. Доступность медицинской помощи

5. Материнский капитал

В качестве результативного фактора выступает показатель рождаемости в Москве (Y), на данный показатель влияет множество факторов. Для исследования было отобрано пять переменных: среднедушевой доход населения (Х1), число разводов на 1000 браков (Х2), уровень безработицы (Х3),доступность медицинской помощи (Х4), материнский капитал (Х5).

Спецификация модели имеет следующий вид:

Y=B0+B1*X1+B2*X2+B3*X3+В4*Х4+В5*Х5

Данные представлены в таблице 1.

Таблица 1. Динамика демографических, социально-экономических, биологических факторов

Год  РезультатФакторы  
  среднедушевой доход населениячисло разводов на 1000 браковуровень безработицы, в среднем  за годДоступность медицинской помощиМатеринский капитал
Рождаемость, Чел.  
 YX1Х2Х3Х4Х5
200592188249585520,80,428850
200694271298035491,60,448970
2007100955354905470,80,45526250000
2008107781342075450,90,47570276250
2009116081430995432,70,50477312163
2010122962438765271,70,51346343379
2011126655473195221,40,53967365698
2012134653489354900,80,56160387640
2013136021548694731,70,56903408961
2014137583554734571,50,57740429409
2015142390605354211,80,62650453026
2016145252620044151,80,65334453026
2017133653654714341,40,61907453026
2018132192683864272,10,63627453026
2019135637740534201,90,64388466617

Для того, чтобы определить связь между результативным и факторными признаками, построим корреляционную матрицу с помощью операции «Анализ данных — корреляция» в Excel. Полученные результаты оформлены в таблице 2.

Таблица 2. Корреляционная матрица

 УХ1Х2Х3Х4 
У1
Х10,8820281
Х2-0,86608-0,94091
Х30,383580,480275-0,357381
Х40,9253980,971295-0,972190,4513451
 0,9304470,88599-0,789850,3699630,8658281

По результатам анализа можно сделать вывод, практически все факторные признаки оказывают сильное влияние на результативный. Исключение составляют фактор Х3, значение корреляции которых по модулю меньше 0,5, что свидетельствует не о сильной, а о очень слабой связи.

Важно проанализировать характер связи. Прямая связь наблюдается между результативным фактором и факторами Х1, Х3, Х4, Х5, обратная – с факторами Х2. Прямая связь говорит о том, что на увеличение показателя рождаемости повлияло: увеличение среднедушевого дохода населения ,доступность медицинской помощи, такой фактор как уровень безработицы очень слабо влияет на увеличение рождаемости. Важно отметить, что фактор числа разводов находится в обратной связи с показателем рождаемости, т. е. с уменьшением числа разводов, показатель рождаемости возрос.

Исходя из этого можно предположить, что показатели Х2 и Х3 являются статистически незначимыми для фактора У. Данное положение подтвердим с помощью процедуры оценивания параметров линейной модели множественной регрессии, сформулированной в теореме Гаусса – Маркова. Для этого проверим статистическую значимость модели с помощью функции ЛИНЕЙН.(См. Таблицу 3)

Таблица 3. Результаты операции ЛИНЕЙН для пяти факторов

Условные обозначенияХарактеристикаА5а4а3а2а1а0
aiКоэффициенты0,076552217274544,4499601,30055021,428650261-0,998667449-5299,836009
SaiОшибки0,020861033116587,74313022,077291123,1149180,40031681113236,0839
R^2Процент правильно объясненных отклонений0,9563883264558,678206#Н/Д#Н/Д#Н/Д#Н/Д
FЧисло Фишера, характеризует качество модель (ее статистическую значимость)39,47335269#Н/Д#Н/Д#Н/Д#Н/Д
4101586658187033922,8#Н/Д#Н/Д#Н/Д#Н/Д
taiДроби Стьюдента (Коэффициент делим на ошибку) tai = a / Sai3,6696272912,3548311560,1989692820,011604201-2,4946927643,669627291
taivs t крит.t крит. =2,22813> t критич> t критич< t критич.< t критич< t критич 

Проведем тест Стьюдента, для этого рассчитаем дроби Стьюдента (tai)и сравним их с t критич. Если tai< tкритич.,то данная переменная несущественна и ее надо удалить из модели. В результате было подтверждено теоретическое предположение о том, что факторы Х2 и Х3 оказались несущественными, фактор Х1 также относится к показателям несущественным. Проведем редуцирование модели, оставив в ней только существенные переменные (Х4 и Х5).При удалении несущественной переменной, число Фишера и дроби Стьюдента должны увеличится. Проверим это с помощью функции ЛИНЕЙН (См. таблицу 4).

Таблица 4. Результаты операции ЛИНЕЙН для двух факторов

а2а1а0
ai0,059125955113132,314141492,96925
Sai0,01833385137838,7947715911,62968
R^20,923051915244,053468#Н/Д
F71,9746452512#Н/Д
3958619420330001161,3#Н/Д
tai3,2249609912,989849832,607713358
> t критич.> t критич.
t критич.2,178813

Действительно, число Фишера (F) увеличилось со 39,47 до 71,97, также увеличились и дроби Стьюдента. Это подтверждает наш вывод о том, что факторы Х4 и Х5 статистически значимы. Факторная модель выглядит следующим образом:

Yi = 41492,96925 + 113132,3141*Х1i + 0,059125955*X2i + ei         

Таким образом, было выявлено, что для объяснения модели влияние числа разводов на 1000 браков и уровень безработицы были несущественны, такой же вывод можно сделать и по фактору среднедушевого дохода. Наиболее значимым фактором в этой модели является увеличение материнского капитала, влияющий на рождаемость населения Москвы. В этой связи именно влияние данного фактора на рождаемость населения будет проанализировано в дальнейшем более подробно.

Проведем анализ влияния материнского капитала (факторный признак Х) на рождаемость населения (результативный признак У).

Для этого проведем тест Стьюдента и проверим качество модели по Fкритич. Результаты представлены в таблице 57

Таблица 5. Данные для определения качественности модели

а1а0
ai0,10658673287984,95159
Sai0,0116420224281,217154
R^20,86573076655,420472
F83,8203456813
 3712790499575830081,6
tai9,15534519720,55138724
tai> t критич.Коэффициенты статистически значимы
t критич.2,160369
Fкритич4,667192732
F >FкритичМодель качественная

Таблица 6. Вывод итогов операции РЕГРЕССИЯ

Регрессионная статистика
Множественный R0,930446506
R-квадрат0,8657307
Нормированный R-квадрат0,855402293
Стандартная ошибка6655,420472
Наблюдения15

Таблица 7. Вывод итогов операции РЕГРЕССИЯ — 2

Регрессионная статистика 
Множественный R0,930446506 
R-квадрат0,8657307 
Нормированный R-квадрат0,855402293 
Стандартная ошибка6655,420472 
Наблюдения15 
   
Дисперсионный анализ 
 dfSSMSFЗначимость F
Регрессия13712790499371279049983,820345684,95893E-07
Остаток13575830081,644294621,66
Итого144288620581   
 КоэффициентыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Нижние 95,0%Верхние 95,0%
Y-пересечение87984,951594281,21715420,551387242,69426E-1178735,9442497233,9589578735,9442497233,95895
Переменная X 10,1065867320,0116420229,1553451974,95893E-070,0814356720,1317377920,0814356720,131737792

Результаты проведенного анализа говорит о том, что модель качественная и коэффициенты статистически значимы. Коэффициент корреляции rxy =0,93045, что говорит о высокой связи между показателями.

Модель: Yi = 87984,95159 + 0,106586732*Х1i + ei

Вывод: при увеличении материнского капитала, рождаемость увеличивается на 0,106586732.

Проиллюстрируем данную зависимость графически:

Рисунок 2. Зависимость рождаемости от материнского капитала

Далее, проверим модель на гетероскедастичность. Для этого проведем тест Голдфелда — Квандта, предварительно отсортировав значения по Х. (См. таблицу 8)

Таблица 8 – Тест Голдфелда — Квандта

ГодYXРезультаты ЛИНЕЙН
120059218800,05766917192585,08347
220069427100,0156494793401,807924
320071009552500000,8190549784840,536526
4200810778127625013,579621643
52009116081312163318181315,270292381,57
62010122962343379ESS1 (Дисперсия)
72011126655365698
82012134653387640
92013136021408961
102014137583429409
112015142390453026-0,201217718229528,6077
1220161452524530260,52874815240991,0465
1320171336534530260,0460509556427,547089
1420181321924530260,1448220583
1520191356374666175983086,05123940084,8
ESS2 (Дисперсия)

GQ = ESS2 / ESS1 = 123940084,8/70292381,57 = 1,763207932

Сравниваем GQcFкритическим. Fкритич. = 9,276628153. GQ<Fкритич. Следовательно, гетероскедастичность не обнаружена.

Следующим этапом анализа является проведение теста Дарбина-Уотсона и устранение автокорреляции при ее наличии. Для этого необходимо определить показатель е (остатки) с помощью функции РЕГРЕССИЯ. (См. таблицу 9).

Таблица 9. Тест Дарбина-Уотсона

еe-1
14203,048405
26286,0484052083
3-13676,63461-19962,68302
4-9648,5363294028,098283
5-5176,3856384472,150691
6-1622,5970663553,788572
7-308,50633881314,090727
85350,7675865659,273925
94446,231872-904,5357144
103828,746374-617,4854973
116118,4875232289,741149
128980,4875232862
13-2618,512477-11599
14-4079,512477-1461
15-2083,1327521996,379724
CУММКВ575830081,6640747224,6
ЗнаменательЧислитель

DW = 640747224,6/575830081,6=1,11. Построим диапазон изменений DW, чтобы определить, в какую область попадает рассчитанный показатель (рисунок 4) . При K = 1, N = 15, нижняя граница dl = 1,08; верхняя граница du = 1,36

положительная автокорреляциязона неопределенностинет автокорреляциизона неопределенностиОтрицательная автокорреляция
Диапазон изменения QW (от 0 до 4)               
dldu4-du4-dl
01,081,3622,642,924

Рисунок 4. Диапазон изменений DW

DW попадает  в зону неопределенности, следовательно, проведем процедуру по ее устранению. Рассчитаем значение Yt-1, и найдем остатки е(См. таблицу 10).

Таблица 10. Устранение автокорреляции.

Yt-1Yee-1
92188  
9218894271-5742,459801
94271100955-822,70934314919,750458
100955107781342,10777791164,817121
1077811160812860,6544072518,546629
1160811229622711,75945-148,8949574
122962126655576,7224372-2135,037012
1266551346535446,8426694870,120232
13465313602140,73425082-5406,108418
136021137583444,0720458403,337795
1375831423903928,0966333484,024588
1423901452522718,686385-1209,410248
145252133653-11304,35691-14023,0433
133653132192-2941,2904538363,066459
1321921356371741,1404544682,430908
135637241798722,6391704017,6

Новое значение DW = 391704017,6/241798722,6 = 1,619959003 – попадает в зону отсутствия автокорреляции.

Выводы: таким образом, были проведены все тесты, подтверждающие качество анализируемой модели. В результате анализа влияния материнского капитала (факторный признак Х) на рождаемость населения (результативный признак У) была установлена сильная связь между признаками и рассчитано, что при увеличении материнского каптала рождаемость увеличивается на 0,106586732.

Государство выделяет большие средства на увеличение материнского капитала, а также на различные пособия по беременности и уходу за ребенком. Но чтобы улучшить демографическую ситуацию недостаточно концентрироваться на одной сфере, необходимо комплексно подходить к решению обозначенной проблемы, а именно решать проблемы в социально-экономической сфере.