1 t-тест

1.1 approve equation #1

Для датасета loanapp рассморим регрессию approve на mortno, unem, dep, male, married, yjob, self

Спецификация: \[ approve=\beta_0+\beta_1mortno+\beta_2unem+\beta_3dep+\beta_4male+\beta_5married+\beta_6yjob+\beta_7self+u \]

Альтернативная спецификация: \[ P(approve=1)=\beta_0+\beta_1mortno+\beta_2unem+\beta_3dep+\beta_4male+\beta_5married+\beta_6yjob+\beta_7self \]

Результаты оценивания (неробастные s.e.):

            Estimate Std. Error
(Intercept)    0.864      0.022
mortno         0.073      0.016
unem          -0.006      0.003
dep           -0.018      0.007
male           0.002      0.020
married        0.046      0.018
yjob          -0.001      0.007
self          -0.036      0.022

Результаты оценивания (робастные s.e.):

            Estimate Std. Error
(Intercept)    0.864      0.023
mortno         0.073      0.015
unem          -0.006      0.004
dep           -0.018      0.008
male           0.002      0.021
married        0.046      0.019
yjob          -0.001      0.006
self          -0.036      0.025

Вычислите t-статистику для каждого коэффициента. Ответ округлите до 3-х десятичных знаков.

Ответ

(Intercept)      mortno        unem         dep        male     married 
     37.565       4.867      -1.500      -2.250       0.095       2.421 
       yjob        self 
     -0.167      -1.440 

1.2 approve equation #2

Для датасета loanapp рассморим регрессию approve на appinc, appinc^2, mortno, unem, dep, male, married, yjob, self

Результаты t-теста для коэффициентов (неробастные s.e.)


t test of coefficients:

               Estimate  Std. Error t value  Pr(>|t|)    
(Intercept)  8.4200e-01  2.5285e-02 33.2996 < 2.2e-16 ***
appinc       5.1271e-04  2.4628e-04  2.0818  0.037488 *  
I(appinc^2) -1.0072e-06  3.5927e-07 -2.8034  0.005107 ** 
mortno       6.6040e-02  1.6390e-02  4.0293 5.807e-05 ***
unem        -6.1034e-03  3.4737e-03 -1.7570  0.079066 .  
dep         -1.7071e-02  7.1896e-03 -2.3744  0.017675 *  
male        -2.8900e-03  2.0406e-02 -0.1416  0.887389    
married      4.3276e-02  1.7669e-02  2.4493  0.014401 *  
yjob        -8.7741e-04  6.6719e-03 -0.1315  0.895387    
self        -4.0432e-02  2.2638e-02 -1.7860  0.074249 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Результаты t-теста для коэффициентов (робастные s.e.)


t test of coefficients:

               Estimate  Std. Error t value  Pr(>|t|)    
(Intercept)  8.4200e-01  2.7158e-02 31.0034 < 2.2e-16 ***
appinc       5.1271e-04  2.6182e-04  1.9583   0.05034 .  
I(appinc^2) -1.0072e-06  4.2423e-07 -2.3741   0.01769 *  
mortno       6.6040e-02  1.5282e-02  4.3214 1.628e-05 ***
unem        -6.1034e-03  4.0291e-03 -1.5149   0.12997    
dep         -1.7071e-02  7.4865e-03 -2.2802   0.02270 *  
male        -2.8900e-03  2.1405e-02 -0.1350   0.89261    
married      4.3276e-02  1.8743e-02  2.3089   0.02105 *  
yjob        -8.7741e-04  6.2623e-03 -0.1401   0.88859    
self        -4.0432e-02  2.5244e-02 -1.6016   0.10940    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Модель была подогнана по 1971 наблюдениям. Уровень значимости 5%

Вычислите критическое значения для t-теста. Ответ округлите до 3-х десятичных знаков.

[1] 1.961

Какие коэффициенты значимы? Ответ

[1] "(Intercept)" "I(appinc^2)" "mortno"      "dep"         "married"    

1.3 labour force equation #1

Для датасета mroz_Greene рассморим регрессию LFP на WA, WA^2, WE, KL6, K618, CIT, UN, log(FAMINC)

Спецификация: \[ LFP=\beta_0+\beta_1WA+\beta_2WA^2+\beta_3WE+\beta_4KL6+\beta_5K618+\beta_5CIT+\beta_7UN+\beta_8\log(FAMINC)+u \]

Альтернативная спецификация: \[ P(LFP=1)=\beta_0+\beta_1WA+\beta_2WA^2+\beta_3WE+\beta_4KL6+\beta_5K618+\beta_5CIT+\beta_7UN+\beta_8\log(FAMINC) \]

Результаты оценивания (неробастные s.e.):

            Estimate Std. Error
(Intercept)  -0.3211     0.5919
WA            0.0075     0.0246
I(WA^2)      -0.0002     0.0003
WE            0.0377     0.0082
KL6          -0.2959     0.0369
K618         -0.0209     0.0146
CIT          -0.0482     0.0376
UN           -0.0036     0.0056
log(FAMINC)   0.0724     0.0368

Результаты оценивания (робастные s.e.):

            Estimate Std. Error
(Intercept)  -0.3211     0.5846
WA            0.0075     0.0244
I(WA^2)      -0.0002     0.0003
WE            0.0377     0.0080
KL6          -0.2959     0.0338
K618         -0.0209     0.0148
CIT          -0.0482     0.0371
UN           -0.0036     0.0057
log(FAMINC)   0.0724     0.0377

Вычислите t-статистику для каждого коэффициента. Ответ округлите до 3-х десятичных знаков.

Ответ

(Intercept)          WA     I(WA^2)          WE         KL6        K618 
     -0.549       0.307      -0.667       4.712      -8.754      -1.412 
        CIT          UN log(FAMINC) 
     -1.299      -0.632       1.920 

1.4 labour force equation #2

Для датасета mroz_Greene рассморим регрессию LFP на WA, WA^2, WE, KL6, K618, CIT, UN, log(FAMINC)

Результаты t-теста для коэффициентов (неробастные s.e.)


t test of coefficients:

               Estimate  Std. Error t value  Pr(>|t|)    
(Intercept) -0.32112148  0.59193164 -0.5425   0.58764    
WA           0.00751037  0.02458551  0.3055   0.76009    
I(WA^2)     -0.00023998  0.00028348 -0.8465   0.39752    
WE           0.03765641  0.00823220  4.5743 5.597e-06 ***
KL6         -0.29591484  0.03693876 -8.0110 4.391e-15 ***
K618        -0.02092428  0.01458904 -1.4342   0.15192    
CIT         -0.04820408  0.03757742 -1.2828   0.19996    
UN          -0.00360208  0.00556405 -0.6474   0.51758    
log(FAMINC)  0.07236590  0.03682861  1.9649   0.04979 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Результаты t-теста для коэффициентов (робастные s.e.)


t test of coefficients:

               Estimate  Std. Error t value  Pr(>|t|)    
(Intercept) -0.32112148  0.58458980 -0.5493   0.58296    
WA           0.00751037  0.02444013  0.3073   0.75870    
I(WA^2)     -0.00023998  0.00028469 -0.8430   0.39952    
WE           0.03765641  0.00795071  4.7362 2.608e-06 ***
KL6         -0.29591484  0.03376701 -8.7634 < 2.2e-16 ***
K618        -0.02092428  0.01484965 -1.4091   0.15923    
CIT         -0.04820408  0.03706993 -1.3004   0.19388    
UN          -0.00360208  0.00569123 -0.6329   0.52698    
log(FAMINC)  0.07236590  0.03767997  1.9205   0.05517 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Модель была подогнана по 753 наблюдениям. Уровень значимости 5%

Вычислите критическое значения для t-теста. Ответ округлите до 3-х десятичных знаков.

[1] 1.963

Какие коэффициенты значимы? Ответ

[1] "WE"  "KL6"

1.5 Замечание: почему log(FAMINC)

Нарисуем гистограмму FAMINC с наложенной кривой нормального распределения

Нарисуем гистограмму log(FAMINC) с наложенной кривой нормального распределения

2 F-тест: значимость регрессии

2.1 approve equation #1

Для датасета loanapp рассморим регрессию approve на unem, male, yjob, self

Результаты оценивания


===============================================
                       Зависимая переменная    
                    ---------------------------
                              approve          
-----------------------------------------------
unem                         -0.007**          
                              (0.003)          
                                               
male                           0.021           
                              (0.019)          
                                               
yjob                           0.001           
                              (0.007)          
                                               
self                          -0.030           
                              (0.022)          
                                               
Constant                     0.891***          
                              (0.021)          
                                               
-----------------------------------------------
Observations                   1974            
R2                             0.004           
Adjusted R2                    0.002           
Residual Std. Error            0.329           
F Statistic                   2.029*           
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

Тестируется значимость регрессии, т.е. гипотеза \(H_0:\beta_{unem}=\beta_{male}=\beta_{yjob}=\beta_{self}=0\). Уровень значимости 10%.

Вычислите критическое значение для гипотезы. Ответ округлите до 3-х десятичных знаков.

Ответ:

[1] 1.948

Результаты неробастного F-теста


=============
F     Pr(> F)
-------------
2.029  0.088 
-------------

Результаты робастного F-теста


=============
F     Pr(> F)
-------------
1.677  0.153 
-------------

Какой можно сделать вывод?

[1] "Регрессия незначима"

2.2 approve equation #2

Для датасета loanapp рассморим регрессию approve на appinc, appinc^2, mortno, dep

Результаты оценивания


===============================================
                       Зависимая переменная    
                    ---------------------------
                              approve          
-----------------------------------------------
appinc                       0.00052**         
                             (0.00024)         
                                               
I(appinc2)                 -0.000001***        
                            (0.0000004)        
                                               
mortno                      0.06903***         
                             (0.01623)         
                                               
dep                          -0.01163*         
                             (0.00672)         
                                               
Constant                    0.83416***         
                             (0.01707)         
                                               
-----------------------------------------------
Observations                   1986            
R2                            0.01805          
Adjusted R2                   0.01607          
Residual Std. Error           0.32571          
F Statistic                 9.10590***         
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

Тестируется значимость регрессии, т.е. гипотеза \(H_0:\beta_{appinc}=\beta_{appinc^2}=\beta_{mortno}=\beta_{dep}=0\). Уровень значимости 5%.

Вычислите критическое значение для гипотезы. Ответ округлите до 3-х десятичных знаков.

Ответ:

[1] 2.376

Результаты неробастного F-теста


=============
F     Pr(> F)
-------------
9.106 0.00000
-------------

Результаты робастного F-теста


=============
F     Pr(> F)
-------------
8.188 0.00000
-------------

Какой можно сделать вывод?

[1] "Регрессия значима"

2.3 approve equation #3

Для датасета loanapp рассморим регрессию approve на dep, male, married

Результаты оценивания


===============================================
                       Зависимая переменная    
                    ---------------------------
                              approve          
-----------------------------------------------
dep                          -0.016**          
                              (0.007)          
                                               
male                          -0.002           
                              (0.020)          
                                               
married                      0.057***          
                              (0.018)          
                                               
Constant                     0.852***          
                              (0.018)          
                                               
-----------------------------------------------
Observations                   1971            
R2                             0.006           
Adjusted R2                    0.005           
Residual Std. Error            0.329           
F Statistic                  4.155***          
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

Тестируется значимость регрессии, т.е. гипотеза \(H_0:\beta_{dep}=\beta_{male}=\beta_{married}=0\). Уровень значимости 1%.

Вычислите критическое значение для гипотезы. Ответ округлите до 3-х десятичных знаков.

Ответ:

[1] 3.792

Результаты неробастного F-теста


=============
F     Pr(> F)
-------------
4.155  0.006 
-------------

Результаты робастного F-теста


=============
F     Pr(> F)
-------------
3.724  0.011 
-------------

Какой можно сделать вывод?

[1] "Регрессия незначима"

3 F-тест: совместная значимость

3.1 approve equation #1

Для датасета loanapp рассморим регрессию approve на appinc, appinc^2, mortno, unem, dep, male, married, yjob, self

Результаты оценивания


========================================================
                            Зависимая переменная        
                    ------------------------------------
                                  approve               
                        (1)         (2)         (3)     
--------------------------------------------------------
appinc               0.00051**               0.00060**  
                     (0.00025)               (0.00024)  
                                                        
I(appinc2)          -0.000001***            -0.000001***
                    (0.0000004)             (0.0000004) 
                                                        
mortno               0.06604***  0.07325***  0.06649*** 
                     (0.01639)   (0.01600)   (0.01619)  
                                                        
unem                 -0.00610*   -0.00643*              
                     (0.00347)   (0.00346)              
                                                        
dep                  -0.01707**  -0.01847**             
                     (0.00719)   (0.00719)              
                                                        
male                  -0.00289    0.00191     0.00292   
                     (0.02041)   (0.02031)   (0.01917)  
                                                        
married              0.04328**   0.04595***             
                     (0.01767)   (0.01764)              
                                                        
yjob                  -0.00088    -0.00066    0.00020   
                     (0.00667)   (0.00669)   (0.00657)  
                                                        
self                 -0.04043*    -0.03612   -0.04999** 
                     (0.02264)   (0.02229)   (0.02227)  
                                                        
Constant             0.84200***  0.86421***  0.82411*** 
                     (0.02529)   (0.02191)   (0.02149)  
                                                        
--------------------------------------------------------
Observations            1971        1971        1974    
R2                    0.02538     0.02026     0.01929   
Adjusted R2           0.02091     0.01677     0.01630   
Residual Std. Error   0.32597     0.32666     0.32652   
F Statistic          5.67446***  5.80014***  6.44729*** 
========================================================
Note:                        *p<0.1; **p<0.05; ***p<0.01

3.1.1 Гипотеза 1

Потестируем значимость влияния дохода, т.е. \(H_0:\beta_{appinc}=\beta_{appinc^2}=0\). Уровень значимости 5%.

Результаты неробастного F-теста


=============
F     Pr(> F)
-------------
5.149  0.006 
-------------

Результаты робастного F-теста


=============
F     Pr(> F)
-------------
2.961  0.052 
-------------

Вычислите критическое значение для гипотезы. Ответ округлите до 3-х десятичных знаков.

Ответ:

[1] 3

Какой можно сделать вывод?

[1] "Гипотеза не отвергается"

3.1.2 Гипотеза 2

Потестируем гипотезу \(H_0:\beta_{unem}=\beta_{dep}=\beta_{married}=0\). Уровень значимости 1%.

Результаты неробастного F-теста


=============
F     Pr(> F)
-------------
4.054  0.007 
-------------

Результаты робастного F-теста


=============
F     Pr(> F)
-------------
3.469  0.016 
-------------

Вычислите критическое значение для гипотезы. Ответ округлите до 3-х десятичных знаков.

Ответ:

[1] 3.792

Какой можно сделать вывод?

[1] "Гипотеза не отвергается"

4 Прогноз

4.1 labour force equation

Для датасета mroz_Greene рассморим регрессию LFP на WA, WA^2, CIT, UN, log(FAMINC)

Результаты оценивания


===============================================
                       Зависимая переменная    
                    ---------------------------
                                LFP            
-----------------------------------------------
WA                            0.042*           
                              (0.024)          
                                               
I(WA2)                        -0.001*          
                             (0.0003)          
                                               
CIT                           -0.039           
                              (0.039)          
                                               
UN                            -0.004           
                              (0.006)          
                                               
log(FAMINC)                  0.140***          
                              (0.036)          
                                               
Constant                     -1.525**          
                              (0.595)          
                                               
-----------------------------------------------
Observations                    753            
R2                             0.033           
Adjusted R2                    0.027           
Residual Std. Error            0.489           
F Statistic                  5.171***          
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

Рассморим трёх людей с характеристиками


=====================
  WA CIT  UN   FAMINC
---------------------
1 34  1    3   35000 
2 36  0    5   48500 
3 42  0  7.500 67800 
---------------------

Вычислите прогноз для каждого человека. Ответ округлите до 3-х десятичных знаков.

Ответ:


=========
  Прогноз
---------
1  0.161 
2  0.182 
3  0.002 
---------

Какая интерпретация?

5 Вопросы адекватности

5.1 approve equation

Для датасета loanapp рассморим регрессию approve на appinc, appinc^2, mortno, unem, dep, male, married, yjob, self

Построим графики фактических наблюдений м прогнозов

5.2 labour force equation

Для датасета mroz_Greene рассморим регрессию LFP на WA, WA^2, WE, KL6, K618, CIT, UN, log(FAMINC)

Построим графики фактических наблюдений м прогнозов