1 Суммы квадратов, остатки, предсказанные значения, \(R^2\)

1.1 Предсказанные и остатки

1.1.1 Задача

Для набора данных sleep75 рассмотрим регрессию sleep на totwrk, age, male и log(hrwage). Ниже приведены коэффициенты подогнанной модели

(Intercept)      totwrk         age        male log(hrwage) 
    3525.14       -0.16        1.62       51.84       -9.88 

В таблице ниже приведены первые шесть наблюдений


============================
sleep totwrk age male hrwage
----------------------------
3113   3438  32   1    7.07 
2920   5020  31   1    1.43 
2670   2815  44   1   20.53 
3083   3786  30   0    9.62 
3448   2580  64   1    2.75 
4063   1205  41   1   19.25 
----------------------------

Для каждого наблюдения вычислите предсказанное значение и остатки. Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "Предсказанные"
[1] 3059.42 2820.47 3168.00 2945.61 3257.87 3421.38
[1] "Остатки"
[1]   53.58   99.53 -498.00  137.39  190.13  641.62

1.1.2 Задача

Для набора данных Labour рассмотрим регрессию log(output) на log(capital) и log(labour) Ниже приведены коэффициенты подогнанной модели

 (Intercept) log(capital)  log(labour) 
       -1.71         0.21         0.71 

В таблице ниже приведены первые пять наблюдений


=====================
output capital labour
---------------------
9.25    2.61    184  
3.66    1.32     91  
28.78   22.09   426  
4.12    10.74    72  
2.89    1.16     46  
---------------------

Для каждого наблюдения вычислите предсказанное значение и остатки. Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "Предсказанные"
[1] 2.19 1.55 3.24 1.82 1.04
[1] "Остатки"
[1]  0.03 -0.25  0.12 -0.40  0.02

1.2 Суммы квадратов и R2

1.2.1 Задача

В результате подгонки регрессии \(y=\beta_0+\beta_1x_1+\beta_2x_2+u\) были вычислены: общая сумма квадратов 100.35 и объяснённая сумма квадратов 47.56.

Вычислите остаточную сумму квадратов и \(R^2\). Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "RSS=52.79"
[1] "R^2=0.47"

1.2.2 Задача

В результате подгонки регрессии \(y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3+u\) были вычислены: общая сумма квадратов 240.82 и остаточная сумма квадратов 93.52.

Вычислите объяснённую сумму квадратов и \(R^2\). Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "ESS=147.3"
[1] "R^2=0.61"

1.2.3 Задача

В результате подгонки регрессии \(y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3+u\) были вычислены: объяснённая сумма квадратов 418.38 и остаточная сумма квадратов 782.83

Вычислите общую сумму квадратов и \(R^2\). Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "TSS=1201.21"
[1] "R^2=0.35"

1.2.4 Задача

В результате подгонки регрессии \(y=\beta_0+\beta_1x_1+\beta_2x_2+u\) по 10 наблюдениям были получены остатки

 [1] -0.24  0.41  1.22 -0.93 -0.37 -1.33  0.16 -0.27  0.06  1.29

Вычислите RSS и стандартную ошибку регрессии. Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "RSS=6.25"
[1] "s=0.94"

1.2.5 Задача

Для набора данных sleep75 рассмотрим регрессию sleep/60 на totwrk и age

Модель оценивается по первым 10 наблюдениям. В таблице приведены исходные данные и подогнанные (предсказанные) значения (y.hat) по оценённой модели


=========================
sleep/60 totwrk age y.hat
-------------------------
51.88     3438  32  51.00
48.67     5020  31  44.43
44.50     2815  44  53.72
51.38     3786  30  49.53
57.47     2580  64  54.92
67.72     1205  41  60.36
53        2113  35  56.53
48.80     3608  47  50.46
56.13     2353  32  55.50
50.30     2851  30  53.41
-------------------------

Вычислите общую, объяснённую и остаточную суммы квадратов. Ответ округлите до 2-х десятичных знаков. (для вычисления используйте определения сумм квадратов)

Ответ:

[1] "TSS=366.26"
[1] "ESS=173.19"
[1] "RSS=193.14"

1.2.6 Задача

Для набора данных Labour рассмотрим регрессию log(output) на log(capital) и log(labour)

Модель оценивается по первым 10 наблюдениям. В таблице приведены исходные данные и подогнанные (предсказанные) значения (y.hat) по оценённой модели


==========================================
log(output) log(capital) log(labour) y.hat
------------------------------------------
2.22            0.96        5.21     2.19 
1.30            0.28        4.51     1.47 
3.36            3.10        6.05     3.23 
1.42            2.37        4.28     1.56 
1.06            0.15        3.83     0.85 
6.17            5.62        8.94     6.15 
0.77            0.52        3.87     0.94 
1.42            0.15        4.68     1.61 
0.90           -0.13        3.56     0.57 
1.35            1.25        4.28     1.40 
------------------------------------------

Вычислите общую, объяснённую и остаточную суммы квадратов. Ответ округлите до 2-х десятичных знаков. (для вычисления используйте определения сумм квадратов)

Ответ:

[1] "TSS=24.48"
[1] "ESS=24.25"
[1] "RSS=0.29"

1.2.7 Задача

Для набора данных wage2 рассмотрим несколько регрессий


=====================================================================
                                  Зависимая переменная               
                    -------------------------------------------------
                                        log(wage)                    
                       (1)       (2)       (3)       (4)       (5)   
---------------------------------------------------------------------
Constant            4.974***  5.887***  5.087***  6.508***  4.971*** 
                     (0.165)   (0.143)   (0.166)   (0.047)   (0.166) 
                                                                     
age                 0.021***  0.019***  0.023***            0.022*** 
                     (0.004)   (0.004)   (0.004)             (0.004) 
                                                                     
IQ                  0.008***            0.008***            0.009*** 
                     (0.001)             (0.001)             (0.001) 
                                                                     
south               -0.099*** -0.153*** -0.096*** -0.158***          
                     (0.027)   (0.028)   (0.027)   (0.028)           
                                                                     
urban               0.175***  0.179***  0.170***  0.178***           
                     (0.028)   (0.029)   (0.028)   (0.029)           
                                                                     
married             0.201***  0.199***            0.220***  0.187*** 
                     (0.040)   (0.042)             (0.042)   (0.041) 
                                                                     
---------------------------------------------------------------------
Observations           935       935       935       935       935   
R2                    0.200     0.118     0.178     0.098     0.149  
Adjusted R2           0.195     0.114     0.175     0.095     0.146  
Residual Std. Error   0.378     0.396     0.383     0.401     0.389  
F Statistic         46.346*** 31.025*** 50.402*** 33.609*** 54.191***
=====================================================================
Note:                                     *p<0.1; **p<0.05; ***p<0.01

Вычислите RSS для первой регрессии. Ответ округлите до 3-х десятичных знаков.

Ответ

[1] 132.739

1.2.8 Задача

Для набора данных wage2 рассмотрим несколько регрессий


=====================================================================
                                  Зависимая переменная               
                    -------------------------------------------------
                                        log(wage)                    
                       (1)       (2)       (3)       (4)       (5)   
---------------------------------------------------------------------
Constant            4.974***  5.887***  5.087***  6.508***  4.971*** 
                     (0.165)   (0.143)   (0.166)   (0.047)   (0.166) 
                                                                     
age                 0.021***  0.019***  0.023***            0.022*** 
                     (0.004)   (0.004)   (0.004)             (0.004) 
                                                                     
IQ                  0.008***            0.008***            0.009*** 
                     (0.001)             (0.001)             (0.001) 
                                                                     
south               -0.099*** -0.153*** -0.096*** -0.158***          
                     (0.027)   (0.028)   (0.027)   (0.028)           
                                                                     
urban               0.175***  0.179***  0.170***  0.178***           
                     (0.028)   (0.029)   (0.028)   (0.029)           
                                                                     
married             0.201***  0.199***            0.220***  0.187*** 
                     (0.040)   (0.042)             (0.042)   (0.041) 
                                                                     
---------------------------------------------------------------------
Observations           935       935       935       935       935   
R2                    0.200     0.118     0.178     0.098     0.149  
Adjusted R2           0.195     0.114     0.175     0.095     0.146  
Residual Std. Error   0.378     0.396     0.383     0.401     0.389  
F Statistic         46.346*** 31.025*** 50.402*** 33.609*** 54.191***
=====================================================================
Note:                                     *p<0.1; **p<0.05; ***p<0.01

Вычислите TSS для третьей регрессии. Ответ округлите до 3-х десятичных знаков.

Ответ

[1] 165.962

1.2.9 Задача

Для набора данных wage2 рассмотрим несколько регрессий


=====================================================================
                                  Зависимая переменная               
                    -------------------------------------------------
                                        log(wage)                    
                       (1)       (2)       (3)       (4)       (5)   
---------------------------------------------------------------------
Constant            4.974***  5.887***  5.087***  6.508***  4.971*** 
                     (0.165)   (0.143)   (0.166)   (0.047)   (0.166) 
                                                                     
age                 0.021***  0.019***  0.023***            0.022*** 
                     (0.004)   (0.004)   (0.004)             (0.004) 
                                                                     
IQ                  0.008***            0.008***            0.009*** 
                     (0.001)             (0.001)             (0.001) 
                                                                     
south               -0.099*** -0.153*** -0.096*** -0.158***          
                     (0.027)   (0.028)   (0.027)   (0.028)           
                                                                     
urban               0.175***  0.179***  0.170***  0.178***           
                     (0.028)   (0.029)   (0.028)   (0.029)           
                                                                     
married             0.201***  0.199***            0.220***  0.187*** 
                     (0.040)   (0.042)             (0.042)   (0.041) 
                                                                     
---------------------------------------------------------------------
Observations           935       935       935       935       935   
R2                    0.200     0.118     0.178     0.098     0.149  
Adjusted R2           0.195     0.114     0.175     0.095     0.146  
Residual Std. Error   0.378     0.396     0.383     0.401     0.389  
F Statistic         46.346*** 31.025*** 50.402*** 33.609*** 54.191***
=====================================================================
Note:                                     *p<0.1; **p<0.05; ***p<0.01

Вычислите ESS для пятой регрессии. Ответ округлите до 3-х десятичных знаков.

Ответ

[1] 24.666

2 \(R^2_{adj}\)

2.1 Задача

Для набора данных wage1 рассмотрим регрессию log(wage) на exper, exper^2, female, smsa, south

Результаты оценивания:


===============================================
                       Зависимая переменная    
                    ---------------------------
                             log(wage)         
-----------------------------------------------
exper                        0.045***          
                              (0.005)          
                                               
I(exper2)                    -0.001***         
                             (0.0001)          
                                               
female                       -0.386***         
                              (0.039)          
                                               
smsa                         0.238***          
                              (0.045)          
                                               
south                        -0.106**          
                              (0.042)          
                                               
Constant                     1.342***          
                              (0.063)          
                                               
-----------------------------------------------
Observations                    526            
R2                             0.288           
Residual Std. Error            0.451           
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

Вычислите \(R^2_{adj}\). Ответ округлите до 3-х десятичных знаков.

Ответ

[1] 0.281

2.2 Задача

Для набора данных wage2 рассмотрим регрессию __log(wage) на age, IQ, urban, married, south, IQ*south__

Результаты оценивания:


===============================================
                       Зависимая переменная    
                    ---------------------------
                             log(wage)         
-----------------------------------------------
age                          0.021***          
                              (0.004)          
                                               
IQ                           0.007***          
                              (0.001)          
                                               
urban                        0.172***          
                              (0.028)          
                                               
married                      0.202***          
                              (0.040)          
                                               
south                         -0.303*          
                              (0.176)          
                                               
I(IQ * south)                  0.002           
                              (0.002)          
                                               
Constant                     5.052***          
                              (0.178)          
                                               
-----------------------------------------------
Observations                    935            
R2                             0.201           
Residual Std. Error            0.378           
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

Вычислите \(R^2_{adj}\). Ответ округлите до 3-х десятичных знаков.

Ответ

[1] 0.196

2.3 Задача

Для набора данных sleep75 рассмотрим регрессию sleep/60 на totwrk и age

Модель оценивается по первым 10 наблюдениям. В таблице приведены исходные данные и подогнанные (предсказанные) значения (y.hat) по оценённой модели


=========================
sleep/60 totwrk age y.hat
-------------------------
51.88     3438  32  51.00
48.67     5020  31  44.43
44.50     2815  44  53.72
51.38     3786  30  49.53
57.47     2580  64  54.92
67.72     1205  41  60.36
53        2113  35  56.53
48.80     3608  47  50.46
56.13     2353  32  55.50
50.30     2851  30  53.41
-------------------------

Вычислите \(R^2\) и \(R^2_{adj}\).Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "R^2=0.47"
[1] "R^2_adj=0.32"

2.4 Задача

Для набора данных Labour рассмотрим регрессию log(output) на log(capital) и log(labour)

Модель оценивается по первым 10 наблюдениям. В таблице приведены исходные данные и подогнанные (предсказанные) значения (y.hat) по оценённой модели


==========================================
log(output) log(capital) log(labour) y.hat
------------------------------------------
2.22            0.96        5.21     2.19 
1.30            0.28        4.51     1.47 
3.36            3.10        6.05     3.23 
1.42            2.37        4.28     1.56 
1.06            0.15        3.83     0.85 
6.17            5.62        8.94     6.15 
0.77            0.52        3.87     0.94 
1.42            0.15        4.68     1.61 
0.90           -0.13        3.56     0.57 
1.35            1.25        4.28     1.40 
------------------------------------------

Вычислите \(R^2\) и \(R^2_{adj}\).Ответ округлите до 2-х десятичных знаков.

Ответ:

[1] "R^2=0.99"
[1] "R^2_adj=0.98"