Задание1:

Постройте несколько переменных xi (N = 30), по ним постройте y:

c нормально распределенными остатками c м.о. = 0

c нормально распределенными остатками c м.о. = 0, но с outlier

c любыми другими остатками

Для этих трех случаев постройте линейную регрессию, сравните результаты, постройте диагностические графики для остатков (проверка на наличие выбросов, зависимость от fitted, проверка на нормальность).

  1. Заготовим переменные xi для всех заданий семинара и нарисуем их друг против друга.

  1. Создадим y c нормальными остатками и yo c outliers, которые зависят от некоторых x:

У меня по построению y зависит от x1,x2 и x1*x3.

Построим регрессии и проверим остатки:

## 
## Call:
## glm(formula = y ~ x1 + x2 + x1 * x3 + xleft)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.5703  -0.4206   0.1872   0.7965   1.5057  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.62044    1.02564  -1.580    0.127    
## x1           0.59201    0.06669   8.877 4.77e-09 ***
## x2           1.93264    0.10345  18.682 8.37e-16 ***
## x3          -0.38542    0.44916  -0.858    0.399    
## xleft        0.04454    0.10517   0.424    0.676    
## x1:x3        3.02752    0.03657  82.781  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 1.274831)
## 
##     Null deviance: 126649.689  on 29  degrees of freedom
## Residual deviance:     30.596  on 24  degrees of freedom
## AIC: 99.726
## 
## Number of Fisher Scoring iterations: 2

## 
## Call:
## glm(formula = yo ~ x1 + x2 + x1 * x3 + xleft)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -58.286  -14.661   -5.212    4.571  197.651  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  32.9464    44.8737   0.734   0.4699  
## x1           -0.6071     2.9178  -0.208   0.8369  
## x2           -3.3564     4.5262  -0.742   0.4656  
## x3           -3.2891    19.6516  -0.167   0.8685  
## xleft        -8.3954     4.6015  -1.824   0.0806 .
## x1:x3         3.1791     1.6001   1.987   0.0585 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 2440.307)
## 
##     Null deviance: 192652  on 29  degrees of freedom
## Residual deviance:  58567  on 24  degrees of freedom
## AIC: 326.44
## 
## Number of Fisher Scoring iterations: 2