Задание1:

Постройте несколько переменных xi (N = 30), по ним постройте y:

c нормально распределенными остатками c м.о. = 0

c нормально распределенными остатками c м.о. = 0, но с outlier

c любыми другими остатками

Для этих трех случаев постройте линейную регрессию, сравните результаты, постройте диагностические графики для остатков (проверка на наличие выбросов, зависимость от fitted, проверка на нормальность).

  1. Заготовим переменные xi для всех заданий семинара и нарисуем их друг против друга.

  1. Создадим y c нормальными остатками и yo c outliers, которые зависят от некоторых x:

У меня по построению y зависит от x1,x2 и x1*x3.

Построим регрессии и проверим остатки:

## 
## Call:
## glm(formula = y ~ x1 + x2 + x1 * x3 + xleft)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.46872  -0.56486   0.03656   0.39171   1.56361  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.17199    0.62545  -0.275    0.786    
## x1           0.53329    0.03747  14.232 3.39e-13 ***
## x2           2.12329    0.09707  21.873  < 2e-16 ***
## x3           0.14795    0.18206   0.813    0.424    
## xleft        0.08724    0.09486   0.920    0.367    
## x1:x3        2.98923    0.01213 246.421  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 0.8696541)
## 
##     Null deviance: 259182.087  on 29  degrees of freedom
## Residual deviance:     20.872  on 24  degrees of freedom
## AIC: 88.252
## 
## Number of Fisher Scoring iterations: 2

## 
## Call:
## glm(formula = yo ~ x1 + x2 + x1 * x3 + xleft)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -30.108  -15.419   -8.046    4.737  114.403  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -13.9954    22.5128  -0.622    0.540    
## x1            0.8746     1.3488   0.648    0.523    
## x2           -0.2479     3.4940  -0.071    0.944    
## x3            2.7457     6.5530   0.419    0.679    
## xleft         4.4847     3.4144   1.313    0.201    
## x1:x3         2.9868     0.4366   6.840 4.48e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 1126.726)
## 
##     Null deviance: 323320  on 29  degrees of freedom
## Residual deviance:  27041  on 24  degrees of freedom
## AIC: 303.25
## 
## Number of Fisher Scoring iterations: 2