\[\begin{equation} y_i = \beta_0 + \beta_1 (x_{1i} + x_{2i}) + \epsilon_i \end{equation}\]
En R se expresa mediante el operador I():
ya que la expresión:
corresponde al modelo:
\[\begin{equation} y_i = \beta_0 + \beta_1 x_{1i} + \beta_2 x_{2i} + \epsilon_i \end{equation}\]
\[\begin{equation} y_i = \beta_0 + \beta_1 x_{1i} + \beta_2 x_{1i}^2 + \epsilon_i \end{equation}\]
En R este modelo se expresa utilizando:
ya que la expresión
significa interacción y no el cuadrado del regresor.
Es frecuente incluir fórmulas matemáticas en el modelo de regresión. Por ejemplo:
\[\begin{equation} \log(y_i) = \beta_0 + \beta_1 x_{1i} + \beta_2 e^{x_{2i}} + \epsilon_i \end{equation}\]
En R, este modelo se indica:
d = faraway::gala
m = lm(Species ~ 0 + Area * Elevation + I(Area^2) + Nearest + Scruz + Adjacent, data = d)
summary(m)
##
## Call:
## lm(formula = Species ~ 0 + Area * Elevation + I(Area^2) + Nearest +
## Scruz + Adjacent, data = d)
##
## Residuals:
## Min 1Q Median 3Q Max
## -71.456 -17.555 -1.372 14.988 99.139
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## Area 1.008e+00 1.963e-01 5.136 3.33e-05 ***
## Elevation 1.820e-01 3.585e-02 5.075 3.87e-05 ***
## I(Area^2) 1.443e-04 5.771e-05 2.500 0.01998 *
## Nearest -1.239e+00 6.682e-01 -1.854 0.07661 .
## Scruz 7.127e-02 1.242e-01 0.574 0.57176
## Adjacent 1.056e-02 2.423e-02 0.436 0.66698
## Area:Elevation -9.816e-04 2.665e-04 -3.684 0.00123 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 35.31 on 23 degrees of freedom
## Multiple R-squared: 0.9521, Adjusted R-squared: 0.9375
## F-statistic: 65.33 on 7 and 23 DF, p-value: 1.137e-13