-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy path04-model_terbaik.Rmd
62 lines (39 loc) · 2.35 KB
/
04-model_terbaik.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
# Pemilihan Model Terbaik
Pada bab sebelumnya kita melakukan pengujian model linear dengan menggunakan 2 (dua) variabel. Namun terdapat kemungkinan model yang kita buat masih belum mencakup variabel yang paling berpengaruh. Pada bab ini kita akan mencoba melakukan pembuatan model terbaik dengan beberapa metode pemilihan.
Sebelum menjalankan metode pemilihan, dilakukan pembuatan model dengan mencakup semua variabel yang terdapat pada data.
```{r bestmodel}
reg <- lm(mpg ~ disp+hp+drat+wt+qsec+am+gear, data=mtcars)
summary(reg)
```
Pada kali ini digunakan pustaka __olsrr__[^olsrr].
```{r lib_olsrr}
library(olsrr)
```
## Metode All Possible Regression
Metode ini menguji semua kemungkinan subset dari semua variabel independen potensial. Pengujian ini menghasilkan kandidat sejumlah $2^k-1$ pilihan, dimana $k$ adalah jumlah variabel independen. Jadi untuk model diatas akan terdapat $2^7-1 = 128 - 1 = 127$ kandidat.
```{r model_allpossible}
ols_step_all_possible(reg)
```
## Metode Stepwise Forward Selection
Metode ini menguji semua kemungkinan dari sekumpulan calon variabel independen dengan memasukkannya berdasarkan $p-value$ secara bertahap hingga tidak ada lagi yang dapat dimasukkan.
```{r model_forward}
ols_step_forward_p(reg)
```
## Metode Stepwise Backward Selection
Metode ini menguji semua kemungkinan dari sekumpulan calon variabel independen dengan menghilangkannya berdasarkan $p-value$ secara bertahap hingga tidak ada lagi yang dapat dihilangkan.
```{r model_backward}
ols_step_backward_p(reg)
```
## Metode Stepwise Regression
Metode ini menguji semua kemungkinan dari sekumpulan calon variabel independen dengan memasukkan dan/atau menghilangkannya berdasarkan $p-value$ secara bertahap hingga tidak ada lagi yang dapat ditambahkan atau dihilangkan.
```{r model_regresion}
ols_step_both_p(reg)
```
## Metode Best Subset Regression
Metode ini memilih kemungkinan sekumpulan calon variabel independen yang paling baik berdasarkan kriteria objektif yang telah ditentukan dengan baik, misalnya memiliki nilai $R^2$ terbesar atau $MSE$ terkecil, $C(p)$ atau $AIC$.
```{r model_best_subset}
ols_step_best_subset(reg)
```
## Catatan
Masih ada beberapa metode lain yang dapat dilakukan selain metode di atas, bila di atas terdapat metode bertahap / _stepwise_ berdasarkan $p-value$ ada juga metode berdasarkan nilai $AIC$.
[^olsrr]: https://olsrr.rsquaredacademy.com