Skip to content

This repository is for solving probability statistics using the R language

Notifications You must be signed in to change notification settings

rafifiaan/Module2-ProbabilityStatistics-R

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Praktikum Modul 2_Probstat_A_5025211234

Nama : Rafi Aliefian Putra Ramadhani
NRP : 5025211234

Nomor 1

Seorang peneliti melakukan penelitian mengenai pengaruh aktivitas 𝐴 terhadap kadar saturasi oksigen pada manusia. Peneliti tersebut mengambil sampel sebanyak 9 responden. Pertama, sebelum melakukan aktivitas 𝐴, peneliti mencatat kadar saturasi oksigen dari 9 responden tersebut. Kemudian, 9 responden tersebut diminta melakukan aktivitas 𝐴. Setelah 15 menit, peneliti tersebut mencatat kembali kadar saturasi oksigen dari 9 responden tersebut. Berikut data dari 9 responden mengenai kadar saturasi oksigen sebelum dan sesudah melakukan aktivitas 𝐴.

Responden X Y
1 78 100
2 75 95
3 67 70
4 77 90
5 70 90
6 72 90
7 78 89
8 74 90
9 77 100

Berdasarkan data pada tabel diatas, diketahui kadar saturasi oksigen dari responden ke-3 ketika belum melakukan aktivitas 𝐴 sebanyak 67, dan setelah melakukan aktivitas 𝐴 sebanyak 70.

1 Point A

Carilah standar deviasi dari data selisih pasangan pengamatan tabel di atas.

Pertama, masukkan data yang telah ada ke dalam variabel sesuai pengelompokannya.

before <- c(78, 75, 67, 77, 70, 72, 78, 74, 77)
after <- c(100, 95, 70, 90, 90, 90, 89, 90, 100)

Kedua, cari selisih dari antar data dengan index yang sama. Kemudian, dilakukan pencarian rata-rata dari selisih-selisih tersebut untuk digunakan dalam mencari nilai standar deviasinya dengan rumus sebagai berikut.

difference <- after - before
difference
mean(difference)
sd(difference)

1PointA

1 Point B

Carilah nilai t (p-value).

Solusi dilakukan dengan menggunakan fungsi t.test() sebagai berikut dengan parameter masukan data yaitu data kelompok yang telah dikelompokkan pada poin sebelumnya.

t.test(after, before, paired = TRUE)

1PointB

1 Point C

Tentukanlah apakah terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴 jika diketahui tingkat signifikansi 𝛼 = 5% serta H0 : “tidak ada pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴”

Berdasarkan hasil poin sebelumnya, diketahui bahwa nilai probabilitas dari uji 𝑡 (p-value) adalah 6.003e-05 atau 0.00006003. Karena nilai probabilitas tersebut lebih kecil dibandingkan tingkat signifikansi 𝛼 = 0.05, maka hipotesis nol ditolak dan hipotesis alternatif diterima.

Hal ini artinya sebelum dan sesudah melakukan aktivitas 𝐴 pada tingkat signifikansi 5%, terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen.

Nomor 2

(Hipotesa 1 Sampel) Diketahui bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun. Untuk menguji klaim ini, 100 pemilik mobil yang dipilih secara acak diminta untuk mencatat jarak yang mereka tempuh. Jika sampel acak menunjukkan rata-rata 23.500 kilometer dan standar deviasi 3900 kilometer. (Kerjakan menggunakan 2 library seperti referensi pada modul).

2 Point A

Apakah Anda setuju dengan klaim tersebut?

Setuju, karena dengan rata-rata 23.5000 dari sampel acak dengan standar deviasi 3900 kilometer, maka sangatlah mungkin klaim tersebut valid. Hal itu karena grafik dari persebaran data distribusi normal yang dihasilkan akan lebih pekat di daerah lebih dari 20.000 kilometer dengan asumsi nilai tengah grafik tersebut adalah rata-rata dari sampel acak yang didapatkan.

Selanjutnya, digunakan sebuah package library BSDA untuk membuat solusi permasalahannya.

install.packages("BSDA")
library(BSDA)

2 Point B

Jelaskan maksud dari output yang dihasilkan!

Untuk menyelesaikan nya perlu menggunakan fungsi tsum.test() dengan parameter-parameter yang disebutkan pada poin sebelumnya. Hasilnya adalah sebagai berikut.

tsum.test(mean.x = 23500, s.x = 3900, n.x = 100)

2PointB

Sehingga dengan interval kepercayaan 95%, rata-rata jarak tempuh mobil per tahun berada di antara 22.726,16 km dan 24.273,84 km. Dengan interval kepercayaan 95% dan dari 100 responden, dapat dibuktikan bahwa rata-rata jarak tempuh mobil per thn lebih dari 20.000 km karena nilai p-value kurang dari tingkat signifikansi 𝛼 = 0.05.

2 Point C

Buatlah kesimpulan berdasarkan P-Value yang dihasilkan!

Dikarenakan nilai probabilitas tersebut lebih kecil dibandingkan tingkat signifikansi 𝛼 = 0.05, maka hipotesis nol ditolak dan hipotesis alternatif diterima. Sehingga, kesimpulan yang didapatkan yaitu bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun.

Nomor 3

(Hipotesa 2 Sampel) Diketahui perusahaan memiliki seorang data analyst ingin memecahkan permasalahan pengambilan keputusan dalam perusahaan tersebut. Selanjutnya didapatkanlah data berikut dari perusahaan saham tersebut.

Nama Kota/Atribut Bandung Bali
Jumlah Saham 19 27
Sampel Mean 3.64 2.79
Sampel Standar Deviasi 1.67 1.32

Dari data diatas berilah keputusan serta kesimpulan yang didapatkan dari hasil diatas. Asumsikan nilai variancenya sama, apakah ada perbedaan pada rata-ratanya (α= 0.05)? Buatlah:

3 Point A

H0 dan H1(3)

Berdasarkan deskripsi dan data yang terlampir, maka dapat disusun hipotesis H0 dan H1 sebagai berikut.

  • H0 ← μ1 = μ2 (rata-rata saham di Bandung sama dengan di Bali)
  • H1 ← μ1 ≠ μ2 (rata-rata saham di Bandung tidak sama dengan di Bali)

3 Point B

Hitung sampel statistik(3)

Penyelesaian menggunakan fungsi tsum.test() dengan parameter sesuai dengan data pada tabel terlampir. Fungsi tersebut menghasilkan nilai dari sampel statistik.

tsum.test(mean.x=3.64, s.x = 1.67, n.x = 19, 
          mean.y =2.79 , s.y = 1.32, n.y = 27, 
          alternative = "greater", var.equal = TRUE)

3PointB

3 Point C

Lakukan uji statistik (df =2)(5)

Install Package Mosaic untuk membuat S=solusi permasalahan.

install.packages("mosaic")
library(mosaic)

Langkah selanjutnya yaitu dengan menggunakan fungsi plotDist() untuk mendapatkan gambaran atau visualisasi dari statistik dengan derajat bebas sebesar 2.

plotDist(dist = 't', df = 2, col = "blue")

3PointC

3 Point D

Nilai Kritikal(3)

Penyelesaian dengan menggunakan fungsi qchisq() dengan nilai df sesuai dengan yang telah terlampir untuk mendapatkan nilai kritikal.

qchisq(p = 0.05, df = 2, lower.tail = FALSE)

3PointD

3 Point E

Keputusan(3)

Teori keputusan merupakan teori formal pengambilan keputusan di bawah ketidakpastian. Aksinya adalah ({a}\_{a∈A}) dengan kemungkinan konsekuensinya adalah ({c}_{c∈C}) (tergantung pada keadaan dan tindakan). Sehingga, keputusan dapat diperoleh dengan menggunakan fungsi t.test

3 Point F

Kesimpulan(3)

Dapat disimpulkan bahwa perbedaan rata-rata yang terjadi tidak ada jika dilihat dari uji statistik. Namun, akan ada (meski tidak signifikan) jika dipengaruhi oleh nilai kritikal.

Nomor 4

(Anova satu arah) Seorang Peneliti sedang meneliti spesies dari kucing di ITS. Dalam penelitiannya ia mengumpulkan data tiga spesies kucing yaitu kucing oren, kucing hitam dan kucing putih dengan panjangnya masing-masing.

Jika diketahui dataset pada https://intip.in/datasetprobstat1 dan H0 adalah tidak ada perbedaan panjang antara ketiga spesies atau rata-rata panjangnya sama, maka kerjakan atau carilah:

4 Point A

Buatlah masing masing jenis spesies menjadi 3 subjek "Grup" (grup 1, grup 2, dan grup 3). Lalu gambarkan plot kuantil normal untuk setiap kelompok dan lihat apakah ada outlier utama dalam homogenitas varians.

Pertama, masukkan data dari dataset yang disediakan.

dataoneway <- read.table("https://rstatisticsandresearch.weebly.com/uploads/1/0/2/6/1026585/onewayanova.txt", h = T)
attach(dataoneway)
names(dataoneway)

Kedua, melakukan grouping sesuai dengan label yang telah ditentukan sekaligus melakukan pengecekan value dalam grup yang dihasilkan.

dataoneway$Group <- as.factor(dataoneway$Group)
dataoneway$Group = factor(dataoneway$Group, labels = c("Kucing Oren", "Kucing Hitam", "Kucing Putih"))

class(dataoneway$Group)

4PointA1

Ketiga, membagi tiap valuer menjadi 3 bagian sesuai dengan label grup yang telah dibuat.

Group1 <- subset(dataoneway, Group == "Kucing Oren")
Group2 <- subset(dataoneway, Group == "Kucing Hitam")
Group3 <- subset(dataoneway, Group == "Kucing Putih")

Keempat, menggambar plot kuantil normal untuk setiap grup untuk melihat distribusi data dan outlier utama dalam homogenitas varians pada masing-masing grup.

qqnorm(Group1$Length)
qqline(Group1$Length)

4PointA2

qqnorm(Group2$Length)
qqline(Group2$Length)

4PointA3

qqnorm(Group3$Length)
qqline(Group3$Length)

4PointA4

4 Point B

Carilah atau periksalah homogeneity of variances-nya. Berapa nilai p yang didapatkan? Apa hipotesis dan kesimpulan yang dapat diambil?

Penyelesaian untuk mendapatkan homogeneity of variances adalah dengan menggunakan sebuah fungsi yaitu fungsi bartlett.test() dengan parameter dari data yang telah dimasukkan sebelumnya.

bartlett.test(Length ~ Group, data = dataoneway)

4PointB

Dari hasil uji fungsi bartlett.test() didapatkan p-value sebesar 0.8054 yang lebih dari nilai 𝛼 = 0.05 sehingga asumsi kesamaan varians terpenuhi.

4 Point C

Untuk uji ANOVA (satu arah), buatlah model linier dengan panjang versus grup dan beri nama model tersebut model 1.

Penyelesaian dari membuat uji anova dan model liniernya yaitu digunakan fungsi lm() dan anova() dengan parameter dari data yang telah dimasukkan sebelumnya.

model1 = lm(Length ~ Group, data = dataoneway)
anova(model1)

4PointC

4 Point D

Dari hasil poin C, berapakah nilai p? Apa yang dapat Anda simpulkan dari H0?

Melihat dari hasil yang didapatkan pada poin sebelumnya, pada taraf uji 5% didapatkan nilai p-value sebesar 0.0013.

Sehingga, terdapat perbedaan panjang kucing yang signifikan berdasarkan grupnya.

4 Point E

Verifikasilah jawaban model 1 dengan Post-hoc test Tukey HSD, dari nilai p yang didapatkan apakah satu jenis kucing lebih panjang dari yang lain? Jelaskan.

Verifikasi jawaban model 1 sebelumnya menggunakan sebuah fungsi yaitu fungsi TukeyHSD() dengan parameter model 1 dari AOV sebelumnya.

TukeyHSD(aov(model1))

4PointE

Dari hasil uji Tukey, dapat dilihat kombinasi dari kelompok mana yang secara signifikan berbeda. Jika menggunakan 𝛼 = 5%, perbedaan panjang kucing yang signifikan adalah grup 2 (Kucing Hitam) terhadap grup 1 (Kucing Oren) dan grup 3 (Kucing Putih).

4 Point F

Visualisasikan data dengan ggplot2

Penyelesaian menggunakan sebuah fungsi ggplot() untuk melakukan visualisasi data.

install.packages("ggplot2")
library("ggplot2")

ggplot(dataoneway, aes(x = Group, y = Length)) + geom_boxplot(fill = "grey80", colour = "black") + scale_x_discrete() + xlab("Treatment Group") + ylab("Length (cm)")

4PointF

Nomor 5

(Anova dua arah) Data yang digunakan merupakan hasil eksperimen yang dilakukan untuk mengetahui pengaruh suhu operasi (100˚C, 125˚C, dan 150˚C) dan tiga jenis kaca pelat muka (A, B dan C) pada keluaran cahaya tabung osiloskop. Percobaan dilakukan sebanyak 27 kali dan didapatkan data hasil eksperimen berikut. Dengan data tersebut:

5 Point A

Buatlah plot sederhana untuk visualisasi data

Pertama, gunakan beberapa library sebagai berikut.

install.packages("multcompView")
library(readr)
library(ggplot2)
library(multcompView)
library(dplyr)

Kedua, masukkan dan baca dataset yang telah disediakan.

GTL <- read_csv("GTL.csv")
head(GTL)

5PointA1

Ketiga, lakukan observasi pada dataset.

str(GTL)

5PointA2

Keempat, lakukan viasualisasi dengan menggunakan simple plot dengan fungsi qplot() sebagai berikut.

qplot(x = Temp, y = Light, geom = "point", data = GTL) + facet_grid(.~Glass, labeller = label_both)

5PointA3


5 Point B

Lakukan uji ANOVA dua arah untuk 2 faktor

Pertama, buat variabel as factor sebagai ANOVA.

GTL$Glass <- as.factor(GTL$Glass)
GTL$Temp_Factor <- as.factor(GTL$Temp)
str(GTL)

5PointB1

Kedua, lakukan analisis of variance (AoV) dengan fungsi summary(aov()) sebagai berikut.

anova <- aov(Light ~ Glass*Temp_Factor, data = GTL)
summary(anova)

5PointB2


5 Point C

Tampilkan tabel dengan mean dan standar deviasi keluaran cahaya untuk setiap perlakuan (kombinasi kaca pelat muka dan suhu operasi)

Penyelesaian-nya dengan menggunakan sebuah fungsi group_by() yang selanjutnya digunakan untuk melakukan data summary dengan fungsi summarise() sesuai mean dan standar deviasi yang berlaku sebagai berikut.

data_summary <- group_by(GTL, Glass, Temp) %>%
  summarise(mean = mean(Light), sd = sd(Light)) %>%
  arrange(desc(mean))
print(data_summary)

5PointC


5 Point D

Lakukan uji Tukey

Penyelesaian dengan menggunakan sebuah fungsi TukeyHSD() sebagai berikut.

tukey <- TukeyHSD(anova)
print(tukey)

5PointD1

5PointD2


5 Point E

Gunakan compact letter display untuk menunjukkan perbedaan signifikan antara uji Anova dan uji Tukey

Pertama, buat compact letter display dengan fungsi multcompLetterS4() sebagai berikut.

tukey.cld <- multcompLetters4(anova, tukey)
print(tukey.cld)

5PointE1

Kedua, tambahkan compact letter display tersebut ke tabel dengan mean dan standar deviasi yang telah dibuat sebelumnya.

cld <- as.data.frame.list(tukey.cld$`Glass:Temp_Factor`)
data_summary$Tukey <- cld$Letters
print(data_summary)

5PointE2


Alhamdulillah, Terimakasih, Bismillah lulus :)

About

This repository is for solving probability statistics using the R language

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages