TUGAS STATISTIKA BAB 7 , BAB 8 , DAN BAB 9
BAB7PengujianHipotesis
Uji hipotesis adalah metode pengambilan keputusan yang didasarkan dari
analisis data, baik dari percobaan yang terkontrol, maupun dari
observasi (tidak terkontrol). Dalam statistik sebuah hasil bisa
dikatakan signifikan secara statistik jika kejadian tersebut hampir
tidak mungkin disebabkan oleh faktor yang kebetulan, sesuai dengan batas
probabilitas yang sudah ditentukan sebelumnya.
Uji hipotesis kadang disebut juga "konfirmasi analisis data". Keputusan
dari uji hipotesis hampir selalu dibuat berdasarkan pengujian hipotesis
nol. Ini adalah pengujian untuk menjawab pertanyaan yang mengasumsikan
hipotesis nol adalah benar.
Daerah kritis (bahasa Inggris: critical region) dari uji hipotesis
adalah serangkaian hasil yang bisa menolak hipotesis nol, untuk menerima
hipotesis alternatif. Daerah kritis ini biasanya disimbolkan dengan
huruf C.
Definisi Istilah
Definisi berikut diambil dari buku karangan Lehmann dan Romano:[3]
Hipotesis statistik
Sebuah pernyataan tentang parameter yang menjelaskan sebuah populasi
(bukan sampel).
Statistik
Angka yang dihitung dari sekumpulan sampel.
Hipotesis nol (H0)
Sebuah hipotesis yang berlawanan dengan teori yang akan dibuktikan.
Hipotesis alternatif (H1) atau hipotesis kerja (Ha)
Sebuah hipotesis (kadang gabungan) yang berhubungan dengan teori yang
akan dibuktikan.
Tes Statistik
Sebuah prosedur yang masukannya adalah sampel dan hasilnya adalah
hipotesis.
Daerah penerimaan
Nilai dari tes statistik yang menggagalkan untuk penolakan hipotesis
nol.
Daerah penolakan
Nilai dari tes statistik untuk penolakan hipotesis nol.
Kekuatan Statistik (1 − β)
Probabilitas kebenaran pada saat menolak hipotesis nol.
Tingkat signifikan test (α)
Probabilitas kesalahan pada saat menolak hipotesis nol.
Nilai P (P-value)
Probabilitas, mengasumsikan hipotesis nol benar.
Interpretasi
Jika nilai p lebih kecil dari tingkat signifikan tes yang diharapkan,
maka hipotesis nol bisa ditolak. Jika nilai p tidak lebih kecil dari
tingkat signifikan tes yang diharapkan bisa disimpulkan bahwa tidak
cukup bukti untuk menolak hipotesa nol, dan bisa disimpulkan bahwa
hipotesa alternatif yang benar.
Prosedur uji hipotesis
1. Tentukan parameter yang akan diuji
2. Tentukan Hipotesis nol (H0)
3. Tentukan Hipotesis alternatif (H1)
4. Tentukan (α)
5. Pilih statistik yang tepat
6. Tentukan daerah penolakan
7. Hitung statistik uji
8. Putuskan apakah Hipotesis nol (H0) ditolak atau tidak
Contoh uji hipotesis
Seorang yang dituduh pencuri dihadapkan kepada seorang hakim. Seorang
hakim akan menganggap orang tersebut tidak bersalah, sampai kesalahannya
bisa dibuktikan. Seorang jaksa akan berusaha membuktikan kesalahan
orang tersebut.
Dalam kasus ini, hipotesis nol (H0) adalah: "Orang tersebut tidak
bersalah", dan hipotesis alternatif (H1) adalah: "Orang tersebut
bersalah". Hipotesis alternatif (H1) inilah yang akan dibuktikan.
Ada dua kondisi yang mungkin terjadi terhadap orang tersebut:
1. Orang tersebut tidak bersalah.
2. Orang tersebut bersalah.
Dan ada dua keputusan yang bisa diambil hakim:
1. Melepaskan orang tersebut.
2. Memenjarakan orang tersebut.
Hipotesis nol (H0) benar
(Orang tersebut tidak bersalah) Hipotesis alternatif (H1) benar
(Orang tersebut bersalah)
Menerima hipotesis nol
(Orang tersebut dibebaskan) Keputusan yang benar Keputusan yang salah
(Kesalahan Tipe II)
Menolak hipotesis nol
(Orang tersebut dipenjara) Keputusan yang salah
(Kesalahan Tipe I) Keputusan yang benar.
Dalam kasus ini, ada dua kemungkinan kesalahan yang dilakukan hakim:
1. Memenjarakan orang yang benar (Kesalahan Tipe I)
2. Melepaskan orang yang bersalah (Kesalahan Tipe II)
Rumus
Ada banyak jenis uji hipotesis yang dikenal. Tabel berikut menjelaskan
rumus untuk masing-masing uji hipotesis tersebut.
Nama Rumus Asumsi / Catatan
Satu sampel z-test
(En=One-sample z-test) (Populasi normal atau n > 30) dan σ
diketahui.
(z adalah jarak dari rata-rata sehubungan dengan simpangan baku
rata-rata). Untuk distribusi non-normal memungkinkan untuk dihitung
proporsi terkecil dalam sebuah populasi yang berada di dalam k simpangan
baku untuk setiap k.
Dua sampel z-test
(En=Two-sample z-test) Populasi normal dan observasi independen dan σ1
dn σ2 diketahui
Satu sampel t-test
(En=One-sample t-test)
(Populasi normal atau n > 30) dan tidak diketahui
Pasangan t-test
(En=Paired t-test)
(Populasi normal dari perbedaan atau n > 30) dan tidak diktahui
Dua sampel t-test digabung
(En=Two-sample pooled t-test)
varians yang sama
[4]
(Populasi normal atau n1 + n2 > 40) dan observasi independen dan σ1 =
σ2 idak diketahui
Dua sampel t-test terpisah
(En=Two-sample unpooled t-test)
varians tidak sama
[4]
(Populasi normal atau n1 + n2 > 40) dan observasi independen dan
kedua σ1 ≠ σ2 diketahui
Satu proporsi z-test
(En=One-proportion z-test) n .p0 > 10 dan n (1 − p0) > 10.
Dua proporsi z-test
(En=Two-proportion z-test)
digabungkan
n1 p1 > 5 dan n1(1 − p1) > 5 dan n2 p2 > 5 dan n2(1 − p2)
> 5 dan observasi independen.
Dua proporsi z-test
(En=Two-proportion z-test) tidak digabung n1 p1 > 5 dan n1(1 − p1)
> 5 dan n2 p2 > 5 dan n2(1 − p2) > 5 dan observasi independen.
Chi-squared test untuk varians Populasi normal
Chi-squared test untuk goodness of fit df = k - 1 - # parameter
terestimasi
• Semua jumlah yang diharapkan paling tidak 5.[5]
• Semua jumlah yang diharapkan > 1 dan tidak lebih dari 20% dari
jumlah yang diharapkan lebih kecil dari 5[6]
Dua sampel F test untuk persamaan varians
(En=Two-sample F test for equality of variances) Populasi normal
Diurutkan > dan H0 ditolak jika [7]
Definisi simbol:
• , probabilitas melakukan kesalahan tipe I (menolak hipotesis nol pada
saat hipotesis nol benar)
• = Jumlah sampel
• = Jumlah sampel 1
• = Jumlah sampel 2
• = Rata-rata sampel
• = Dugaan rata-rata populasi
• = Rata-rata populasi 1
• = Rata-rata populasi 2
• = Simpangan baku populasi
• = Varians populasi
• = Simpangan baku sampel
• = Penjumlahan(dari angka sejumlak k) • = Variacs sampel
• = Simpangan baku sampe 1
• = Simpangan baku sampe 2
• = t statistik
• = derajat kebebasan (En=Degree of freedom)
• = Rata-rata perbedaan sampel
• = Dugaan rata-rata perbedaan populasi
• = Simpangan baku perbedaan
• = Chi-squared statistik
• = x/n = Proporsi sampel, (kecuali ditentukan sebelumnya)
• = Dugaan proporsi populasi
• = proporsi 1
• = proporsi 2
• = Dugaan perbedaan proporsi
• = minimum of n1 and n2
•
•
• = F statistik
Referensi
1. R. A. Fisher (1925). Statistical Methods for Research Workers,
Edinburgh: Oliver and Boyd, 1925, p.43.
2. Cramer, Duncan; Dennis Howitt (2004). The Sage Dictionary of
Statistics. hlm. 76. ISBN 076194138X.
3. Lehmann, E.L.; Romano, Joseph P. (2005). Testing Statistical
Hypotheses (ed. 3E). New York: Springer. ISBN 0387988645.
4. NIST handbook: Two-Sample t-Test for Equal Means
5. Steel, R.G.D, and Torrie, J. H., Principles and Procedures of
Statistics with Special Reference to the Biological Sciences., McGraw
Hill, 1960, page 350.
6. Weiss, Neil A. (1999). Introductory Statistics (ed. 5th). hlm. 802.
ISBN 0-201-59877-9.
7. NIST handbook: F-Test for Equality of Two Standard Deviations
(Testing standard deviations the same as testing variances)
BAB
8
ANALISIS
VARIANS Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis (lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan). Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua rerata (mean). Supaya sahih (valid) dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan: 1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor 2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh 3. Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat 4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah). Varian dan Standar Deviasi (Simpangan Baku) Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akarkuadrat dari varian. Jadi jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain. Penghitungan Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, kemudian semua hasilnya dijumlahkan. Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0. Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, kemudian dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif. Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n). Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel. Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka n sebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilainya menjadi lebih besar dan mendekati varian populasi. Oleh karena itu rumus varian menjadi : Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Jika satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku). Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan : Rumus varian : Rumus standar deviasi (simpangan baku) : Contoh Penghitungan Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut. 172, 167, 180,170, 169, 160, 175, 165, 173, 170 Dari data tersebut dapat dihitung varian dengan menggunakan rumus varian di atas. Dari penghitungan, diperoleh nilai varian sama dengan 30,22. Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian. Keterangan: s2 = varian s = standar deviasi (simpangan baku) xi = nilai x ke-i = rata-rata n = ukuran sampel
VARIANS Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis (lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan). Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua rerata (mean). Supaya sahih (valid) dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan: 1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor 2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh 3. Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat 4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah). Varian dan Standar Deviasi (Simpangan Baku) Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akarkuadrat dari varian. Jadi jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain. Penghitungan Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, kemudian semua hasilnya dijumlahkan. Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0. Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, kemudian dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif. Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n). Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel. Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka n sebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilainya menjadi lebih besar dan mendekati varian populasi. Oleh karena itu rumus varian menjadi : Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Jika satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku). Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan : Rumus varian : Rumus standar deviasi (simpangan baku) : Contoh Penghitungan Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut. 172, 167, 180,170, 169, 160, 175, 165, 173, 170 Dari data tersebut dapat dihitung varian dengan menggunakan rumus varian di atas. Dari penghitungan, diperoleh nilai varian sama dengan 30,22. Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian. Keterangan: s2 = varian s = standar deviasi (simpangan baku) xi = nilai x ke-i = rata-rata n = ukuran sampel
BAB9 ANALISIS REGRESI DAN KORELASI ANALISIS REGRESI KORELASI
Analisis regresi mempelajari bentuk hubungan antara satu atau lebih peubah/variabel bebas (X) dengan satu peubah tak bebas . dalam penelitian peubah bebas ( X) biasanya peubah yang ditentukan oleh peneliti secara bebas misalnya dosis obat, lama penyimpanan, kadar zat pengawet, umur ternak dan sebagainya. Disamping itu peubah bebas bisa juga berupa peubah tak bebasnya, misalnya dalam pengukuran panjang badan dan berat badan sapi, karena panjang badan lebih mudah diukur maka panjang badan dimasukkan kedalam peubah bebas (X), sedangkan berat badan dimasukkan peubah tak bebas . Sedangkan peubah tak bebas dalam penelitian berupa respon yang diukur akibat perlakuan/peubah bebas (X). misalnya jumlah sel darah merah akibat pengobatan dengan dosis tertentu, jumlah mikroba daging setelah disimpan beberapa hari, berat ayam pada umur tertentu dan sebagainya. Untuk mempelajari cara melakukan analisis regresi linear, silahkan baca artikel kami antara lain: Regresi Linear Sederhana dengan SPSS Regresi Linear Berganda dengan Minitab Regresi Linear Berganda dengan STATA Analisis Regresi dalam Excel Bentuk hubungan antara peubah bebas (X) dengan peubah tak bebas bisa dalam bentuk polinom derajat satu (linear) polinom derajat dua (kuadratik). Polinom derajat tiga (Kubik) dan seterusnya. Disamping itu bisa juga dalam bentuk lain misalnya eksponensial, logaritma, sigmoid dan sebagainya. Bentuk-bentuk ini dalam analisis regresi-korelasi biasanya dilakukan transformasi supaya menjadi bentuk polinom. Dalam bentuk yang paling sederhana yaitu satu peubah bebas (X) dengan satu peubah tak bebas mempunyai persamaan: Y =a +bx Disini a disebut intersep dan b adalah koefisien arah atau koefisien beta. Dalam pengertian fungsi persamaan garis Y + a + bx hanya ada satu yang dapat dibentuk dari dua buah titik dengan koordinat yang berbeda yaitu ( X1, Y1) dan X2,Y2). Hal ini berarti kita bisa membuat banyak sekali persamaan garis dalam bentuk lain melalui dua buat titik yang berbeda koordinatnya/tidak berimpit. Persamaan garis melalui dua buah titik dirumuskan sebagai berikut: Persamaan Garis Regresi Sebagai contoh misalnya titik A (1,3) dan titik B ($,9) maka persamaan garis linear yang dapat dibuat adalah: Persamaan Garis Linear Dalam bentuk matrik bisa kita buat persaman sebagai berikut: Matrix Regresi Linear Jadi a=1 dan b=2 sehingga persamaannya Y=1 +2X Jika jumlah data sebanyak n maka persamaannya sebagai berikut: Disini βo adalah penduga a, β1 adlah penduga b dan εi merupakan besarnya simpangan persamaan garis penduga. Semakin kecil nilai εi persamaan regresi yang diperoleh akan semakin baik. Jadi kita dapat menuliskan pengamatan kita menjadi: Dengan notasi matriks dapat ditulis sebagai berikut: Jadi kita peroleh matrik Y,X,β dan ε dengan dimensi sebagai berikut : Jika diasumsikan E(ε) = 0 maka E(Y) = Xβ Bila modelnya benar β merupakan penduga terbaik yaitu dengan jalan melakukan penggandaan awal dengan X’ sehingga diperoleh persamaan normal sebagai berikut: Jadi β=(X’X)-1X’Y Disini(X’X)-1 adalah kebalikan (inverse) dari matrik X’X Contoh : Seorang peneliti ingin mengetahui bentuk hubungan antara jumlah cacing jenis tertentu dengan jumlah telurnya pada usus ayam buras. Untuk tujuan tersebut diperiksa 20 ekor ayam dan ditemukan sebagai berikut: Tabel 1 jumlah cacing dan jumlah telurnya pada usus ayam buras. Dari data diatas kita bisa menghitung: Bila kita duga bentuk hubungan antara jumlah cacing (X) dan jumlah telurnya adalah: Jadi Ŷ=-2,442 + 4,103 Xi, Persamaan garis regresi Yi =-2,442 + 4,103 Xi bukanlah satu-satunya garis penduga untuk menyatakan hubungan antara jumlah cacing dengan jumlah telurnya. Sudah barang tentu masih banyak lagi bentuk persamaan penduga yang dapat dibuat misalnya dalam bentuk persamaan Yi=βo+β1Xi+β2Xi2,Yi=βoXiβ1 (dalam bentuk linear LnYi=Ln βo+βiLnXi) dan masih banyak lagi bentuk yang lainnya. Untuk menyatakan apakah garis yang diperoleh cukup baik untuk menggambarkan hubungan antara peubah bebas (X) dengan peubah tak bebas dapat dilakukan pengujian bentuk model yang digunakan dan keeratan hubungannya (korelasi) untuk menyatakan ketepatan dan ketelitian persamaan garis regresi yang diperoleh
BAB7
Pengujian
Hipotesis
Uji hipotesis adalah metode pengambilan keputusan yang didasarkan dari
analisis data, baik dari percobaan yang terkontrol, maupun dari
observasi (tidak terkontrol). Dalam statistik sebuah hasil bisa
dikatakan signifikan secara statistik jika kejadian tersebut hampir
tidak mungkin disebabkan oleh faktor yang kebetulan, sesuai dengan batas
probabilitas yang sudah ditentukan sebelumnya.
Uji hipotesis kadang disebut juga "konfirmasi analisis data". Keputusan
dari uji hipotesis hampir selalu dibuat berdasarkan pengujian hipotesis
nol. Ini adalah pengujian untuk menjawab pertanyaan yang mengasumsikan
hipotesis nol adalah benar.
Daerah kritis (bahasa Inggris: critical region) dari uji hipotesis
adalah serangkaian hasil yang bisa menolak hipotesis nol, untuk menerima
hipotesis alternatif. Daerah kritis ini biasanya disimbolkan dengan
huruf C.
Definisi Istilah
Definisi berikut diambil dari buku karangan Lehmann dan Romano:[3]
Hipotesis statistik
Sebuah pernyataan tentang parameter yang menjelaskan sebuah populasi
(bukan sampel).
Statistik
Angka yang dihitung dari sekumpulan sampel.
Hipotesis nol (H0)
Sebuah hipotesis yang berlawanan dengan teori yang akan dibuktikan.
Hipotesis alternatif (H1) atau hipotesis kerja (Ha)
Sebuah hipotesis (kadang gabungan) yang berhubungan dengan teori yang
akan dibuktikan.
Tes Statistik
Sebuah prosedur yang masukannya adalah sampel dan hasilnya adalah
hipotesis.
Daerah penerimaan
Nilai dari tes statistik yang menggagalkan untuk penolakan hipotesis
nol.
Daerah penolakan
Nilai dari tes statistik untuk penolakan hipotesis nol.
Kekuatan Statistik (1 − β)
Probabilitas kebenaran pada saat menolak hipotesis nol.
Tingkat signifikan test (α)
Probabilitas kesalahan pada saat menolak hipotesis nol.
Nilai P (P-value)
Probabilitas, mengasumsikan hipotesis nol benar.
Interpretasi
Jika nilai p lebih kecil dari tingkat signifikan tes yang diharapkan,
maka hipotesis nol bisa ditolak. Jika nilai p tidak lebih kecil dari
tingkat signifikan tes yang diharapkan bisa disimpulkan bahwa tidak
cukup bukti untuk menolak hipotesa nol, dan bisa disimpulkan bahwa
hipotesa alternatif yang benar.
Prosedur uji hipotesis
1. Tentukan parameter yang akan diuji
2. Tentukan Hipotesis nol (H0)
3. Tentukan Hipotesis alternatif (H1)
4. Tentukan (α)
5. Pilih statistik yang tepat
6. Tentukan daerah penolakan
7. Hitung statistik uji
8. Putuskan apakah Hipotesis nol (H0) ditolak atau tidak
Contoh uji hipotesis
Seorang yang dituduh pencuri dihadapkan kepada seorang hakim. Seorang
hakim akan menganggap orang tersebut tidak bersalah, sampai kesalahannya
bisa dibuktikan. Seorang jaksa akan berusaha membuktikan kesalahan
orang tersebut.
Dalam kasus ini, hipotesis nol (H0) adalah: "Orang tersebut tidak
bersalah", dan hipotesis alternatif (H1) adalah: "Orang tersebut
bersalah". Hipotesis alternatif (H1) inilah yang akan dibuktikan.
Ada dua kondisi yang mungkin terjadi terhadap orang tersebut:
1. Orang tersebut tidak bersalah.
2. Orang tersebut bersalah.
Dan ada dua keputusan yang bisa diambil hakim:
1. Melepaskan orang tersebut.
2. Memenjarakan orang tersebut.
Hipotesis nol (H0) benar
(Orang tersebut tidak bersalah) Hipotesis alternatif (H1) benar
(Orang tersebut bersalah)
Menerima hipotesis nol
(Orang tersebut dibebaskan) Keputusan yang benar Keputusan yang salah
(Kesalahan Tipe II)
Menolak hipotesis nol
(Orang tersebut dipenjara) Keputusan yang salah
(Kesalahan Tipe I) Keputusan yang benar.
Dalam kasus ini, ada dua kemungkinan kesalahan yang dilakukan hakim:
1. Memenjarakan orang yang benar (Kesalahan Tipe I)
2. Melepaskan orang yang bersalah (Kesalahan Tipe II)
Rumus
Ada banyak jenis uji hipotesis yang dikenal. Tabel berikut menjelaskan
rumus untuk masing-masing uji hipotesis tersebut.
Nama Rumus Asumsi / Catatan
Satu sampel z-test
(En=One-sample z-test) (Populasi normal atau n > 30) dan σ
diketahui.
(z adalah jarak dari rata-rata sehubungan dengan simpangan baku
rata-rata). Untuk distribusi non-normal memungkinkan untuk dihitung
proporsi terkecil dalam sebuah populasi yang berada di dalam k simpangan
baku untuk setiap k.
Dua sampel z-test
(En=Two-sample z-test) Populasi normal dan observasi independen dan σ1
dn σ2 diketahui
Satu sampel t-test
(En=One-sample t-test)
(Populasi normal atau n > 30) dan tidak diketahui
Pasangan t-test
(En=Paired t-test)
(Populasi normal dari perbedaan atau n > 30) dan tidak diktahui
Dua sampel t-test digabung
(En=Two-sample pooled t-test)
varians yang sama
[4]
(Populasi normal atau n1 + n2 > 40) dan observasi independen dan σ1 =
σ2 idak diketahui
Dua sampel t-test terpisah
(En=Two-sample unpooled t-test)
varians tidak sama
[4]
(Populasi normal atau n1 + n2 > 40) dan observasi independen dan
kedua σ1 ≠ σ2 diketahui
Satu proporsi z-test
(En=One-proportion z-test) n .p0 > 10 dan n (1 − p0) > 10.
Dua proporsi z-test
(En=Two-proportion z-test)
digabungkan
n1 p1 > 5 dan n1(1 − p1) > 5 dan n2 p2 > 5 dan n2(1 − p2)
> 5 dan observasi independen.
Dua proporsi z-test
(En=Two-proportion z-test) tidak digabung n1 p1 > 5 dan n1(1 − p1)
> 5 dan n2 p2 > 5 dan n2(1 − p2) > 5 dan observasi independen.
Chi-squared test untuk varians Populasi normal
Chi-squared test untuk goodness of fit df = k - 1 - # parameter
terestimasi
• Semua jumlah yang diharapkan paling tidak 5.[5]
• Semua jumlah yang diharapkan > 1 dan tidak lebih dari 20% dari
jumlah yang diharapkan lebih kecil dari 5[6]
Dua sampel F test untuk persamaan varians
(En=Two-sample F test for equality of variances) Populasi normal
Diurutkan > dan H0 ditolak jika [7]
Definisi simbol:
• , probabilitas melakukan kesalahan tipe I (menolak hipotesis nol pada
saat hipotesis nol benar)
• = Jumlah sampel
• = Jumlah sampel 1
• = Jumlah sampel 2
• = Rata-rata sampel
• = Dugaan rata-rata populasi
• = Rata-rata populasi 1
• = Rata-rata populasi 2
• = Simpangan baku populasi
• = Varians populasi
• = Simpangan baku sampel
• = Penjumlahan(dari angka sejumlak k) • = Variacs sampel
• = Simpangan baku sampe 1
• = Simpangan baku sampe 2
• = t statistik
• = derajat kebebasan (En=Degree of freedom)
• = Rata-rata perbedaan sampel
• = Dugaan rata-rata perbedaan populasi
• = Simpangan baku perbedaan
• = Chi-squared statistik
• = x/n = Proporsi sampel, (kecuali ditentukan sebelumnya)
• = Dugaan proporsi populasi
• = proporsi 1
• = proporsi 2
• = Dugaan perbedaan proporsi
• = minimum of n1 and n2
•
•
• = F statistik
Referensi
1. R. A. Fisher (1925). Statistical Methods for Research Workers,
Edinburgh: Oliver and Boyd, 1925, p.43.
2. Cramer, Duncan; Dennis Howitt (2004). The Sage Dictionary of
Statistics. hlm. 76. ISBN 076194138X.
3. Lehmann, E.L.; Romano, Joseph P. (2005). Testing Statistical
Hypotheses (ed. 3E). New York: Springer. ISBN 0387988645.
4. NIST handbook: Two-Sample t-Test for Equal Means
5. Steel, R.G.D, and Torrie, J. H., Principles and Procedures of
Statistics with Special Reference to the Biological Sciences., McGraw
Hill, 1960, page 350.
6. Weiss, Neil A. (1999). Introductory Statistics (ed. 5th). hlm. 802.
ISBN 0-201-59877-9.
7. NIST handbook: F-Test for Equality of Two Standard Deviations
(Testing standard deviations the same as testing variances)