Uji hipotesis

Uji hipotesis adalah metode pengambilan keputusan yang didasarkan dari analisis data, baik dari percobaan yang terkontrol, maupun dari observasi (tidak terkontrol). Dalam statistik sebuah hasil bisa dikatakan signifikan secara statistik jika kejadian tersebut hampir tidak mungkin disebabkan oleh faktor yang kebetulan, sesuai dengan batas probabilitas yang sudah ditentukan sebelumnya.[1]

Uji hipotesis kadang disebut juga "konfirmasi analisis data". Keputusan dari uji hipotesis hampir selalu dibuat berdasarkan pengujian hipotesis nol. Ini adalah pengujian untuk menjawab pertanyaan yang mengasumsikan hipotesis nol adalah benar.[2]

Daerah kritis (bahasa Inggris: critical region) dari uji hipotesis adalah serangkaian hasil yang bisa menolak hipotesis nol, untuk menerima hipotesis alternatif. Daerah kritis ini biasanya disimbolkan dengan huruf C.

Definisi istilah

Definisi berikut diambil dari buku karangan Lehmann dan Romano:[3]

Hipotesis statistik
Sebuah pernyataan tentang parameter yang menjelaskan sebuah populasi (bukan sampel).
Statistik
Angka yang dihitung dari sekumpulan sampel.
Hipotesis nol (H0)
Sebuah hipotesis yang berlawanan dengan teori yang akan dibuktikan.
Hipotesis alternatif (H1) atau hipotesis kerja (Ha)
Sebuah hipotesis (kadang gabungan) yang berhubungan dengan teori yang akan dibuktikan.
Tes Statistik
Sebuah prosedur yang masukannya adalah sampel dan hasilnya adalah hipotesis.
Daerah penerimaan
Nilai dari tes statistik yang menggagalkan untuk penolakan hipotesis nol.
Daerah penolakan
Nilai dari tes statistik untuk penolakan hipotesis nol.
Kekuatan Statistik (1 − β)
Probabilitas kebenaran pada saat menolak hipotesis nol.
Tingkat signifikan test (α)
Probabilitas kesalahan pada saat menolak hipotesis nol.
Nilai p (P-value)
Probabilitas, mengasumsikan hipotesis nol benar.

Interpretasi

Jika nilai p lebih kecil dari tingkat signifikan tes yang diharapkan, maka hipotesis nol bisa ditolak. Jika nilai p lebih besar dari tingkat signifikan tes yang diharapkan, maka hipotesis nol bisa diterima.

Prosedur uji hipotesis

  1. Tentukan parameter yang akan diuji
  2. Tentukan Hipotesis nol (H0)
  3. Tentukan Hipotesis alternatif (H1)
  4. Tentukan (α)
  5. Pilih statistik yang tepat
  6. Tentukan daerah penolakan
  7. Hitung statistik uji
  8. Putuskan apakah Hipotesis nol (H0) ditolak atau tidak

Contoh uji hipotesis

Seorang yang dituduh pencuri dihadapkan kepada seorang hakim. Seorang hakim akan menganggap orang tersebut tidak bersalah, sampai kesalahannya bisa dibuktikan. Seorang jaksa akan berusaha membuktikan kesalahan orang tersebut.

Dalam kasus ini, hipotesis nol (H0) adalah: "Orang tersebut tidak bersalah", dan hipotesis alternatif (H1) adalah: "Orang tersebut bersalah". Hipotesis alternatif (H1) inilah yang akan dibuktikan.

Ada dua kondisi yang mungkin terjadi terhadap orang tersebut:

  1. Orang tersebut tidak bersalah.
  2. Orang tersebut bersalah.

Dan ada dua keputusan yang bisa diambil hakim:

  1. Melepaskan orang tersebut.
  2. Memenjarakan orang tersebut.
Hipotesis nol (H0) benar
(Orang tersebut tidak bersalah)
Hipotesis alternatif (H1) benar
(Orang tersebut bersalah)
Menerima hipotesis nol
(Orang tersebut dibebaskan)
Keputusan yang benar Keputusan yang salah
(Kesalahan Tipe II)
Menolak hipotesis nol
(Orang tersebut dipenjara)
Keputusan yang salah
(Kesalahan Tipe I)
Keputusan yang benar.

Dalam kasus ini, ada dua kemungkinan kesalahan yang dilakukan hakim:

  1. Memenjarakan orang yang benar (Kesalahan Tipe I)
  2. Melepaskan orang yang bersalah (Kesalahan Tipe II)

Rumus

Ada banyak jenis uji hipotesis yang dikenal. Tabel berikut menjelaskan rumus untuk masing-masing uji hipotesis tersebut.

Nama Rumus Asumsi / Catatan
Satu sampel z-test
(En=One-sample z-test)
z = x ¯ μ 0 σ n {\displaystyle z={\frac {{\overline {x}}-\mu _{0}}{\sigma }}{\sqrt {n}}} (Populasi normal atau n > 30) dan σ diketahui.

(z adalah jarak dari rata-rata sehubungan dengan simpangan baku rata-rata). Untuk distribusi non-normal memungkinkan untuk dihitung proporsi terkecil dalam sebuah populasi yang berada di dalam k simpangan baku untuk setiap k.

Dua sampel z-test
(En=Two-sample z-test)
z = ( x ¯ 1 x ¯ 2 ) d 0 σ 1 2 n 1 + σ 2 2 n 2 {\displaystyle z={\frac {({\overline {x}}_{1}-{\overline {x}}_{2})-d_{0}}{\sqrt {{\frac {\sigma _{1}^{2}}{n_{1}}}+{\frac {\sigma _{2}^{2}}{n_{2}}}}}}} Populasi normal dan observasi independen dan σ1 dn σ2 diketahui
Satu sampel t-test
(En=One-sample t-test)
t = x ¯ μ 0 ( s / n ) , {\displaystyle t={\frac {{\overline {x}}-\mu _{0}}{(s/{\sqrt {n}})}},}

d f = n 1   {\displaystyle df=n-1\ }

(Populasi normal atau n > 30) dan σ {\displaystyle \sigma } tidak diketahui
Pasangan t-test
(En=Paired t-test)
t = d ¯ d 0 ( s d / n ) , {\displaystyle t={\frac {{\overline {d}}-d_{0}}{(s_{d}/{\sqrt {n}})}},}

d f = n 1   {\displaystyle df=n-1\ }

(Populasi normal dari perbedaan atau n > 30) dan σ {\displaystyle \sigma } tidak diktahui
Dua sampel t-test digabung
(En=Two-sample pooled t-test)
varians yang sama
t = ( x ¯ 1 x ¯ 2 ) d 0 s p 1 n 1 + 1 n 2 , {\displaystyle t={\frac {({\overline {x}}_{1}-{\overline {x}}_{2})-d_{0}}{s_{p}{\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}},}

s p 2 = ( n 1 1 ) s 1 2 + ( n 2 1 ) s 2 2 n 1 + n 2 2 , {\displaystyle s_{p}^{2}={\frac {(n_{1}-1)s_{1}^{2}+(n_{2}-1)s_{2}^{2}}{n_{1}+n_{2}-2}},}
d f = n 1 + n 2 2   {\displaystyle df=n_{1}+n_{2}-2\ } [4]

(Populasi normal atau n1 + n2 > 40) dan observasi independen dan σ1 = σ2 idak diketahui
Dua sampel t-test terpisah
(En=Two-sample unpooled t-test)
varians tidak sama
t = ( x ¯ 1 x ¯ 2 ) d 0 s 1 2 n 1 + s 2 2 n 2 , {\displaystyle t={\frac {({\overline {x}}_{1}-{\overline {x}}_{2})-d_{0}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}},}

d f = ( s 1 2 n 1 + s 2 2 n 2 ) 2 ( s 1 2 n 1 ) 2 n 1 1 + ( s 2 2 n 2 ) 2 n 2 1 {\displaystyle df={\frac {\left({\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}\right)^{2}}{{\frac {\left({\frac {s_{1}^{2}}{n_{1}}}\right)^{2}}{n_{1}-1}}+{\frac {\left({\frac {s_{2}^{2}}{n_{2}}}\right)^{2}}{n_{2}-1}}}}} [4]

(Populasi normal atau n1 + n2 > 40) dan observasi independen dan kedua σ1 ≠ σ2 diketahui
Satu proporsi z-test
(En=One-proportion z-test)
z = p ^ p 0 p 0 ( 1 p 0 ) n {\displaystyle z={\frac {{\hat {p}}-p_{0}}{\sqrt {p_{0}(1-p_{0})}}}{\sqrt {n}}} n .p0 > 10 dan n (1 − p0) > 10.
Dua proporsi z-test
(En=Two-proportion z-test)
H 0 : p 1 = p 2 {\displaystyle H_{0}\colon p_{1}=p_{2}} digabungkan
z = ( p ^ 1 p ^ 2 ) p ^ ( 1 p ^ ) ( 1 n 1 + 1 n 2 ) {\displaystyle z={\frac {({\hat {p}}_{1}-{\hat {p}}_{2})}{\sqrt {{\hat {p}}(1-{\hat {p}})({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}})}}}}

p ^ = x 1 + x 2 n 1 + n 2 {\displaystyle {\hat {p}}={\frac {x_{1}+x_{2}}{n_{1}+n_{2}}}}

n1 p1 > 5 dan n1(1 − p1) > 5 dan n2 p2 > 5 dan n2(1 − p2) > 5 dan observasi independen.
Dua proporsi z-test
(En=Two-proportion z-test) | d 0 | > 0 {\displaystyle |d_{0}|>0} tidak digabung
z = ( p ^ 1 p ^ 2 ) d 0 p ^ 1 ( 1 p ^ 1 ) n 1 + p ^ 2 ( 1 p ^ 2 ) n 2 {\displaystyle z={\frac {({\hat {p}}_{1}-{\hat {p}}_{2})-d_{0}}{\sqrt {{\frac {{\hat {p}}_{1}(1-{\hat {p}}_{1})}{n_{1}}}+{\frac {{\hat {p}}_{2}(1-{\hat {p}}_{2})}{n_{2}}}}}}} n1 p1 > 5 dan n1(1 − p1) > 5 dan n2 p2 > 5 dan n2(1 − p2) > 5 dan observasi independen.
Chi-squared test untuk varians χ 2 = ( n 1 ) s 2 σ 0 2 {\displaystyle \chi ^{2}=(n-1){\frac {s^{2}}{\sigma _{0}^{2}}}} Populasi normal
Chi-squared test untuk goodness of fit χ 2 = k ( o b s e r v e d e x p e c t e d ) 2 e x p e c t e d {\displaystyle \chi ^{2}=\sum ^{k}{\frac {(observed-expected)^{2}}{expected}}} df = k - 1 - # parameter terestimasi

• Semua jumlah yang diharapkan paling tidak 5.[5]

• Semua jumlah yang diharapkan > 1 dan tidak lebih dari 20% dari jumlah yang diharapkan lebih kecil dari 5[6]

Dua sampel F test untuk persamaan varians
(En=Two-sample F test for equality of variances)
F = s 1 2 s 2 2 {\displaystyle F={\frac {s_{1}^{2}}{s_{2}^{2}}}} Populasi normal
Diurutkan s 1 2 {\displaystyle s_{1}^{2}} > s 2 2 {\displaystyle s_{2}^{2}} dan H0 ditolak jika F > F ( α / 2 , n 1 1 , n 2 1 ) {\displaystyle F>F(\alpha /2,n_{1}-1,n_{2}-1)} [7]
Definisi simbol:
  • α {\displaystyle \alpha } , probabilitas melakukan kesalahan tipe I (menolak hipotesis nol pada saat hipotesis nol benar)
  • n {\displaystyle n} = Jumlah sampel
  • n 1 {\displaystyle n_{1}} = Jumlah sampel 1
  • n 2 {\displaystyle n_{2}} = Jumlah sampel 2
  • x ¯ {\displaystyle {\overline {x}}} = Rata-rata sampel
  • μ 0 {\displaystyle \mu _{0}} = Dugaan rata-rata populasi
  • μ 1 {\displaystyle \mu _{1}} = Rata-rata populasi 1
  • μ 2 {\displaystyle \mu _{2}} = Rata-rata populasi 2
  • σ {\displaystyle \sigma } = Simpangan baku populasi
  • σ 2 {\displaystyle \sigma ^{2}} = Varians populasi
  • s {\displaystyle s} = Simpangan baku sampel
  • k {\displaystyle \sum ^{k}} = Penjumlahan(dari angka sejumlak k)
  • s 2 {\displaystyle s^{2}} = Variacs sampel
  • s 1 {\displaystyle s_{1}} = Simpangan baku sampe 1
  • s 2 {\displaystyle s_{2}} = Simpangan baku sampe 2
  • t {\displaystyle t} = t statistik
  • d f {\displaystyle df} = derajat kebebasan (En=Degree of freedom)
  • d ¯ {\displaystyle {\overline {d}}} = Rata-rata perbedaan sampel
  • d 0 {\displaystyle d_{0}} = Dugaan rata-rata perbedaan populasi
  • s d {\displaystyle s_{d}} = Simpangan baku perbedaan
  • χ 2 {\displaystyle \chi ^{2}} = Chi-squared statistik
  • p ^ {\displaystyle {\hat {p}}} = x/n = Proporsi sampel, (kecuali ditentukan sebelumnya)
  • p 0 {\displaystyle p_{0}} = Dugaan proporsi populasi
  • p 1 {\displaystyle p_{1}} = proporsi 1
  • p 2 {\displaystyle p_{2}} = proporsi 2
  • d p {\displaystyle d_{p}} = Dugaan perbedaan proporsi
  • min { n 1 , n 2 } {\displaystyle \min\{n_{1},n_{2}\}} = minimum of n1 and n2
  • x 1 = n 1 p 1 {\displaystyle x_{1}=n_{1}p_{1}}
  • x 2 = n 2 p 2 {\displaystyle x_{2}=n_{2}p_{2}}
  • F {\displaystyle F} = F statistik

Referensi

  1. ^ R. A. Fisher (1925). Statistical Methods for Research Workers, Edinburgh: Oliver and Boyd, 1925, p.43.
  2. ^ Cramer, Duncan (2004). The Sage Dictionary of Statistics. hlm. 76. ISBN 076194138X.  Parameter |coauthors= yang tidak diketahui mengabaikan (|author= yang disarankan) (bantuan)
  3. ^ Lehmann, E.L.; Romano, Joseph P. (2005). Testing Statistical Hypotheses (edisi ke-3E). New York: Springer. ISBN 0387988645. 
  4. ^ a b NIST handbook: Two-Sample t-Test for Equal Means
  5. ^ Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, page 350.
  6. ^ Weiss, Neil A. (1999). Introductory Statistics (edisi ke-5th). hlm. 802. ISBN 0-201-59877-9. 
  7. ^ NIST handbook: F-Test for Equality of Two Standard Deviations (Testing standard deviations the same as testing variances)

Pranala luar

  • (Inggris) Wilson González, Georgina (September 10, 1997). "Hypothesis Testing". Environmental Sampling & Monitoring Primer. Virginia Tech. Diarsipkan dari versi asli tanggal 2011-12-11. Diakses tanggal 2012-04-27.  Parameter |coauthors= yang tidak diketahui mengabaikan (|author= yang disarankan) (bantuan)
  • (Inggris) Bayesian critique of classical hypothesis testing
  • (Inggris) Critique of classical hypothesis testing highlighting long-standing qualms of statisticians
  • (Inggris) Dallal GE (2007) The Little Handbook of Statistical Practice (A good tutorial)
  • (Inggris) References for arguments for and against hypothesis testing
  • (Inggris) Statistical Tests Overview: Diarsipkan 2009-10-29 di Wayback Machine. How to choose the correct statistical test
  • (Inggris) An Interactive Online Tool to Encourage Understanding Hypothesis Testing Diarsipkan 2011-07-26 di Wayback Machine.