Kolmogorov – Tes Smirnoff (KS)

Uji Kolmogorov – Smirnoff (KS) adalah uji non-parametrik yang bertujuan untuk menentukan apakah frekuensi dua kumpulan data yang berbeda mengikuti distribusi yang sama di sekitar meannya .

Dengan kata lain, uji Kolmogorov – Smirnoff (KS) adalah pengujian yang menyesuaikan dengan bentuk data dan digunakan untuk memeriksa apakah dua sampel berbeda mengikuti distribusi yang sama.

Mengapa ini tes nonparametrik?

Keindahan karakteristik ” non-parametrik ” adalah bahwa ia beradaptasi dengan data dan, akibatnya, dengan distribusi yang dapat mengikuti frekuensi data. Lebih jauh lagi, karakteristik ini menyelamatkan kita dari keharusan mengasumsikan apriori distribusi sampel yang mengikuti.

Pentingnya tes KS

Berapa kali kita diberikan dua sampel dan kita menghitung koefisien korelasi Pearson tanpa berpikir dua kali? Dengan kata lain, jika kita ingin melihat hubungan linier antara dua kumpulan data, akan adil untuk menghitung korelasinya, bukan?

Pengurangan ini akan benar jika distribusi kedua sampel mengikuti distribusi normal . Koefisien korelasi mengasumsikan bahwa distribusinya normal, jika kita melewatkan asumsi ini, hasil koefisien korelasinya salah. Untuk uji hipotesis dan interval kepercayaan, kita juga mengasumsikan bahwa populasi didistribusikan melalui distribusi normal.

Seperti semua uji hipotesis yang melibatkan statistik , penting untuk memiliki volume data yang besar untuk mendapatkan hasil yang signifikan secara statistik. Kita mungkin keliru menolak hipotesis nol karena sampelnya kecil. Selain itu, penting juga bahwa sampel ini memiliki beberapa kasus ekstrim ( outlier , dalam bahasa Inggris) untuk memberikan konsistensi pada hasil tes.

Prosedur tes

Prosedur langkah selanjutnya.

Hipotesa

Langkah pertama adalah memeriksa apakah kedua sampel memiliki distribusi yang sama. Untuk melakukan ini, kita melakukan uji hipotesis dengan asumsi bahwa kedua sampel memiliki distribusi yang sama terhadap hipotesis alternatif yang berbeda.

Kontras hipotesis

Statistik

Kita bekerja dengan fungsi distribusi kumulatif dari dua sampel, F 1 (x) dan F 2 (x):

Statistik K-S.

Jangan panik! Kita menganalisis rumus di atas dengan tenang:

  • Bagian penting dari rumus adalah tanda perbedaan (-). Kita mencari perbedaan vertikal dalam distribusi. Jadi, kita akan mengurangkan kedua fungsi distribusi kumulatif.
  • Operator “maks” . Kita tertarik untuk menemukan perbedaan terbesar atau maksimum untuk melihat seberapa berbeda kedua distribusi tersebut.
  • Nilai mutlak . Kita menggunakan nilai absolut sehingga urutan operator tidak mengubah hasil. Dengan kata lain, tidak masalah F (x) mana yang bertanda negatif:

Cara alternatif untuk mengekspresikan statistik

Nilai kritis

Untuk sampel besar ada perkiraan nilai kritis untuk KS yang tergantung pada tingkat signifikansi (%):

Rumus nilai kritis K – S.

Dimana n 1 dan n 2 masing-masing adalah ukuran sampel untuk sampel F 1 (x) dan F 2 (x).

Beberapa nilai kritis yang dihitung:

Nilai kritis K – S.

Aturan penolakan

Aturan penolakan K – S.

Kegunaan

Sangat sering kita ingin menguji apakah dua distribusi cukup berbeda satu sama lain ketika kita ingin membangun skenario prediksi (kita bekerja dengan dua sampel) atau ketika kita ingin mengevaluasi distribusi mana yang paling sesuai dengan data (kita bekerja dengan hanya satu sampel).