Tingkat signifikansi

Tingkat signifikansi adalah pelengkap interval kepercayaan dari suatu distribusi dan digunakan untuk menguji hipotesis nol (H0) dalam uji inferensi statistik .

Dengan kata lain, tingkat signifikansi adalah probabilitas yang kita tinggalkan di luar interval kepercayaan suatu distribusi dan membantu kita menentukan apakah statistik uji berada di zona penolakan atau tidak.

Hubungan antara tingkat signifikansi dan tingkat kepercayaan

Tentunya kita semua pernah mendengar seseorang bertanya berapa nilai yang harus kita berikan pada alpha dari distribusi atau dengan tingkat kepercayaan berapa kita menghitung interval, secara matematis, (1-alpha). Jawabannya biasanya selalu 1%, 5% atau 10% untuk alpha atau 99%, 95% dan 90% untuk tingkat kepercayaan.

Penting untuk menjadi jelas tentang hal-hal berikut:

1%, 5%, 10% = alpha => Tingkat signifikansi .

99%, 95%, 90% = (1-alpha) => Interval kepercayaan .

Interval kepercayaan dan tingkat signifikansi saling melengkapi karena jumlah keduanya adalah luas dari fungsi kerapatan. Kemudian,

Tingkat signifikansi dan interval kepercayaan saling melengkapi

Kita telah mengetahui bahwa luas fungsi kerapatan adalah 1. Secara matematis, kita dapat menyelesaikan integral ini:

Area fungsi kepadatan

Representasi tingkat signifikansi

Dalam hal ini, distribusi t Student dengan 16 derajat kebebasan telah digunakan untuk menunjukkan area fungsi mana yang termasuk dalam tingkat signifikansi. Persentase (2,5%, 2,5% dan 95%) sesuai dengan area di bawah fungsi kepadatan. Karena distribusi ini memiliki dua ekor, tingkat signifikansi dibagi dua, jadi 2,5% + 2,5% = 5%. Nilai kritis dari distribusi ini dengan 16 derajat kebebasan dan 5% sebagai tingkat signifikansi adalah 2.11991 di setiap ekor.

2.5% + 2.5% + 95% = 1%

Fungsi densitas dari distribusi t Student dengan 16 derajat kebebasan

Universal

Kita memberi label tingkat signifikansi sebagai universal karena tingkat ini diketahui dan digunakan dalam semua uji statistik . Sangat tidak biasa untuk menemukan tingkat signifikansi 20% atau 35% kecuali itu adalah kondisi pengujian yang eksplisit.

Memang benar bahwa level 1% dan 5% lebih populer daripada level 10%, tetapi ini untuk alasan akurasi. Lebih baik memberikan hasil 1 dari 100 kali (1/100 = 0,01 = 1%) atau 5 dari 100 kali (5/100 = 0,05 = 5%) daripada 10 dari 100 kali (10/100 = 0,1 = 10%), kan?

Juga, tingkat signifikansi disebut persentil, misalnya persentil 1% atau persentil 5%. Nomenklatur ini banyak digunakan untuk menghitung metrik value at risk (VaR).

Sewenang-wenang dan tidak sewenang-wenang

Tingkat signifikansi dapat bersifat arbitrer dan tidak arbitrer. Yang arbitrer adalah nilai yang kita pilih apriori (sebelum) mengetahui karakteristik percobaan. Dalam hal ini, sebelum menghitung statistik uji. Yang tidak sewenang-wenang adalah yang diperoleh dari hasil percobaan. Dalam hal ini, p-value, karena tergantung pada nilai yang diambil oleh uji statistik. Keduanya bergantung pada distribusi yang diikuti oleh data.