Apa itu distribusi Poisson dalam Statistik dan Ilmu Data?

Di bidang Ilmu Data, mempelajari konsep Statistik dan Probabilitas adalah suatu keharusan karena tanpanya kita tidak dapat melakukan operasi yang paling sederhana juga. Kita perlu memikirkan setiap titik waktu persamaan Statistik mana yang cocok untuk membuat pekerjaan kita lebih mudah dan rapi di depan publik. Probabilitas dan Statistik tidak hanya memainkan peran penting dalam Ilmu Data tetapi juga dalam kehidupan kita sehari-hari seperti memperkirakan biaya suatu produk, melempar koin, bermain kartu, dan memperkirakan kemungkinan mendapatkan Ace of Diamonds, dll. Jadi keduanya istilah yang terhubung entah bagaimana dengan kita.

Sekarang, bagi seorang Data Scientist, sangat penting untuk bermain-main dengan database yang diberikan kepadanya dan membantu memandu organisasi mana pun untuk mendapatkan wawasan yang berarti dari database dengan membuat grafik, membuat dasbor interaktif, atau banyak lagi. Juga, Probabilitas memainkan peran penting dalam mendapatkan detail data dan bagaimana data didistribusikan. Ada banyak cara untuk mendapatkan distribusi data kita dengan bantuan Probabilitas dan disebut distribusi Probabilitas. Beberapa distribusi probabilitas adalah Distribusi Binomial, Distribusi Normal, Distribusi Normal Standar, Distribusi Poisson, dll. Hari ini topik hangat dipusatkan di sekitar Distribusi Poisson. Jadi, mari kita menyelam lebih dalam dan memahami arti dari istilah ini:

Keterangan

Distribusi Poisson adalah jenis Distribusi Probabilitas yang sangat mirip dengan Distribusi Binomial yaitu diterapkan pada variabel acak diskrit yang memiliki beberapa nilai. Ini digunakan dalam menggambarkan peristiwa acak yang jarang terjadi selama kontinum ruang atau waktu. Sebagai contoh, misalkan kita memiliki kejadian A dan kita ingin menentukan banyaknya kejadian A pada periode t tertentu, maka kita akan menerapkan distribusi Poisson. Di sini waktu dapat dibagi menjadi n interval yang sama yang masing-masing memiliki panjang t/n. Interval n ini juga disebut percobaan Bernoulli.

Sekarang masalah muncul saat menghitung probabilitas acara karena interval di mana waktu dibagi memiliki nilai yang sangat kecil dan oleh karena itu kita tidak dapat menerapkan Distribusi Poisson karena kita tidak dapat mengatakan bahwa sekali peristiwa terjadi pada interval waktu tertentu tidak dapat terjadi lagi dalam waktu itu.

Jadi, untuk mengatasi masalah ini kita menambah panjang interval waktu sejauh mungkin sehingga peristiwa tersebut gagal berulang dalam periode waktu tersebut. Rumus untuk menghitung Fungsi Massa Probabilitas untuk distribusi Poisson diberikan oleh:

P(x) = e -m.m x / x!, dimana e disebut basa Naperi bernilai 2.183, x adalah no. berapa kali peristiwa itu terjadi, dan m adalah rata-rata dari variabel acak yang diberikan oleh m= np (jumlah percobaan. probabilitas keberhasilan).

Nilai e -m dapat diperoleh dari tabel matematika. Juga, satu hal utama yang perlu diperhatikan di sini adalah distribusi Poisson tidak pernah memperhitungkan probabilitas kegagalan yaitu, 1-p = q, jadi, jika di sini kita hanya memperhatikan keberhasilan dan rata-rata dari kumpulan data. Juga, mean dan varians dalam distribusi Poisson adalah sama dan diberikan oleh rumus yang sama.

Kesimpulan

Dengan di atas kita dapat menyimpulkan bahwa setiap kali kita prihatin dengan menemukan probabilitas data tergantung waktu maka kita dapat menerapkan distribusi Poisson dan itu juga ketika kita dapat membagi no. interval menjadi nilai yang cukup besar. Juga, distribusi Poisson memainkan peran yang sangat penting setiap kali kita ingin melakukan Analisis Data Eksplorasi dalam Ilmu Data menggunakan alat yang berbeda seperti Python, R, Scala, dll.