Seberapa representatifkah distribusi Poisson dari distribusi peristiwa dalam kenyataan?

8

Saya selalu bertanya-tanya seberapa bagus 'cocok' adalah distribusi Poisson untuk peristiwa yang kita amati dalam kenyataan. Hampir selalu saya pernah melihatnya digunakan untuk memodelkan terjadinya peristiwa. (Misalnya, kedatangan mobil di garasi parkir atau jumlah atau pesan yang dikirim / diterima oleh komputer di jaringan, dll.)

Kami biasanya memodelkan acara seperti itu dengan Distribusi Poisson. Apakah distribusi hanyalah perkiraan pertama yang baik untuk bagaimana hal-hal terjadi dalam kenyataan? Jika saya mengamati jumlah mobil / hari atau pesan / hari dalam dua contoh di atas dan yang dikeluarkan dengan 'memilih dari distribusi', seberapa besar perbedaannya? Seberapa baik perkiraan Poisson? (Apakah ini perkiraan?) Apa 'sihir' di belakang Poisson yang membuatnya benar (berbicara secara intuitif :)?

PhD
sumber
4
Ada beberapa titik awal yang baik jika Anda mencari turunan dari distribusi poisson, yang menunjukkan bagaimana Poisson secara ajaib diturunkan dari distribusi binomial di mana n besar dan peluang suatu peristiwa kecil. Dari sana mulai masuk akal untuk menggunakannya untuk memodelkan acara hitung. Pertanyaan yang saya kira adalah seberapa baik jumlah kejadian nyata cocok dengan perluasan halus dari situasi binomial.
Peter Ellis

Jawaban:

5

Salah satu contoh yang bisa saya sampaikan adalah penjualan supermarket Barang-Barang Kemasan Konsumen (CPG). Ini juga merupakan acara hitung - supermarket dapat menjual 0 unit sehari, atau 1, atau 2 dan seterusnya, sehingga distribusi Poisson sepertinya cocok pertama.

Namun, catatan binomial distribusi @PeterEllis yang mendasarinya tidak berlaku. Ya, kami mungkin dapat memodelkan jumlah pelanggan dengan binomial ... tetapi beberapa pelanggan akan membeli 1 unit, beberapa akan membeli 2 unit dan beberapa akan memuat toilet mereka dan membeli 10 unit.

Hasilnya biasanya akan overdispersi, sehingga distribusi binomial negatif cocok jauh lebih baik daripada yang Poisson. (Kadang-kadang, kita bahkan dapat melihat penyebaran rendah untuk barang yang sangat cepat seperti susu).

Stephan Kolassa
sumber
3
+1. Hanya berpikir layak menyebutkan bahwa Poisson adalah kasus khusus Binomial Negatif dan bahwa salah satu cara menurunkan binomial negatif adalah sebagai campuran dari banyak distribusi Poisson yang berbeda dengan cara yang berbeda.
David J. Harris
4

Jika hal-hal yang dihitung tidak tergantung satu sama lain dan nilainya konstan (atau mengikuti model seperti dalam regresi poisson) maka distribusi Poisson umumnya akan bertahan cukup baik. Contoh-contoh seperti mobil yang tiba di garasi cenderung bekerja dengan cukup baik (selama periode waktu itu nilainya relatif konstan, termasuk jam sibuk dan tengah malam untuk garasi yang sering dikunjungi oleh 9 hingga 5 pekerja tidak akan bekerja dengan baik). Jam berapa Anda tiba di garasi akan memiliki sedikit atau pengaruh pada jam berapa saya tiba. Namun ada pengecualian bahwa jika 2 orang mengatur untuk bertemu pada waktu tertentu maka mereka cenderung untuk lebih dekat bersama, jika satu mengikuti yang lain maka mereka akan lebih dekat. Juga hal-hal seperti lampu lalu lintas terdekat dapat menyebabkan gumpalan dalam kedatangan yang tidak cocok dengan Poisson.

Jika Anda ingin membandingkan dataset tertentu untuk melihat apakah Poisson cocok, maka Anda dapat menggunakan rootogram gantung .

Greg Snow
sumber
1
+ untuk rootogram gantung!
Mike Dunlavey
2

Seperti kata @Stephan, garis lurus Poisson mungkin tidak memiliki cukup varians untuk menjadi model pengukuran integer non-negatif nyata yang diatur oleh fungsi bahaya. Jadi, seringkali binomial negatif digunakan, yang memiliki parameter tambahanα>0menentukan dispersi berlebih. Saya merasa bermanfaat untuk membuat parameter berdasarkanβ=ln(α) karena sebagai dispersi yang berlebihan α mendekati 0, artinya binomial negatif mendekati Poisson, binomial negatif menjadi sulit untuk dihitung.

Cara lain untuk meningkatkan dispersi adalah inflasi nol, yang dapat diterapkan pada Poisson atau binomial negatif. Untuk menggunakannya, pada setiap waktu pengukuran, pertama-tama lakukan uji coba Bernoulli (melempar koin). Jika koin adalah "kepala", pengukurannya adalah 0. Jika tidak, pengukurannya diambil dari Poisson atau distribusi binomial negatif.

Mike Dunlavey
sumber
2

Saya telah melihat bahwa jika peristiwa berubah menjadi teratur maka model Poisson melebih-lebihkan varians (logis dan jelas), sementara jika peristiwa ternyata mengelompok maka model Poisson meremehkan varians. Distribusi Poisson dihasilkan dari proses titik Poisson acak.

Buku teks lama saya merekomendasikan Cox, DR dan Miller, HD (1965) Teori proses stokastik pub. Wiley untuk bacaan lebih lanjut. Dalam buku pengantar persamaan diferensial orde pertama diturunkan untuk proses acak seperti itu, yang diselesaikan untuk memberikan probabilitas mengamati tidak ada peristiwa dalam waktut, P(0,t)=eat dimana a adalah tingkat kejadian dan t adalah waktu, lalu dengan mempertimbangkan P(1,t),P(2,t),dll. rumus Poisson umum diperoleh dengan inspeksi. C. Statistik Chatfield untuk teknologi: kursus dalam statistik terapan , 2nd Ed. 1978, pub. Chapman dan Hall: lihat halaman 70-75.

Dua contoh itu melanggar persyaratan keacakan yang mendasarinya. Jika peristiwa lebih atau kurang acak maka model Poisson adalah model yang adil. Mobil yang tiba di tempat parkir pusat kota yang sibuk mungkin merupakan contoh kumpulan data yang dikelompokkan, mungkin karena 9 hingga 5 pengguna, mungkin?

Peter Bennett
sumber