Saya mencari beberapa contoh bagus situasi yang tidak cocok untuk model dengan distribusi Poisson, untuk membantu saya menjelaskan distribusi Poisson kepada siswa.
Orang biasanya menggunakan jumlah pelanggan yang tiba di toko dalam interval waktu sebagai contoh yang dapat dimodelkan oleh distribusi Poisson. Saya mencari contoh tandingan dalam nada yang sama, yaitu situasi yang dapat dianggap sebagai proses penghitungan positif dalam waktu terus menerus yang jelas bukan Poisson.
Situasi idealnya harus sesederhana dan sejelas mungkin, agar memudahkan siswa untuk memahami dan mengingat.
Jawaban:
Jumlah rokok yang dihisap dalam periode waktu tertentu: ini memerlukan proses inflasi nol (mis. Poisson nol atau binomial negatif nol) karena tidak semua orang merokok.
sumber
Apakah maksud Anda data jumlah positif? Tak terbatas?
Binomial negatif populer.
Model bagus lainnya adalah Poisson dengan inflasi 0. Model itu mengasumsikan bahwa sesuatu sedang terjadi atau tidak - dan jika ya, ia mengikuti Poisson. Saya melihat contoh baru-baru ini. Perawat yang merawat pasien AIDS ditanya seberapa sering mereka mengalami perilaku stigma dari orang lain sebagai akibat dari keterlibatan mereka dengan pasien AIDS. Sejumlah besar tidak pernah memiliki pengalaman seperti itu, mungkin karena tempat mereka bekerja atau tinggal. Dari mereka yang melakukannya, jumlah pengalaman stigmatisasi bervariasi. Ada lebih banyak 0 yang dilaporkan daripada yang Anda harapkan dari Poisson langsung, pada dasarnya karena sebagian tertentu dari kelompok yang diteliti sama sekali tidak berada dalam lingkungan yang memaparkan mereka pada perilaku semacam itu.
Campuran Poisson's juga akan memberi Anda proses poin.
sumber
Menghitung proses yang bukan Poisson? Nah, setiap proses ruang sampel terbatas seperti seragam binomial atau diskrit. Anda mendapatkan proses penghitungan Poisson dari penghitungan peristiwa yang memiliki waktu interarrival independen yang terdistribusi secara eksponensial, sehingga seluruh host generalisasi tidak dapat melakukannya seperti memiliki gamma atau lognormal atau Weibull mendistribusikan waktu interarrival, atau segala jenis waktu antar-abstrak non-parametrik abstrak distribusi.
sumber
Tidak jelas apakah Anda ingin menghitung proses atau tidak.
Jika saya menafsirkan tanda 'mengajar' berarti Anda sedang mengajarkan proses Poisson maka, untuk mengajar tentang suatu proses secara umum, proses Bernoulli adalah proses acak yang mudah untuk menjelaskan dan memvisualisasikan dan terkait dengan proses Poisson. Proses Bernoulli adalah analog diskrit sehingga mungkin merupakan konsep pendamping yang bermanfaat. Hanya saja alih-alih waktu terus menerus kami memiliki interval waktu yang terpisah.
Contohnya mungkin seorang salesman dari pintu ke pintu di mana kita menghitung keberhasilan oleh rumah yang melakukan pembelian.
distribusi binomial B (n, p) bukan Poisson
Itulah pendekatan yang digunakan Bertsekas dan Tsitsiklis dalam Introduction To Probability , edisi ke-2, memperkenalkan proses Bernoulli sebelum proses Poisson. Di buku teks mereka ada lebih banyak ekstensi untuk proses Bernoulli yang berlaku untuk proses Poisson seperti menggabungkan mereka atau mempartisi mereka, serta set masalah dengan solusi.
Jika Anda mencari contoh proses acak, dan Anda hanya ingin membuang nama-nama di luar sana, ada beberapa.
Proses Gaussian sangat penting dalam aplikasi. Proses Weiner khususnya, yang merupakan jenis proses Gaussian, juga disebut gerak Brown standar dan memiliki aplikasi dalam keuangan dan fisika.
sumber
Sebagai aktuaris properti / korban, saya berurusan dengan contoh nyata dari proses diskrit yang non-Poisson sepanjang waktu. Untuk bisnis dengan tingkat keparahan tinggi, frekuensi rendah, distribusi Poisson tidak sesuai karena menuntut rasio varian terhadap rata-rata 1. Distribusi binomial negatif, yang disebutkan di atas, jauh lebih umum digunakan, dan distribusi Delaporte digunakan dalam beberapa literatur, meskipun lebih jarang dalam praktik aktuaria standar Amerika Utara.
Mengapa demikian adalah pertanyaan yang lebih dalam. Apakah binomial negatif jauh lebih baik karena merupakan proses Poisson yang parameter rata-ratanya adalah gamma itu sendiri terdistribusi? Atau apakah karena kejadian kehilangan gagal kemerdekaan (seperti peristiwa gempa bumi berdasarkan teori saat ini bahwa semakin lama seseorang menunggu bumi untuk menyelinap, semakin besar kemungkinan itu disebabkan oleh penumpukan tekanan), apakah itu tidak stasioner (intervalnya) tidak dapat dibagi lagi menjadi urutan, masing-masing stasioner, yang akan memungkinkan penggunaan Poisson non-homogen), dan tentu saja beberapa lini bisnis memungkinkan untuk kejadian simultan (misalnya malpraktek medis dengan beberapa dokter yang dicakup oleh kebijakan).
sumber
Yang lain telah menyebutkan beberapa contoh proses titik yang bukan Poisson. Karena Poisson sesuai dengan waktu interarrival eksponensial jika Anda memilih distribusi waktu antararrival yang tidak eksponensial, proses titik yang dihasilkan bukanlah Poisson. AdamO menunjuk Weibull. Anda dapat menggunakan gamma, lognormal, atau beta sebagai pilihan yang memungkinkan.
Poisson memiliki properti yang rerata nya sama dengan variansnya. Proses titik yang memiliki varian lebih besar dari rata-rata kadang-kadang disebut sebagai overdispersed dan jika rata-rata lebih besar dari varians itu kurang terdispersi. Istilah-istilah ini digunakan untuk menghubungkan proses ke Poisson. Binomial negatif sering digunakan karena dapat terlalu banyak atau kurang tersebar tergantung pada parameternya.
Poisson memiliki varian yang konstan. Proses titik yang sesuai dengan kondisi Poisson kecuali untuk tidak memiliki parameter laju konstan dan akibatnya rata-rata dan varians waktu yang bervariasi disebut Poisson tidak homogen.
Suatu proses dengan waktu antar waktu eksponensial tetapi dapat memiliki beberapa peristiwa pada waktu kedatangan disebut senyawa Poisson. Meskipun mirip dengan proses Poisson dan memiliki nama dengan kata Poisson di dalamnya, proses Poisson tidak homogen dan majemuk berbeda dari proses titik Poisson.
sumber
Contoh menarik lain dari proses penghitungan non-Poisson diwakili oleh distribusi Poisson nol-terpotong (ZTPD). ZTPD dapat memuat data mengenai jumlah bahasa yang dapat digunakan subjek dalam kondisi fisiologis. Dalam hal ini, distribusi Poisson bertingkah buruk, karena jumlah bahasa yang diucapkan menurut definisi> = 1: maka 0 dikesampingkan secara apriori.
sumber
Saya percaya bahwa Anda dapat mengambil proses kedatangan pelanggan Poisson Anda dan mengubahnya dengan dua cara berbeda: 1) kedatangan pelanggan diukur 24 jam sehari, tetapi toko itu sebenarnya tidak buka sepanjang hari, dan 2) bayangkan dua toko yang bersaing dengan Poisson memproses waktu kedatangan pelanggan dan melihat perbedaan antara kedatangan di dua toko. (Contoh # 2 dari pemahaman saya tentang Springer Handbook of Engineering Statistics, Bagian A Properti 1.4.)
sumber
Anda mungkin ingin mempertimbangkan kembali contoh sepakbola. Tampaknya tingkat penilaian untuk kedua tim meningkat saat pertandingan berlangsung, & bahwa mereka berubah ketika tim mengubah prioritas serangan / pertahanan mereka sebagai tanggapan terhadap skor saat ini.
Atau lebih tepatnya, gunakan itu sebagai contoh bagaimana model sederhana dapat melakukan sangat baik, merangsang minat dalam penyelidikan statistik beberapa fenomena, & memberikan tolok ukur untuk studi masa depan yang mengumpulkan lebih banyak data untuk menyelidiki perbedaan & mengusulkan elaborasi.
Dixon & Robinson (1998), "Model Proses Kelahiran untuk Pertandingan Sepak Bola Asosiasi", Ahli Statistik , 47 , 3.
sumber
Karena pertanyaannya terkait dengan membuat distribusi Poisson lebih dimengerti, saya akan mencobanya, karena saya baru-baru ini melihat ke dalam ini untuk pola panggilan masuk call center (yang mengikuti distribusi eksponensial memori-kurang, seiring berjalannya waktu).
Saya pikir menggali model tangensial lain yang pada dasarnya membutuhkan pengetahuan Poisson untuk menyadari bahwa itu bukan salah satu mungkin agak membingungkan, tapi itu hanya saya.
Saya pikir masalah dengan memahami Poisson adalah sumbu waktu kontinu menyala --- karena setiap detik berlangsung, acara tidak lebih mungkin terjadi --- tetapi semakin jauh di masa depan Anda pergi, semakin yakin itu dari kejadian.
Sungguh, saya pikir itu menyederhanakan pemahaman jika Anda hanya menukar sumbu 'waktu' untuk 'percobaan' atau 'peristiwa'.
Seseorang dapat mengoreksi saya jika ini jauh dari dasar, karena saya merasa ini adalah penjelasan yang mudah, tetapi saya pikir Anda dapat mengganti flip koin, atau lemparan dadu, dengan 'waktu sampai panggilan telepon tiba' (apa yang saya biasanya digunakan untuk staf Erlang C / pusat panggilan).
Alih-alih 'waktu sampai panggilan telepon tiba' ---- Anda dapat menggantinya dengan ... 'gulungan sampai dadu mencapai enam'.
Itu mengikuti logika umum yang sama. Probabilitas (seperti judi apa pun) benar-benar independen setiap roll (atau menit) dan tidak memiliki memori. Namun, kemungkinan 'no 6' berkurang lebih lambat tetapi pasti menuju 0 saat Anda meningkatkan jumlah percobaan. Lebih mudah jika Anda melihat kedua grafik (kemungkinan panggilan dengan waktu, vs kemungkinan enam dengan gulungan).
Saya tidak tahu apakah itu masuk akal --- itulah yang membantu saya menyatukannya menjadi istilah konkret. Sekarang, distribusi poisson adalah hitungan daripada 'waktu antara panggilan' atau 'uji coba hingga bergulir enam' - tetapi bergantung pada kemungkinan ini.
sumber
Jumlah kunjungan oleh masing-masing pelanggan ke toko grosir dalam interval waktu tertentu.
Setelah Anda pergi ke toko bahan makanan, Anda tidak mungkin kembali untuk sementara waktu kecuali Anda membuat kesalahan perencanaan.
Saya pikir distribusi Binomial Negatif dapat digunakan di sini, tetapi terpisah, sedangkan kunjungannya berlangsung terus menerus.
sumber