Contoh proses yang bukan Poisson?

15

Saya mencari beberapa contoh bagus situasi yang tidak cocok untuk model dengan distribusi Poisson, untuk membantu saya menjelaskan distribusi Poisson kepada siswa.

Orang biasanya menggunakan jumlah pelanggan yang tiba di toko dalam interval waktu sebagai contoh yang dapat dimodelkan oleh distribusi Poisson. Saya mencari contoh tandingan dalam nada yang sama, yaitu situasi yang dapat dianggap sebagai proses penghitungan positif dalam waktu terus menerus yang jelas bukan Poisson.

Situasi idealnya harus sesederhana dan sejelas mungkin, agar memudahkan siswa untuk memahami dan mengingat.

Nagel
sumber
5
Pertanyaan ini sangat luas. Kecuali jika ruang lingkupnya dipersempit dan beberapa konteks ditambahkan, sangat mungkin berakhir tertutup. Tanpa bermaksud terdengar kasar dan tidak perlu, sama saja dengan bertanya: "Apa saja contoh bunga yang tidak merah?" (Cue Harry Chapin.)
kardinal
1
Poin yang diambil. Permintaan maaf saya. Saya seharusnya membuatnya lebih spesifik. Saya mengeditnya untuk membuatnya lebih jelas.
Nagel
1
(+1) untuk pertanyaan dan komentar. Pembaruan jauh lebih baik. :-)
cardinal
2
Saya akan menganggap Anda berarti "proses yang diberikan yang orang mungkin setidaknya secara naif menganggap Poisson" (misalnya setidaknya, proses penghitungan). Contoh umum terjadi dalam jumlah klaim pada kebijakan asuransi umum (asuransi P&C), karena sejumlah faktor yang mungkin, paling jelas tercermin dalam heterogenitas dalam tingkat klaim - jadi ada superposisi proses Poisson dengan intensitas yang berbeda. Dalam situasi di mana distribusi tingkat klaim diperkirakan dengan baik oleh distribusi gamma, distribusi jumlah klaim pada gilirannya diperkirakan oleh binomial negatif.
Glen_b -Reinstate Monica

Jawaban:

5

Jumlah rokok yang dihisap dalam periode waktu tertentu: ini memerlukan proses inflasi nol (mis. Poisson nol atau binomial negatif nol) karena tidak semua orang merokok.

Alexis
sumber
Terima kasih! Banyak di sini telah menyebutkan proses tanpa inflasi, tetapi saya pikir ini adalah contoh paling langsung dan ilustratif yang telah diberikan: Jumlah rokok yang dihisap oleh orang yang dipetik secara acak dalam periode waktu tertentu.
Nagel
Namun, ada halangan dengan argumen "tidak semua orang merokok", di mana Anda dapat mengklaim bahwa proses ini masih Poisson, hanya saja parameter intensitas khusus untuk setiap orang dan tidak diketahui (non-perokok akan memiliki sangat kecil). intensitas) - benar? Namun, orang juga dapat berargumen bahwa situasi ini melanggar asumsi Poisson dalam hal bahwa rokok yang dihisap cenderung menyebar secara merata sepanjang hari (untuk perokok biasa) atau kluster (untuk perokok sosial) sehingga interval waktu yang terpisah tidak independen. Jadi ini masih merupakan contoh yang baik, saya pikir.
Nagel
1
Jumlah ikan yang ditangkap dalam periode waktu adalah, saya pikir, contoh yang lebih kanonik untuk ZIP dan ZINB. Argumen serupa. Meskipun demikian, ikan tidak memiliki potensi efek adiktif pada tingkat konsumsi. (Aku tahu, aku tahu, kecuali untuk ikan ibumu, karena mereka yang baik :).
Alexis
8

Apakah maksud Anda data jumlah positif? Tak terbatas?

Binomial negatif populer.

Model bagus lainnya adalah Poisson dengan inflasi 0. Model itu mengasumsikan bahwa sesuatu sedang terjadi atau tidak - dan jika ya, ia mengikuti Poisson. Saya melihat contoh baru-baru ini. Perawat yang merawat pasien AIDS ditanya seberapa sering mereka mengalami perilaku stigma dari orang lain sebagai akibat dari keterlibatan mereka dengan pasien AIDS. Sejumlah besar tidak pernah memiliki pengalaman seperti itu, mungkin karena tempat mereka bekerja atau tinggal. Dari mereka yang melakukannya, jumlah pengalaman stigmatisasi bervariasi. Ada lebih banyak 0 yang dilaporkan daripada yang Anda harapkan dari Poisson langsung, pada dasarnya karena sebagian tertentu dari kelompok yang diteliti sama sekali tidak berada dalam lingkungan yang memaparkan mereka pada perilaku semacam itu.

Campuran Poisson's juga akan memberi Anda proses poin.

Placidia
sumber
(+1) untuk distribusi Poisson zero-inflated. Diskusi tentang model ini dapat ditemukan di sini
1
Beri +1 pada ini (dan jawaban lain) yang memberikan contoh aktual dari situasi yang dirujuk dalam pertanyaan, bukan hanya distribusi abstrak. Contoh ZIP ini sangat jelas.
Whuber
1
Untuk penghargaan mereka yang menjawab, saya harus menunjukkan bahwa pertanyaan saya pada awalnya terlalu ceroboh, dan sama sekali tidak merujuk pada situasi. Saya setuju bahwa Poisson zero-inflated adalah contoh yang baik. Namun, saya merasa agak terlalu terlibat untuk menjelaskan kepada mahasiswa sarjana, jadi saya masih kehilangan contoh situasi sederhana yang tidak dapat dimodelkan oleh distribusi Poisson.
Nagel
4

Menghitung proses yang bukan Poisson? Nah, setiap proses ruang sampel terbatas seperti seragam binomial atau diskrit. Anda mendapatkan proses penghitungan Poisson dari penghitungan peristiwa yang memiliki waktu interarrival independen yang terdistribusi secara eksponensial, sehingga seluruh host generalisasi tidak dapat melakukannya seperti memiliki gamma atau lognormal atau Weibull mendistribusikan waktu interarrival, atau segala jenis waktu antar-abstrak non-parametrik abstrak distribusi.

AdamO
sumber
Terima kasih atas balasan Anda, dan saya sangat menyesal karena pertanyaan saya awalnya tidak jelas. Saya sudah mengklarifikasi sekarang. Apa yang Anda katakan tentang proses dengan waktu antar-non-eksponensial dan / atau bergantung antar masuk akal, tetapi apakah Anda memiliki contoh situasi yang akan memiliki sifat-sifat ini, semakin sederhana semakin baik?
Nagel
4
Anda bertaruh! Waktu antara berjangkitnya virus herpes. Anda memiliki waktu lebih lama untuk wabah awal karena Anda harus benar-benar tertular virus. Waktu antar-wabah Anda antara wabah sesudahnya tidak tergantung satu sama lain, tetapi datang pada tingkat yang jauh lebih cepat dibandingkan dengan wabah indeks. Waktu antar-non-eksponensial adalah norma. Dalam analisis kelangsungan hidup, metode analitik yang umum digunakan adalah model Cox Proportional Hazards di mana Anda menghapus asumsi parametrik tentang waktu antar-waktu.
AdamO
Contoh yang baik! Saya kira ini adalah contoh lain dari Poisson tanpa inflasi yang disebutkan oleh Placidia di atas?
Nagel
4

Tidak jelas apakah Anda ingin menghitung proses atau tidak.

Jika saya menafsirkan tanda 'mengajar' berarti Anda sedang mengajarkan proses Poisson maka, untuk mengajar tentang suatu proses secara umum, proses Bernoulli adalah proses acak yang mudah untuk menjelaskan dan memvisualisasikan dan terkait dengan proses Poisson. Proses Bernoulli adalah analog diskrit sehingga mungkin merupakan konsep pendamping yang bermanfaat. Hanya saja alih-alih waktu terus menerus kami memiliki interval waktu yang terpisah.

Contohnya mungkin seorang salesman dari pintu ke pintu di mana kita menghitung keberhasilan oleh rumah yang melakukan pembelian.

  • Jumlah keberhasilan dalam percobaan n pertama, memiliki
    distribusi binomial B (n, p) bukan Poisson
  • Jumlah percobaan yang diperlukan untuk mendapatkan r keberhasilan, memiliki distribusi binomial negatif NB (r, p) daripada distribusi gamma
  • Jumlah percobaan yang diperlukan untuk mendapatkan satu kesuksesan, waktu tunggu, memiliki distribusi geometris NB (1, p), yang merupakan analog diskrit dari eksponensial.

Itulah pendekatan yang digunakan Bertsekas dan Tsitsiklis dalam Introduction To Probability , edisi ke-2, memperkenalkan proses Bernoulli sebelum proses Poisson. Di buku teks mereka ada lebih banyak ekstensi untuk proses Bernoulli yang berlaku untuk proses Poisson seperti menggabungkan mereka atau mempartisi mereka, serta set masalah dengan solusi.

Jika Anda mencari contoh proses acak, dan Anda hanya ingin membuang nama-nama di luar sana, ada beberapa.

Proses Gaussian sangat penting dalam aplikasi. Proses Weiner khususnya, yang merupakan jenis proses Gaussian, juga disebut gerak Brown standar dan memiliki aplikasi dalam keuangan dan fisika.

Meadowlark Bradsher
sumber
Terima kasih atas balasan Anda, dan saya sangat menyesal karena pertanyaan saya awalnya begitu tidak jelas dan tidak jelas. Saya sudah mencoba mengklarifikasi itu sekarang. Tautan dari Bernoulli ke Poisson menarik, tetapi yang saya cari adalah contoh situasi dalam waktu terus menerus yang tidak cocok untuk dimodelkan oleh distribusi Poisson, semakin sederhana semakin baik.
Nagel
3

Sebagai aktuaris properti / korban, saya berurusan dengan contoh nyata dari proses diskrit yang non-Poisson sepanjang waktu. Untuk bisnis dengan tingkat keparahan tinggi, frekuensi rendah, distribusi Poisson tidak sesuai karena menuntut rasio varian terhadap rata-rata 1. Distribusi binomial negatif, yang disebutkan di atas, jauh lebih umum digunakan, dan distribusi Delaporte digunakan dalam beberapa literatur, meskipun lebih jarang dalam praktik aktuaria standar Amerika Utara.

Mengapa demikian adalah pertanyaan yang lebih dalam. Apakah binomial negatif jauh lebih baik karena merupakan proses Poisson yang parameter rata-ratanya adalah gamma itu sendiri terdistribusi? Atau apakah karena kejadian kehilangan gagal kemerdekaan (seperti peristiwa gempa bumi berdasarkan teori saat ini bahwa semakin lama seseorang menunggu bumi untuk menyelinap, semakin besar kemungkinan itu disebabkan oleh penumpukan tekanan), apakah itu tidak stasioner (intervalnya) tidak dapat dibagi lagi menjadi urutan, masing-masing stasioner, yang akan memungkinkan penggunaan Poisson non-homogen), dan tentu saja beberapa lini bisnis memungkinkan untuk kejadian simultan (misalnya malpraktek medis dengan beberapa dokter yang dicakup oleh kebijakan).

Avraham
sumber
2

Yang lain telah menyebutkan beberapa contoh proses titik yang bukan Poisson. Karena Poisson sesuai dengan waktu interarrival eksponensial jika Anda memilih distribusi waktu antararrival yang tidak eksponensial, proses titik yang dihasilkan bukanlah Poisson. AdamO menunjuk Weibull. Anda dapat menggunakan gamma, lognormal, atau beta sebagai pilihan yang memungkinkan.

Poisson memiliki properti yang rerata nya sama dengan variansnya. Proses titik yang memiliki varian lebih besar dari rata-rata kadang-kadang disebut sebagai overdispersed dan jika rata-rata lebih besar dari varians itu kurang terdispersi. Istilah-istilah ini digunakan untuk menghubungkan proses ke Poisson. Binomial negatif sering digunakan karena dapat terlalu banyak atau kurang tersebar tergantung pada parameternya.

Poisson memiliki varian yang konstan. Proses titik yang sesuai dengan kondisi Poisson kecuali untuk tidak memiliki parameter laju konstan dan akibatnya rata-rata dan varians waktu yang bervariasi disebut Poisson tidak homogen.

Suatu proses dengan waktu antar waktu eksponensial tetapi dapat memiliki beberapa peristiwa pada waktu kedatangan disebut senyawa Poisson. Meskipun mirip dengan proses Poisson dan memiliki nama dengan kata Poisson di dalamnya, proses Poisson tidak homogen dan majemuk berbeda dari proses titik Poisson.

Michael R. Chernick
sumber
Terima kasih atas balasan Anda, dan saya sangat menyesal karena pertanyaan saya awalnya begitu tidak jelas dan tidak jelas. Saya sudah mencoba mengklarifikasi itu sekarang. Anda menyebutkan proses dengan waktu antar-non-eksponensial dan / atau tergantung antar, dan apa yang Anda katakan tentang distribusi yang terlalu banyak dan kurang tersebar sangat menarik, tetapi apakah Anda memiliki contoh situasi konkret yang akan memiliki sifat-sifat ini? Semakin sederhana semakin baik :)
Nagel
1
Daripada mencoba memberikan jawaban saya sendiri, saya pikir ada banyak sekali, banyak contoh yang dapat Anda temukan di buku yang berhubungan dengan proses penghitungan. Izinkan saya merekomendasikan Anda melihat buku Joe Hilbe tentang regresi binomial negatif .
Michael R. Chernick
2

Contoh menarik lain dari proses penghitungan non-Poisson diwakili oleh distribusi Poisson nol-terpotong (ZTPD). ZTPD dapat memuat data mengenai jumlah bahasa yang dapat digunakan subjek dalam kondisi fisiologis. Dalam hal ini, distribusi Poisson bertingkah buruk, karena jumlah bahasa yang diucapkan menurut definisi> = 1: maka 0 dikesampingkan secara apriori.

Carlo Lazzaro
sumber
2

Saya percaya bahwa Anda dapat mengambil proses kedatangan pelanggan Poisson Anda dan mengubahnya dengan dua cara berbeda: 1) kedatangan pelanggan diukur 24 jam sehari, tetapi toko itu sebenarnya tidak buka sepanjang hari, dan 2) bayangkan dua toko yang bersaing dengan Poisson memproses waktu kedatangan pelanggan dan melihat perbedaan antara kedatangan di dua toko. (Contoh # 2 dari pemahaman saya tentang Springer Handbook of Engineering Statistics, Bagian A Properti 1.4.)

Wayne
sumber
1

Anda mungkin ingin mempertimbangkan kembali contoh sepakbola. Tampaknya tingkat penilaian untuk kedua tim meningkat saat pertandingan berlangsung, & bahwa mereka berubah ketika tim mengubah prioritas serangan / pertahanan mereka sebagai tanggapan terhadap skor saat ini.

Atau lebih tepatnya, gunakan itu sebagai contoh bagaimana model sederhana dapat melakukan sangat baik, merangsang minat dalam penyelidikan statistik beberapa fenomena, & memberikan tolok ukur untuk studi masa depan yang mengumpulkan lebih banyak data untuk menyelidiki perbedaan & mengusulkan elaborasi.

Dixon & Robinson (1998), "Model Proses Kelahiran untuk Pertandingan Sepak Bola Asosiasi", Ahli Statistik , 47 , 3.

Scortchi - Pasang kembali Monica
sumber
Saya punya firasat bahwa pertandingan sepak bola tidak cukup Poisson, tapi terima kasih untuk referensi :)
Nagel
1

Karena pertanyaannya terkait dengan membuat distribusi Poisson lebih dimengerti, saya akan mencobanya, karena saya baru-baru ini melihat ke dalam ini untuk pola panggilan masuk call center (yang mengikuti distribusi eksponensial memori-kurang, seiring berjalannya waktu).

Saya pikir menggali model tangensial lain yang pada dasarnya membutuhkan pengetahuan Poisson untuk menyadari bahwa itu bukan salah satu mungkin agak membingungkan, tapi itu hanya saya.

Saya pikir masalah dengan memahami Poisson adalah sumbu waktu kontinu menyala --- karena setiap detik berlangsung, acara tidak lebih mungkin terjadi --- tetapi semakin jauh di masa depan Anda pergi, semakin yakin itu dari kejadian.

Sungguh, saya pikir itu menyederhanakan pemahaman jika Anda hanya menukar sumbu 'waktu' untuk 'percobaan' atau 'peristiwa'.

Seseorang dapat mengoreksi saya jika ini jauh dari dasar, karena saya merasa ini adalah penjelasan yang mudah, tetapi saya pikir Anda dapat mengganti flip koin, atau lemparan dadu, dengan 'waktu sampai panggilan telepon tiba' (apa yang saya biasanya digunakan untuk staf Erlang C / pusat panggilan).

Alih-alih 'waktu sampai panggilan telepon tiba' ---- Anda dapat menggantinya dengan ... 'gulungan sampai dadu mencapai enam'.

Itu mengikuti logika umum yang sama. Probabilitas (seperti judi apa pun) benar-benar independen setiap roll (atau menit) dan tidak memiliki memori. Namun, kemungkinan 'no 6' berkurang lebih lambat tetapi pasti menuju 0 saat Anda meningkatkan jumlah percobaan. Lebih mudah jika Anda melihat kedua grafik (kemungkinan panggilan dengan waktu, vs kemungkinan enam dengan gulungan).

Saya tidak tahu apakah itu masuk akal --- itulah yang membantu saya menyatukannya menjadi istilah konkret. Sekarang, distribusi poisson adalah hitungan daripada 'waktu antara panggilan' atau 'uji coba hingga bergulir enam' - tetapi bergantung pada kemungkinan ini.

John Babson
sumber
Saya dapat melihat bagaimana Anda akan berpikir ini bisa membingungkan bagi siswa, tetapi ide saya adalah hanya akan membuatnya lebih mudah bagi saya untuk menjelaskan mengapa jumlah pelanggan yang tiba di sebuah restoran dalam interval waktu adalah Poisson, jika saya memiliki konter -contoh dari proses sederhana dengan peristiwa diskrit dalam waktu terus menerus yang bukan Poisson.
Nagel
1
Ada banyak pilihan, saya pikir. Satu pola yang jelas adalah peristiwa yang meningkatkan atau mengurangi probabilitas dengan kejadiannya sendiri. Sulit memikirkan beberapa contoh. Mungkin semut tiba di dapur / piknik Anda. Waktu yang diperlukan untuk kedatangan semut pertama mungkin jauh lebih lama daripada yang kedua atau ketiga, dan tentu saja lebih banyak kedatangan semut berarti lebih banyak kemungkinan kedatangan semut di masa depan (mengingat bahwa jalur mereka / komunikasi satu sama lain). Tidak yakin apakah itu akan diperhitungkan.
John Babson
1

Jumlah kunjungan oleh masing-masing pelanggan ke toko grosir dalam interval waktu tertentu.

Setelah Anda pergi ke toko bahan makanan, Anda tidak mungkin kembali untuk sementara waktu kecuali Anda membuat kesalahan perencanaan.

Saya pikir distribusi Binomial Negatif dapat digunakan di sini, tetapi terpisah, sedangkan kunjungannya berlangsung terus menerus.

Josiah Yoder
sumber