Beberapa tahun yang lalu saya merancang detektor radiasi yang bekerja dengan mengukur interval antara peristiwa daripada menghitungnya. Asumsi saya adalah, bahwa ketika mengukur sampel yang tidak berdekatan, rata-rata saya akan mengukur setengah dari interval yang sebenarnya. Namun ketika saya menguji rangkaian dengan sumber yang dikalibrasi, bacaan adalah faktor dua terlalu tinggi yang berarti saya telah mengukur interval penuh.
Dalam sebuah buku tua tentang probabilitas dan statistik, saya menemukan bagian tentang sesuatu yang disebut "The Waiting Paradox". Ini memberikan contoh di mana sebuah bus tiba di halte setiap 15 menit dan seorang penumpang tiba secara acak, itu menyatakan bahwa penumpang rata-rata akan menunggu 15 menit penuh. Saya tidak pernah bisa memahami matematika yang disajikan dengan contoh dan terus mencari penjelasan. Jika seseorang dapat menjelaskan mengapa itu sehingga penumpang menunggu interval penuh saya akan tidur lebih baik.
sumber
Jawaban:
Seperti yang ditunjukkan Glen_b, jika bus tiba setiap menit tanpa ketidakpastian apa pun , kita tahu bahwa waktu tunggu maksimum yang dimungkinkan adalah 15 menit. Jika dari bagian kami, kami tiba "secara acak", kami merasa bahwa "rata-rata" kami akan menunggu setengah dari waktu tunggu maksimum yang mungkin . Dan waktu tunggu maksimum yang mungkin ada di sini sama dengan panjang maksimum yang dimungkinkan antara dua kedatangan berturut-turut. Nyatakan waktu tunggu kami W dan panjang maksimum antara dua kedatangan bus berturut-turut R , dan kami berpendapat demikian15 15 W R
dan kami benar.
Tapi tiba-tiba kepastian diambil dari kami dan kami diberitahu bahwa menit sekarang adalah panjang rata - rata antara dua kedatangan bus. Dan kita jatuh ke dalam "perangkap pemikiran intuitif" dan berpikir: "kita hanya perlu mengganti R dengan nilai yang diharapkan", dan kami berdebat15 R
Sebuah indikasi pertama bahwa kita salah, adalah bahwa adalah tidak "panjang antara dua berturut-turut bus-pendatang", itu adalah " maksimum panjang dll". Jadi dalam hal apa pun, kita memiliki E ( R ) ≠ 15 .R E( R ) ≠ 15
Bagaimana kita sampai pada persamaan ? Kami berpikir: "waktu tunggu bisa dari 0 hingga 15 maksimum . Saya tiba dengan probabilitas yang sama pada setiap contoh, jadi saya" memilih "secara acak dan dengan probabilitas yang sama semua waktu tunggu yang memungkinkan. Oleh karena itu setengah panjang maksimum antara dua kedatangan bus berturut-turut adalah saya waktu tunggu rata - rata ". Dan kami benar.( 1 ) 0 15
Tetapi dengan salah memasukkan nilai dalam persamaan ( 2 ) , itu tidak lagi mencerminkan perilaku kita. Dengan 15 sebagai pengganti E ( R ) , persamaan ( 2 ) mengatakan "Saya memilih secara acak dan dengan probabilitas yang sama semua waktu tunggu yang mungkin lebih kecil atau sama dengan panjang rata-rata antara dua kedatangan bus berturut-turut " -dan di sinilah tempat intuitif kami kesalahan terletak, karena, perilaku kita tidak berubah - jadi, dengan tiba secara acak secara seragam, kita pada kenyataannya masih "memilih secara acak dan dengan probabilitas yang sama" semua kemungkinan waktu menunggu - tetapi "semua kemungkinan waktu menunggu" tidak ditangkap oleh15 ( 2 ) 15 E( R ) ( 2 ) - kami telah melupakan ekor kanan distribusi panjang antara dua kedatangan bus berturut-turut. 15
Jadi mungkin, kita harus menghitung nilai yang diharapkan dari panjang maksimum antara dua kedatangan bus berturut-turut, apakah ini solusi yang benar?
Ya bisa saja, tetapi : "paradoks" tertentu berjalan seiring dengan asumsi stokastik tertentu: bahwa kedatangan bus dimodelkan dengan proses benchmark Poisson, yang berarti bahwa sebagai konsekuensinya kita menganggap bahwa jangka waktu antara setiap dua kedatangan bus berturut-turut mengikuti distribusi eksponensial. Nyatakan panjang itu, dan kami memilikinyaℓ
Tentu saja ini perkiraan, karena distribusi Eksponensial memiliki dukungan tak terbatas dari kanan, yang berarti bahwa dengan tegas "semua waktu tunggu yang memungkinkan" termasuk, di bawah asumsi pemodelan ini, besarnya yang lebih besar dan besar hingga dan "termasuk" tak terhingga, tetapi dengan probabilitas menghilang .
Tapi tunggu, Eksponensial itu tanpa ingatan : tidak masalah pada titik kapan kita akan tiba, kita menghadapi variabel acak yang sama , terlepas dari apa yang telah terjadi sebelumnya.
Dengan asumsi stokastik / distribusi ini, setiap titik waktu adalah bagian dari "interval antara dua kedatangan bus berturut-turut" yang panjangnya dijelaskan oleh distribusi probabilitas yang sama dengan nilai yang diharapkan (bukan nilai maksimum) : "Saya di sini, saya dikelilingi oleh interval antara dua kedatangan bus.Beberapa panjangnya terletak di masa lalu dan beberapa di masa depan tetapi saya tidak memiliki cara untuk mengetahui berapa banyak dan berapa banyak, jadi yang terbaik yang bisa saya lakukan adalah bertanya Berapa panjang yang diharapkan - mana yang akan menjadi waktu tunggu rata-rata saya? " - Dan jawabannya selalu " 15 ", sayangnya.15 15
sumber
Jika bus tiba "setiap 15 menit" (yaitu sesuai jadwal) maka rata-rata penumpang yang menunggu secara acak memang hanya 7,5 menit, karena akan terdistribusi secara seragam di celah 15 menit itu.
-
Sebaliknya, jika bus tiba secara acak dengan laju rata-rata 4 per jam (yaitu menurut proses Poisson), maka rata-rata penantian jauh lebih lama; memang Anda bisa mengatasinya melalui kurangnya properti memori. Ambil kedatangan penumpang sebagai permulaan, dan waktu ke acara berikutnya eksponensial dengan rata-rata 15 menit.
Biarkan saya mengambil analogi waktu diskrit. Bayangkan saya menggulirkan dadu dengan 15 wajah, yang salah satunya diberi label "B" (untuk bus) dan 14 berlabel "X" untuk total ketidakhadiran bus pada menit itu ( dadu berdampingan 30 sisi ada, sehingga saya dapat memberi label 2 dari wajah dadu bersisi 30 "B"). Jadi sekali per menit saya berguling dan melihat apakah bus itu datang. Mati tidak memiliki ingatan; tidak tahu berapa banyak gulungan sejak "B" terakhir. Sekarang bayangkan suatu peristiwa yang tidak berhubungan terjadi - seekor anjing menggonggong, seorang penumpang tiba, saya mendengar gemuruh guntur. Mulai sekarang, berapa lama saya menunggu (berapa banyak gulungan) sampai "B" selanjutnya?
Karena kurangnya memori, secara rata-rata, saya menunggu waktu yang sama untuk "B" berikutnya sebagai waktu antara dua "B" berturut-turut.
[Selanjutnya bayangkan saya memiliki dadu 60 sisi yang saya gulung setiap lima belas detik (sekali lagi, dengan satu wajah "B"); sekarang bayangkan saya memiliki dadu 1000 sisi yang saya gulirkan setiap 0,9 detik (dengan satu wajah "B"; atau lebih realistis, masing-masing tiga dadu 10 sisi dan saya sebut hasilnya sebagai "B" jika semua 3 muncul "10" pada waktu yang sama) ... dan seterusnya. Dalam batasnya, kita mendapatkan proses Poisson waktu kontinu.]
Sebagai penangkap bus yang veteran, dalam praktiknya realitas tampaknya terletak di antara 'bus tiba sesuai jadwal' dan 'bus tiba secara acak'. Dan kadang-kadang (dalam lalu lintas yang buruk), Anda menunggu satu jam kemudian 3 tiba sekaligus (Zach mengidentifikasi alasan untuk itu dalam komentar di bawah).
sumber
Lebih lanjut tentang bus ... Maaf untuk terlibat dalam pembicaraan yang sangat terlambat dalam diskusi, tetapi saya telah melihat proses Poisson akhir-akhir ini ... Jadi sebelum keluar dari pikiran saya, berikut ini adalah representasi bergambar dari paradoks inspeksi :
Jika kami berada di pusat pengiriman, dan dapat melihat semua bus di layar, memang benar bahwa mengambil beberapa bus secara acak, dan rata-rata jarak ke bus yang mengikuti di belakang, akan menghasilkan waktu antar kedatangan rata-rata:
Tetapi, jika apa yang kita lakukan hanya muncul di stasiun bus (alih-alih memilih bus), kita melakukan penampang waktu acak, katakanlah, sepanjang garis waktu jadwal bus di pagi hari yang khas. Waktu yang kami putuskan untuk muncul di stasiun bus mungkin sangat merata di sepanjang "panah" waktu. Namun, karena ada jeda waktu yang lebih lama antara bus-bus yang tersebar lebih jauh, kami lebih cenderung berakhir berlebihan dengan "para pejalan kaki" ini:
... dan karenanya, buku catatan waktu tunggu kami tidak akan mencerminkan waktu antar kedatangan. Ini adalah paradoks inspeksi.
Masih belum jelas? - coba dengan Lego .
sumber
Ada penjelasan sederhana yang menyelesaikan jawaban berbeda yang didapat seseorang dari penghitungan waktu tunggu yang diharapkan untuk bus yang tiba per Proses Poisson dengan waktu antar rata-rata yang diberikan (dalam hal ini 15 menit), oleh karena itu waktu antar-waktu menjadi eksponensial dengan rata-rata 15 menit .
Metode 1 ) Karena Proses Poisson (eksponensial) tidak memiliki memori, waktu tunggu yang diharapkan adalah 15 menit.
Metode 2 ) Anda kemungkinan besar akan tiba kapan saja selama periode antar kedatangan. Oleh karena itu waktu tunggu yang diharapkan adalah 1/2 dari panjang yang diharapkan dari periode antar-waktu ini. INI BENAR, dan tidak bertentangan dengan metode (1).
Bagaimana (1) dan (2) keduanya benar? Jawabannya adalah bahwa panjang waktu yang diharapkan dari periode antar untuk waktu di mana Anda tiba bukanlah 15 menit. Ini sebenarnya 30 menit; dan 1/2 dari 30 menit adalah 15 menit, jadi (1) dan (2) setuju.
Mengapa periode antar kedatangan untuk waktu di mana Anda tiba tidak sama dengan 15 menit? Itu karena dengan "memperbaiki" waktu kedatangan pertama kali, periode interarrival yang ada di dalamnya lebih cenderung daripada periode rata-rata yang lama. Dalam kasus periode interarrival eksponensial, matematika bekerja dengan baik sehingga periode interarrival yang berisi waktu di mana Anda tiba adalah eksponensial dengan dua kali lipat waktu interarrival rata-rata untuk Proses Poisson.
Tidak jelas bahwa distribusi yang tepat untuk waktu antar kedatangan yang berisi waktu Anda tiba akan menjadi eksponensial dengan rangkap dua, tetapi jelas, setelah penjelasan, mengapa itu meningkat. Sebagai contoh yang mudah dimengerti, katakanlah bahwa waktu antar 10 menit dengan probabilitas 1/2 atau 20 menit dengan probabilitas 1/2. Dalam hal ini, periode antar-panjang 20 menit sama-sama cenderung terjadi sebagai periode antar-panjang 10 menit, tetapi ketika itu terjadi, mereka berlangsung dua kali lebih lama. Jadi, 2/3 dari poin waktu di siang hari akan berada pada waktu di mana periode antar-waktu adalah 20 menit. Dengan kata lain, jika kita pertama-tama memilih waktu dan kemudian ingin tahu apa waktu antar waktu yang berisi waktu itu, maka (mengabaikan efek sementara pada awal "hari" ) panjang yang diharapkan dari waktu interarrival adalah 16 1/3. Tetapi jika kita pertama kali memilih waktu antar dan ingin tahu berapa panjang yang diharapkan, itu adalah 15 menit.
Ada varian lain dari paradoks pembaruan, pengambilan sampel dengan panjang bias, dll, yang jumlahnya hampir sama.
Contoh 1) Anda memiliki banyak bola lampu, dengan masa hidup acak, tetapi rata-rata 1000 jam. Ketika bola lampu gagal, itu segera diganti oleh bola lampu lain. Jika Anda memilih waktu untuk pergi di ruangan yang memiliki bohlam, bohlam yang sedang beroperasi akan berakhir dengan masa pakai rata-rata yang lebih lama dari 1000 jam.
Contoh 2) Jika kita pergi ke lokasi konstruksi pada waktu tertentu, maka waktu rata-rata sampai seorang pekerja konstruksi yang bekerja di sana pada saat itu jatuh dari gedung (dari saat pertama kali mulai bekerja) lebih besar daripada waktu rata-rata hingga pekerja jatuh (dari saat pertama kali mulai bekerja) di antara semua pekerja yang mulai bekerja. Mengapa, karena pekerja dengan waktu rata-rata pendek hingga jatuh lebih besar kemungkinannya untuk jatuh (dan tidak melanjutkan pekerjaan) daripada rata-rata, sehingga pekerja yang bekerja kemudian memiliki waktu lebih lama dari rata-rata hingga jatuh.
Contoh 3) Pilih sejumlah kecil orang secara acak di sebuah kota dan jika mereka telah menghadiri pertandingan kandang (tidak semua terjual habis) dari tim baseball Liga Utama kota, cari tahu berapa banyak orang yang menghadiri pertandingan yang mereka ikuti. Kemudian (di bawah beberapa asumsi yang diidealkan tetapi tidak terlalu tidak masuk akal), rata-rata kehadiran untuk pertandingan tersebut akan lebih tinggi dari rata-rata kehadiran untuk semua pertandingan kandang tim. Mengapa? Karena ada lebih banyak orang yang telah menghadiri game dengan kehadiran tinggi daripada game dengan kehadiran rendah, jadi Anda lebih cenderung memilih orang yang menghadiri permainan dengan kehadiran tinggi daripada game dengan kehadiran rendah.
sumber
Pertanyaan yang diajukan adalah "... sebuah bus tiba di halte setiap 15 menit dan seorang penumpang tiba secara acak." Jika bus tiba setiap 15 menit maka itu tidak acak; itu tiba setiap 15 menit sehingga jawaban yang benar adalah 7,5 menit. Entah sumbernya dikutip secara salah atau penulis sumbernya ceroboh.
Di sisi lain, detektor radiasi terdengar seperti masalah yang berbeda karena peristiwa radiasi tiba-tiba menurut beberapa distribusi, mungkin sesuatu seperti Poisson dengan waktu tunggu rata-rata.
sumber