Orang sering mengatakan beberapa peristiwa memiliki peluang 50-60% untuk terjadi. Kadang-kadang saya bahkan akan melihat orang memberikan bar kesalahan eksplisit tentang penetapan probabilitas. Apakah pernyataan-pernyataan ini memiliki makna atau apakah itu hanya kekhasan linguistik ketidaknyamanan memilih nomor tertentu untuk sesuatu yang secara inheren tidak dapat diketahui?
probability
error
mahnamahna
sumber
sumber
Jawaban:
Tidak masuk akal jika Anda berbicara tentang probabilitas yang diketahui , misalnya dengan koin yang adil kemungkinan melempar kepala adalah 0,5 menurut definisi. Namun, kecuali jika Anda berbicara tentang contoh buku teks, probabilitas pastinya tidak pernah diketahui, kami hanya mengetahuinya.
Cerita yang berbeda adalah ketika Anda memperkirakan probabilitas dari data, misalnya Anda mengamati 13 tiket yang menang di antara 1.253 tiket yang Anda beli, jadi dari data ini Anda memperkirakan probabilitas menjadi 13/12563. Ini adalah sesuatu yang Anda perkirakan dari sampel, sehingga tidak pasti, karena dengan sampel yang berbeda Anda dapat mengamati nilai yang berbeda. Estimasi ketidakpastian bukan tentang probabilitas, tetapi sekitar estimasi itu.
Contoh lain adalah ketika probabilitas tidak diperbaiki, tetapi tergantung pada faktor-faktor lain. Katakanlah kita berbicara tentang kemungkinan kematian dalam kecelakaan mobil. Kita dapat mempertimbangkan probabilitas "global", nilai tunggal yang terpinggirkan atas semua faktor yang secara langsung dan tidak langsung menyebabkan kecelakaan mobil. Di sisi lain, Anda dapat mempertimbangkan bagaimana probabilitas bervariasi di antara populasi mengingat faktor risiko.
Anda dapat menemukan lebih banyak contoh di mana probabilitas itu sendiri dianggap sebagai variabel acak , sehingga mereka lebih bervariasi daripada diperbaiki.
sumber
Ilustrasi paling relevan dari xkcd :
dengan takarir terkait:
sumber
Apakah Kita Membutuhkan Kemungkinan Tingkat Tinggi dan, Jika Ya, Apa Maksudnya? Mutiara Judea. UAI 1987. https://arxiv.org/abs/1304.2716
sumber
Semua pengukuran tidak pasti.
Karena itu, setiap pengukuran probabilitas juga tidak pasti.
Ketidakpastian pada pengukuran probabilitas ini dapat diwakili secara visual dengan bar ketidakpastian. Perhatikan bahwa bilah ketidakpastian sering disebut sebagai bilah galat. Ini tidak benar atau setidaknya menyesatkan, karena menunjukkan ketidakpastian dan bukan kesalahan (kesalahan adalah perbedaan antara pengukuran dan kebenaran yang tidak diketahui, sehingga kesalahan tidak diketahui; ketidakpastian adalah ukuran lebar kepadatan probabilitas setelah mengambil pengukuran).
sumber
Dengan demikian, menambahkan bar kesalahan ke probabilitas sama dengan menambahkan ketidakpastian ke parameter gangguan, yang dapat memodifikasi probabilitas, tetapi tidak dapat membuatnya tidak pasti.
sumber
Sangat sering ada kesempatan di mana Anda ingin memiliki probabilitas probabilitas. Katakanlah misalnya Anda bekerja di bidang keamanan makanan dan menggunakan model analisis survival untuk memperkirakan probabilitas bahwa spora botulinum akan berkecambah (dan dengan demikian menghasilkan toksin yang mematikan) sebagai fungsi dari langkah persiapan makanan (yaitu memasak) dan waktu / suhu inkubasi (cf kertas). Produsen makanan kemudian mungkin ingin menggunakan model itu untuk menetapkan tanggal "digunakan-oleh" yang aman sehingga risiko konsumen untuk botulisme kecil. Namun, model ini cocok untuk sampel pelatihan yang terbatas, jadi daripada memilih tanggal penggunaan-di mana kemungkinan perkecambahannya kurang dari, katakanlah 0,001, Anda mungkin ingin memilih tanggal yang lebih awal untuk yang mana (mengingat asumsi pemodelan) Anda bisa yakin 95% kemungkinan perkecambahan kurang dari 0,001. Ini sepertinya hal yang wajar dilakukan di lingkungan Bayesian.
sumber
tl; dr - Tebakan satu kali saja dari tebakan tertentu dapat dikurangi menjadi satu probabilitas. Namun, itu hanya kasus sepele; struktur probabilitas dapat masuk akal setiap kali ada relevansi kontekstual di luar hanya satu probabilitas.
Peluang pendaratan koin acak di Kepala adalah 50%.
Tidak masalah apakah itu koin yang adil atau tidak; Setidaknya tidak untuk saya. Karena sementara koin mungkin memiliki bias yang dapat digunakan oleh pengamat yang berpengetahuan luas untuk membuat prediksi lebih banyak informasi, saya harus menebak peluang 50%.
Jika kita mengasumsikan sebuah model di mana koin memiliki probabilitas Head yang konstan, maka mungkin lebih tepat untuk mengatakan Dari ini , seseorang mungkin berpikirPHeads, HeadsPHeadsTails1−PHeads. SecondflipFirst flipHeadsTailsHeadsP2HeadsPHeads(1−PHeads)TailsPHeads(1−PHeads)(1−PHeads)2,
dari mana mereka dapat menyimpulkan
Same sidetwice1−2PHeads(1−PHeads)Headsand Tails2PHeads(1−PHeads).
Jika saya harus menebak maka saya akan tetap menggunakan jadi sepertinya ini akan mengurangi ke tabel sebelumnya.PHeads, 50%,
Jadi itu hal yang sama, bukan?
Ternyata peluang mendapatkan dua Kepala atau Ekor selalu lebih besar daripada masing-masing, kecuali dalam kasus khusus dari koin yang sangat adil. Jadi, jika Anda mengurangi tabel, dengan asumsi bahwa probabilitas itu sendiri menangkap ketidakpastian, prediksi Anda akan tidak masuk akal ketika diperpanjang.
Yang mengatakan, tidak ada flip koin " benar ". Kami dapat memiliki segala macam metodologi flipping berbeda yang dapat menghasilkan hasil yang sangat berbeda dan bias yang jelas. Jadi, gagasan bahwa ada nilai yang konsisten dari juga akan cenderung mengarah pada kesalahan ketika kita membangun argumen berdasarkan premis itu.PHeads
Jadi, jika seseorang bertanya kepada saya kemungkinan koin terbalik, saya tidak akan mengatakan meskipun itu merupakan tebakan terbaik saya. Sebaliknya, saya mungkin akan mengatakan`‘‘50%", ‘‘probably about 50%".
Dan apa yang ingin saya katakan kira-kira:
Jika Anda duduk bersama mereka dan mengerjakan semua data, model, dll., Anda mungkin dapat menghasilkan angka yang lebih baik, atau, idealnya, model yang lebih baik yang akan lebih kuat menangkap kemampuan prediksi mereka.
Tetapi jika Anda membagi perbedaan dan sebut saja 55%, itu akan seperti mengasumsikan di mana Anda pada dasarnya akan berjalan dengan perkiraan cepat setelah terpotong aspek tingkat tinggi itu. Bukan berarti taktik yang buruk untuk perkiraan cepat satu kali saja, tetapi itu kehilangan sesuatu.PHeads=50%
sumber
Saya berpendapat bahwa hanya error bar yang penting, tetapi dalam contoh yang diberikan, semuanya mungkin hampir tidak berarti.
Contoh cocok untuk interpretasi sebagai interval kepercayaan, di mana batas atas dan bawah dari beberapa derajat kepastian adalah rentang probabilitas. Jawaban yang diajukan ini akan membahas interpretasi itu. Sumber mayoritas - https://www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U
Contoh mengatakan bahwa untuk tingkat kepercayaan tertentu, jawabannya tidak mungkin di atas 60% dan sama-sama tidak mungkin di bawah 50%. Ini sangat nyaman satu set angka yang menyerupai "binning", di mana barang curian dari 55% selanjutnya ditingkatkan ke kisaran +/- 5%. Nomor bulat akrab segera dicurigai.
Salah satu cara untuk sampai pada interval kepercayaan adalah dengan memutuskan tingkat kepercayaan yang dipilih - katakanlah 90% - dan kami mengizinkan hal itu bisa lebih rendah atau lebih tinggi dari perkiraan kami, tetapi hanya ada peluang 10% jawaban "benar" terletak di luar interval kami. Jadi kami memperkirakan batas yang lebih tinggi sehingga "hanya ada peluang 1/20 dari jawaban yang tepat lebih besar dari batas atas ini", dan melakukan hal yang sama untuk batas bawah. Ini dapat dilakukan melalui "estimasi yang dikalibrasi", yang merupakan satu bentuk pengukuran, atau melalui bentuk pengukuran lainnya.
Apapun, intinya adalah untuk A) mengakui dari awal bahwa ada ketidakpastian terkait dengan ketidakpastian kita, dan B) menghindari mengangkat tangan kita pada hal itu, menyebutnya berantakan, dan hanya menempel pada 5% di atas dan di bawah. Keuntungannya adalah bahwa pendekatan yang ketat untuk tingkat yang dipilih dapat menghasilkan hasil yang masih relevan secara matematis, ke tingkat yang dapat dinyatakan secara matematis: "Ada kemungkinan 90% bahwa jawaban yang benar terletak di antara dua batas ini ..." Ini adalah interval kepercayaan yang dibentuk dengan benar (CI), dan dapat digunakan dalam perhitungan lebih lanjut.
Terlebih lagi, dengan menganggapnya sebagai kepercayaan, kami dapat mengkalibrasi metode yang digunakan untuk sampai pada estimasi, dengan membandingkan prediksi vs hasil dan bertindak berdasarkan apa yang kami temukan untuk meningkatkan metode estimasi. Tidak ada yang dapat dibuat sempurna, tetapi banyak hal dapat dibuat 90% efektif.
Perhatikan bahwa 90% CI tidak ada hubungannya dengan fakta bahwa contoh yang diberikan dalam OP berisi 10% dari lapangan dan menghilangkan 90%.
Berapa lebar sayap Boeing 747-100, hingga 90% CI? Yah, saya 95% yakin bahwa itu tidak lebih dari 300 kaki, dan saya sama-sama yakin bahwa itu tidak kurang dari 200 kaki. Jadi dari atas kepala saya, saya akan memberi Anda 90% CI dari 200 -235 kaki.
Perhatikan bahwa tidak ada perkiraan "pusat". CI tidak dibentuk oleh tebakan ditambah faktor fudge. Inilah sebabnya saya mengatakan bahwa bar kesalahan mungkin lebih penting dari perkiraan yang diberikan.
Yang mengatakan, perkiraan interval (semuanya di atas) belum tentu lebih baik dari perkiraan titik dengan kesalahan yang dihitung dengan benar (yang berada di luar ingatan saya pada saat ini - saya hanya ingat bahwa itu sering dilakukan secara tidak benar). Saya hanya mengatakan bahwa banyak perkiraan dinyatakan sebagai rentang - dan saya akan membahayakan sebagian besar rentang dengan angka bulat - adalah titik + fudge daripada perkiraan interval atau titik + kesalahan.
Satu penggunaan point + error yang tepat:
Poin kunci: dalam contoh ini, baik mean dan kesalahan ditentukan / diasumsikan, daripada diperkirakan / diukur.
sumber