114

Ini awalnya muncul sehubungan dengan beberapa pekerjaan yang kami lakukan pada model untuk mengklasifikasikan teks alami, tapi saya sudah menyederhanakannya ... Mungkin terlalu banyak.

Anda memiliki mobil biru (berdasarkan ukuran ilmiah obyektif - biru).

Anda menunjukkannya kepada 1000 orang.

900 mengatakan itu biru. 100 tidak.

Anda memberikan informasi ini kepada seseorang yang tidak dapat melihat mobil. Yang mereka tahu adalah 900 orang mengatakan itu biru, dan 100 orang tidak. Anda tidak tahu lebih banyak tentang orang-orang ini (1000).

Berdasarkan hal ini, Anda bertanya kepada orang itu, "Berapa probabilitas mobil itu berwarna biru?"

Ini telah menyebabkan perbedaan pendapat yang sangat besar di antara mereka yang saya tanyakan! Apa jawaban yang benar, jika ada?

probability Pat Molloy
sumber

162

Saya ingin tahu apa jawabannya jika Anda mengganti mobil menjadi pakaian .

user1717828

13

Jadi apa pertanyaannya bagi orang-orang? "Apakah mobil itu biru?" atau "Apa warna mobilnya?"

kon psych

13

Apa artinya mobil menjadi biru? Jika beberapa orang mengatakan mobil itu tidak biru, maka kemungkinan itu adalah warna yang beberapa orang sebut biru dan yang lain memanggil dengan nama yang berbeda. Ini tidak berarti mereka tidak setuju pada warna itu berarti mereka tidak setuju pada nama warna.

Ben

7

Saya pikir pertanyaannya akan banyak diperbaiki jika Anda memberikan pendapat berbeda yang Anda temui. Seperti yang ada sekarang, jawaban dapat menjelajahi seluruh bidang, dari teori probabilitas ke teori warna atau bahkan biologi (buta warna) secara liar, dan saya tidak melihat bagaimana itu akan sangat membantu Anda.

AnoE

32

Ada sesuatu yang hilang dalam deskripsi masalah. 100 orang menyangkal bahwa mobil itu biru ketika itu pasti biru banyak orang, Anda tidak bisa begitu saja membuangnya sebagai kesalahan acak.

Aksakal

117

TL; DR: Kecuali jika Anda menganggap orang terlalu buruk dalam menilai warna mobil, atau bahwa mobil biru jarang sekali terjadi, jumlah besar orang dalam contoh Anda berarti kemungkinan bahwa mobil berwarna biru pada dasarnya adalah 100%.

Matthew Drury sudah memberikan jawaban yang benar tetapi saya hanya ingin menambahkannya dengan beberapa contoh numerik, karena Anda memilih angka-angka Anda sehingga Anda benar-benar mendapatkan jawaban yang sangat mirip untuk berbagai pengaturan parameter yang berbeda. Misalnya, mari kita asumsikan, seperti yang Anda katakan di salah satu komentar Anda, bahwa probabilitas orang menilai warna mobil dengan benar adalah 0,9. Yaitu: dan juga

p (say it's blue | car is blue) = 0.9 = 1 - p (say it isn't blue | car is blue)

$p(\text{say it's blue}|\text{car is blue})=0.9=1-p(\text{say it isn't blue}|\text{car is blue})$

p (say it isn't blue | car isn't blue) = 0.9 = 1 - p (say it is blue | car isn't blue)

$p(\text{say it isn't blue}|\text{car isn't blue})=0.9=1-p(\text{say it is blue}|\text{car isn't blue})$

Setelah menetapkan itu, hal yang tersisa yang harus kita putuskan adalah: berapa probabilitas sebelumnya bahwa mobil itu berwarna biru? Mari kita pilih probabilitas yang sangat rendah hanya untuk melihat apa yang terjadi, dan katakan bahwa , yaitu hanya 0,1% dari semua mobil berwarna biru. Maka probabilitas posterior bahwa mobil itu berwarna biru dapat dihitung sebagai: $p(\text{car is blue})=0.001$

\begin{aligned} p (car is blue | answers) \\ = \frac{p (answers | car is blue) p (car is blue)}{p (answers | car is blue) p (car is blue) + p (answers | car isn't blue) p (car isn't blue)} \\ = \frac{{0.9}^{900} \times {0.1}^{100} \times 0.001}{{0.9}^{900} \times {0.1}^{100} \times 0.001 + {0.1}^{900} \times {0.9}^{100} \times 0.999} \end{aligned}

$\begin{align*} &p(\text{car is blue}|\text{answers})\\ &=\frac{p(\text{answers}|\text{car is blue})\,p(\text{car is blue})}{p(\text{answers}|\text{car is blue})\,p(\text{car is blue})+p(\text{answers}|\text{car isn't blue})\,p(\text{car isn't blue})}\\ &=\frac{0.9^{900}\times 0.1^{100}\times0.001}{0.9^{900}\times 0.1^{100}\times0.001+0.1^{900}\times0.9^{100}\times0.999} \end{align*}$

Jika Anda melihat penyebutnya, cukup jelas bahwa istilah kedua dalam jumlah tersebut akan diabaikan, karena ukuran relatif dari istilah dalam jumlah tersebut didominasi oleh rasio hingga , yang berada di urutan . Dan memang, jika Anda melakukan perhitungan ini di komputer (berhati-hati untuk menghindari masalah aliran bawah angka) Anda mendapatkan jawaban yang sama dengan 1 (dalam presisi mesin). $0.9^{900}$ $0.1^{900}$ $10^{58}$

Alasan probabilitas sebelumnya tidak terlalu penting di sini adalah karena Anda memiliki begitu banyak bukti untuk satu kemungkinan (mobil berwarna biru) versus yang lain. Ini dapat dikuantifikasi dengan rasio kemungkinan , yang dapat kita hitung sebagai:

\frac{hal (jawaban | mobil berwarna biru)}{hal (jawaban | mobil tidak biru)} = \frac{{0,9}^{900} \times {0,1}^{100}}{{0,1}^{900} \times {0,9}^{100}} \approx 10^{763}

$\frac{p(\text{answers}|\text{car is blue})}{p(\text{answers}|\text{car isn't blue})}=\frac{0.9^{900}\times 0.1^{100}}{0.1^{900}\times 0.9^{100}}\approx 10^{763}$

Jadi bahkan sebelum mempertimbangkan probabilitas sebelumnya, bukti menunjukkan bahwa satu opsi sudah secara astronomis lebih mungkin daripada yang lain, dan untuk sebelum membuat perbedaan, mobil biru harus tidak masuk akal, sangat jarang (jarang sekali kita berharap untuk temukan 0 mobil biru di bumi).

Jadi bagaimana jika kita mengubah seberapa akurat orang dalam deskripsi warna mobil mereka? Tentu saja, kita bisa mendorong ini ke ekstrem dan mengatakan mereka melakukannya dengan benar hanya 50% dari waktu, yang tidak lebih baik daripada membalik koin. Dalam hal ini, probabilitas posterior bahwa mobil itu biru sama dengan probabilitas sebelumnya, karena jawaban orang-orang tidak memberi tahu kami apa-apa. Tapi tentu saja orang melakukan setidaknya sedikit lebih baik dari itu, dan bahkan jika kita mengatakan bahwa orang hanya akurat 51% dari waktu, rasio kemungkinan masih bekerja sehingga kira-kira kali lebih mungkin untuk mobil menjadi biru . $10^{13}$

Ini semua adalah hasil dari angka yang agak besar yang Anda pilih dalam contoh Anda. Jika 9/10 orang mengatakan mobil itu berwarna biru, itu akan menjadi cerita yang sangat berbeda, meskipun rasio orang yang sama berada di satu kamp vs yang lain. Karena bukti statistik tidak tergantung pada rasio ini, tetapi lebih pada perbedaan numerik antara faksi yang berlawanan. Faktanya, dalam rasio kemungkinan (yang mengkuantifikasi bukti), 100 orang yang mengatakan mobil itu tidak biru membatalkan 100 dari 900 orang yang mengatakan itu biru, jadi itu sama seperti jika Anda memiliki 800 orang yang semuanya setuju warnanya biru. Dan itu jelas bukti yang cukup jelas.

(Sunting: Seperti yang ditunjukkan oleh Silverfish , asumsi yang saya buat di sini sebenarnya menyiratkan bahwa setiap kali seseorang menggambarkan mobil yang tidak biru, mereka akan default untuk mengatakan itu biru. Ini tentu saja tidak realistis, karena mereka dapat benar-benar mengatakan warna apa pun) , dan akan mengatakan biru hanya sebagian waktu saja. Hal ini tidak membuat perbedaan pada kesimpulannya, karena semakin kecil kemungkinan orang untuk mengira mobil yang tidak biru sama dengan mobil yang biru, semakin kuat bukti bahwa mobil itu biru ketika mereka mengatakannya. Jadi, jika ada, angka yang diberikan di atas sebenarnya hanya batas bawah pada bukti biru.)

Ruben van Bergen
sumber

11

+1. Bahkan, mengingat data OP, estimasi MLE tentang seberapa sering orang akurat adalah 900/1000 = 90%.

amoeba

5

Memperbaiki warna mobil 50% tidak sama dengan membalik koin. Bagaimanapun, ada lebih dari dua warna yang tersedia. Juga, mungkin ada yang mengatakan "biru" atau "biru" dan bukannya "biru"? Sebenarnya, banyak orang akan salah mengatakan "biru" ketika jawaban yang benar adalah "warna dipatenkan yang modis dan modis yang hampir terlihat seperti biru"

Hagen von Eitzen

10

Saya tahu ini hanya angka ilustrasi, tetapi jika "probabilitas bahwa orang menilai warna mobil dengan benar adalah 0,9" maka, kecuali ada sesuatu yang istimewa tentang warna biru, saya tidak berpikir masuk akal untuk mengklaim p (katakanlah biru | mobil bukan biru) = 0,1. Jika kita berpikir bahwa 90% dari waktu, orang mengidentifikasi warna yang benar, maka p (katakanlah merah | mobil adalah merah) = p (katakanlah putih | mobil adalah putih) = p (katakanlah hijau | mobil adalah hijau) = 0,9 dan seterusnya aktif untuk semua warna mobil yang mungkin. Tetapi mengapa p (katakanlah biru | mobil adalah merah) = p (katakanlah biru | mobil itu putih) = p (katakanlah biru | mobil itu hijau) = 0,1? Ini akan menyiratkan misalnya p (katakan putih | mobil merah) = 0.

Silverfish

2

@PatMolloy: Tidak harus. Itu tergantung pada apakah probabilitasnya simetris: apakah ada kemungkinan seseorang salah mengira biru untuk mobil yang tidak biru, karena ada yang salah mengira bukan biru untuk mobil biru? Jika demikian, maka putusan 500/500 memberikan informasi persis seperti lemparan koin. Tetapi jika orang cenderung mengatakan mobil non-biru adalah biru, daripada mereka mengatakan bahwa mobil biru tidak biru, maka 500 blue-sayers lebih sulit untuk dijelaskan daripada 500 bukan blue-sayers, di bawah hipotesis tidak biru. Jadi dalam hal ini keseimbangan bukti akan miring ke biru.

Ruben van Bergen

3

Persepsi warna adalah hal yang rumit .. jika sembilan dari sepuluh orang mengatakan gaun itu berwarna putih dan emas, berapa probabilitasnya biru dan hitam?

Glen_b

73

Jawaban yang benar tergantung pada informasi yang tidak ditentukan dalam masalah, Anda harus membuat beberapa asumsi lagi untuk mendapatkan jawaban tunggal yang pasti:

Kemungkinan sebelumnya mobil itu biru, yaitu keyakinan Anda bahwa mobil itu biru mengingat Anda belum bertanya kepada siapa pun.
Probabilitas seseorang memberitahu Anda mobil berwarna biru ketika itu benar-benar adalah biru, dan probabilitas mereka memberitahu Anda mobil berwarna biru padahal sebenarnya tidak biru.
Probabilitas bahwa mobil itu sebenarnya biru ketika seseorang mengatakan itu, dan probabilitas bahwa mobil itu tidak biru, ketika seseorang mengatakan itu biru.

Dengan informasi ini, kita dapat memecah semuanya dengan formula Bayes untuk memperoleh kemungkinan posterior bahwa mobil itu berwarna biru. Saya akan fokus pada kasus di mana kami hanya meminta satu orang, tetapi alasan yang sama dapat diterapkan pada kasus di mana Anda bertanya kepada orang. $1000$

\begin{aligned} P_{p o s t} (car is blue) & = P (car is blue ∣ say is blue) P (say is blue) \\ + P (car is blue ∣ say is not blue) P (say is not blue) \end{aligned}

$\begin{align*} P_{post} (\text{car is blue}) &= P(\text{car is blue} \mid \text{say is blue}) P(\text{say is blue}) \\ & \ \ \ \ + P(\text{car is blue} \mid \text{say is not blue}) P(\text{say is not blue}) \end{align*}$

Kita harus terus melanjutkan memecah , ini adalah di mana sebelumnya datang: $P(\text{say is blue})$

\begin{aligned} P (katakanlah biru) = & P (katakanlah biru ∣ mobil berwarna biru) P_{hal r saya Hai r} (mobil berwarna biru) \\ + P (katakanlah biru ∣ mobil tidak berwarna biru) P_{hal r saya Hai r} (mobil tidak berwarna biru) \end{aligned}

$\begin{align*} P(\text{say is blue}) = \ &P(\text{say is blue} \mid \text{car is blue}) P_{prior}(\text{car is blue}) \\ &+ P(\text{say is blue} \mid \text{car is not blue}) P_{prior}(\text{car is not blue}) \end{align*}$

Jadi dua aplikasi aturan Bayes membuat Anda di sana. Anda harus menentukan parameter yang tidak ditentukan berdasarkan informasi yang Anda miliki tentang situasi spesifik, atau dengan membuat beberapa asumsi yang masuk akal.

Ada beberapa kombinasi lain dari asumsi yang dapat Anda buat, berdasarkan:

P (katakanlah biru ∣ mobil berwarna biru) P (mobil berwarna biru) = P (mobil berwarna biru ∣ katakanlah biru) P (katakanlah biru)

$P(\text{say is blue} \mid \text{car is blue}) P(\text{car is blue}) = P(\text{car is blue} \mid \text{say is blue}) P(\text{say is blue})$

Pada awalnya, Anda tidak tahu hal-hal ini. Jadi, Anda harus membuat beberapa asumsi yang masuk akal tentang mereka bertiga, dan kemudian yang keempat ditentukan dari sana.

Matthew Drury
sumber

5

Itu sering terjadi. Kemudian Anda memiliki dua opsi, ungkapkan kekurangan total pengetahuan Anda dengan menganggap biru dan bukan biru sama-sama mungkin. Lakukan survei cepat di lapangan, sesuatu seperti ini dapat membantu: en.wikipedia.org/wiki/Car_colour_popularity

Matthew Drury

18

@Matthew masalah dengan "biru dan bukan biru sama-sama mungkin" adalah bahwa itu tidak konsisten; jika kami menerapkan alasan yang sama untuk masing-masing warna mobil yang mungkin, kami berakhir dengan klaim bahwa mereka semua secara bersamaan memiliki peluang 50% (tidak mungkin dengan lebih dari dua warna berdasarkan hukum probabilitas) dan peluang kurang dari 50% (ketika Anda lihat biru di "tidak putih" dan "tidak merah", yang juga mengarah pada kontradiksi karena probabilitas warna apa pun tidak dapat mengambil banyak nilai)

Glen_b

2

Ada lebih banyak informasi yang tidak ditentukan daripada ini karena jawaban masyarakat tidak perlu independen (pada kenyataannya, kami berharap mereka berkorelasi kuat dengan warna objektif, karenanya jauh dari independen). Bagaimana jika jawabannya "terlalu" tergantung? Katakanlah, kami hanya bertanya sepuluh pejalan kaki acak, tetapi masing-masing dari mereka menjawab 100 kali?

Hagen von Eitzen

2

P (Joe and Mary say blue | car is blue) = P (Joe says blue | car is blue) \cdot P (Mary says blue | car is blue)

$P(\text {Joe and Mary say blue} | \text {car is blue}) = P(\text {Joe says blue} | \text {car is blue}) \cdot P(\text {Mary says blue} | \text {car is blue})$

15

@Glen_b: Hanya ada dua warna di dunia, biru dan bukan biru. Diakuinya keduanya hadir dalam berbagai corak, terutama yang tidak biru.

psmears

13

Ada asumsi penting bahwa 1000 pendapat Anda tidak memiliki bias sistematis. Yang merupakan asumsi yang masuk akal di sini, tetapi bisa menjadi penting dalam kasus lain.

Contohnya mungkin:

mereka semua berbagi buta warna yang sama (genetika dalam suatu populasi misalnya),
mereka semua melihat mobil di malam hari di bawah penerangan jalan natrium oranye,
mereka semua berbagi budaya yang sama di mana biru itu tabu atau terkait secara magis (yang bias apakah mereka menggambarkan benda apa pun sebagai biru atau menggunakan eufemisme budaya atau apa pun sebagai gantinya),
mereka semua telah diberitahu (atau berbagi kepercayaan yang sama) bahwa jika mereka / tidak menjawab beberapa cara tertentu, sesuatu yang baik / buruk akan terjadi pada mereka .....

Tidak mungkin dalam kasus ini tetapi asumsi tersirat signifikan dalam kasus lain. Tidak harus ekstrem juga - memindahkan pertanyaan Anda ke domain lain dan ini akan menjadi faktor nyata.

Contoh untuk setiap jawaban Anda yang mungkin dipengaruhi oleh bias bersama:

tanyakan apakah gelas tipis yang tinggi menampung lebih dari gelas lemak pendek yang benar-benar identik, tetapi 1000 responden Anda adalah anak-anak yang sangat muda (salah persepsi).
tanya 1000 orang apakah berjalan di bawah tangga itu berbahaya (kepercayaan budaya umum)
tanyakan kepada 1000 orang yang menikah apakah mereka mencintai pasangan mereka / pernah berselingkuh, dalam situasi di mana mereka percaya pasangan mereka akan mengetahui jawaban mereka. Konteksnya mungkin acara TV, atau pasangan hadir ketika ditanya, dll. (Kepercayaan umum tentang konsekuensi)

Tidak akan sulit untuk membayangkan beberapa pertanyaan yang identik secara struktural di mana respons 900: 100 adalah ukuran keyakinan dan kejujuran, atau sesuatu yang lain, dan tidak menunjuk ke jawaban yang benar. Tidak mungkin dalam kasus ini tetapi dalam kasus lain - ya.

Stilez
sumber

11

Salah satu alasan Anda mendapatkan jawaban yang berbeda dari orang yang berbeda adalah bahwa pertanyaannya dapat ditafsirkan dengan cara yang berbeda, dan tidak jelas apa yang Anda maksud dengan "probabilitas" di sini. Salah satu cara untuk memahami pertanyaan ini adalah dengan menetapkan prior dan reason menggunakan aturan Bayes seperti dalam jawaban Matius.

Sebelum menanyakan probabilitas, Anda harus memutuskan apa yang dimodelkan sebagai acak dan apa yang tidak. Tidak diterima secara universal bahwa jumlah yang tidak diketahui tetapi jumlah tetap harus ditentukan terlebih dahulu. Berikut ini eksperimen serupa dengan percobaan Anda yang menyoroti masalah dengan pertanyaan:

$X_i$ $i = 1, \dots, 1000$ $p = 0.5$ $X_i$ $\sum_{i = 1}^{1000}X_i = 900$

$p$ $p$

ekvall
sumber

1

Jadi, jika Anda menghapus asumsi bahwa mobil itu biru, dan sisanya sama, 900 orang mengatakan biru dan 100 mengatakan tidak, dalam hal ini kemungkinannya adalah 0,9?

pengguna

Tidak, ini jauh lebih dekat dengan 1. Sangat, sangat tidak mungkin bahwa 900 dari 1000 orang akan mendapatkan warna yang salah.

gnasher729

1

the probability is either one or zero, depending on whether the car is actually blue or not.ini tidak sesuai dengan pemahaman tentang "probabilitas" seperti yang saya kenal. Kedengarannya agak seperti "X bisa terjadi atau tidak bisa terjadi, jadi probabilitasnya harus 50%". Bisakah Anda membuatnya sedikit lebih jelas apa yang Anda maksud dengan kalimat itu?

AnoE

2

@AnoE perbedaannya analog dengan perbedaan antara parameter dan variabel acak. Itu diberikan dalam pengaturan pertanyaan bahwa mobil itu memang biru, warnanya bukan hasil percobaan acak. Ini pada dasarnya adalah interpretasi v. Bayesian yang sering. Jika Anda membalik koin 1000 kali dan mengamati 900 kepala, lalu berapa probabilitas bahwa koin itu adil? Bisa satu atau nol jika Anda sering (atau tidak masuk akal); kami tidak menetapkan probabilitas ke parameter.

ekvall

@ pengguna Tidak, saya sudah memperbarui jawaban untuk memperjelas poin saya.

ekvall

7

Jawaban praktis sederhana:

Probabilitas dapat dengan mudah berkisar dari 0% hingga 100% tergantung pada asumsi Anda

Meskipun saya benar-benar menyukai jawaban yang ada, pada praktiknya pada dasarnya bermuara pada dua skenario sederhana ini:

Skenario 1: Orang diasumsikan sangat pandai mengenali warna biru ketika warna biru ... 0%

Dalam hal ini, ada begitu banyak orang yang menyatakan bahwa mobil itu tidak biru, sehingga sangat tidak mungkin mobil itu benar-benar biru. Oleh karena itu, probabilitasnya mendekati 0%.

Skenario 2: Orang diasumsikan sangat pandai mengenali tidak biru ketika bukan biru ... 100%

Dalam hal ini, ada begitu banyak orang yang menyatakan bahwa mobil itu berwarna biru, sehingga sangat mungkin memang berwarna biru. Karena itu probabilitasnya mendekati 100%.

Tentu saja dengan ini datang dari sudut matematika Anda akan mulai dengan sesuatu yang generik seperti 'mari kita asumsikan bahwa probabilitas yang relevan adalah ...', yang sangat tidak berarti karena hal-hal seperti itu biasanya tidak dikenal untuk keadaan acak. Karena itu saya menganjurkan melihat ekstrem untuk memahami gagasan bahwa kedua persentase dapat dengan mudah dibenarkan dengan asumsi sederhana dan realistis, dan karena itu tidak ada jawaban yang bermakna.

Dennis Jaheruddin
sumber

2

Jika "orang dianggap sangat pandai mengenali warna biru", mengapa mereka memperkirakan warna biru ketika tidak dalam skenario 1? Anda mungkin ingin mengekspresikan skenario Anda dalam hal positivies palsu dan negatif palsu.

hyde

@hyde Menulis ulang skenario untuk menghilangkan ambiguitas

Dennis Jaheruddin

Paradigma

5

Anda perlu mengembangkan beberapa kerangka estimasi. Beberapa pertanyaan yang mungkin Anda tanyakan adalah

Berapa banyak warna yang ada? Apakah kita berbicara dua warna? Atau semua warna pelangi?
Seberapa berbeda warnanya? Apakah kita berbicara biru dan oranye? Atau biru, cyan, dan pirus?
Apa artinya menjadi biru? Apakah cyan dan / atau pirus biru? Atau hanya biru itu sendiri?
Seberapa baik orang-orang ini dalam memperkirakan warna? Apakah mereka semua desainer grafis? Atau apakah mereka buta warna?

Dari sudut pandang statistik murni, kita dapat membuat beberapa tebakan sampai yang terakhir. Pertama, kita tahu bahwa setidaknya 10% orang memilih jawaban yang salah. Jika hanya ada dua warna (dari pertanyaan pertama), maka kita dapat mengatakan bahwa ada

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

Sebagai pemeriksaan cepat, jika kita menambahkannya bersama-sama, kita mendapat 100%. Anda dapat melihat notasi yang lebih matematis dari ini pada jawaban @MatthewDrury .

Bagaimana kita mendapatkan 90% di yang ketiga? Itu berapa banyak orang yang berkata biru tetapi salah jika tidak. Karena hanya ada dua warna, ini simetris. Jika ada lebih dari dua warna, maka kemungkinan pilihan yang salah menjadi biru ketika mereka mengatakan sesuatu yang lain akan lebih rendah.

Bagaimanapun, metode estimasi ini memberi kita 90% biru. Ini termasuk 81% kemungkinan orang mengatakan biru ketika itu dan 9% kemungkinan orang mengatakan itu bukan saat itu. Ini mungkin yang paling dekat dengan kita untuk menjawab pertanyaan awal, dan ini mengharuskan kita untuk mengandalkan data untuk memperkirakan dua hal yang berbeda. Dan untuk mengasumsikan bahwa kesempatan biru dipilih sama dengan peluang biru menjadi benar.

Jika ada lebih dari dua warna, maka logikanya akan berubah sedikit. Dua baris pertama tetap sama, tetapi kita kehilangan simetri pada dua baris terakhir. Dalam hal ini, kami membutuhkan lebih banyak input. Kita dapat memperkirakan kemungkinan mengatakan dengan benar biru sebagai 81% lagi, tetapi kita tidak tahu apa kemungkinannya bahwa warna itu biru ketika seseorang mengatakan bahwa itu tidak.

Kami juga dapat meningkatkan bahkan pada estimasi dua warna. Dengan jumlah mobil yang signifikan secara statistik dari masing-masing warna, kami dapat meminta sejumlah besar orang untuk melihat dan mengategorikannya. Lalu kita bisa menghitung seberapa sering orang benar ketika mereka membuat setiap pilihan warna dan seberapa sering mereka tepat untuk setiap pilihan warna. Kemudian kita dapat memperkirakan lebih akurat dengan memberikan pilihan aktual orang.

Anda mungkin bertanya bagaimana 90% bisa salah. Pertimbangkan apa yang terjadi jika ada tiga warna: biru, biru, dan safir. Seseorang mungkin secara wajar menganggap ketiganya sebagai warna biru. Tapi kami ingin lebih. Kami ingin warna yang tepat. Tapi siapa yang ingat nama-nama nuansa lainnya? Banyak yang mungkin menebak biru karena itu adalah satu-satunya warna yang cocok yang mereka tahu. Dan masih salah ketika ternyata menjadi biru.

Brythan
sumber

Seperti disebutkan dalam salah satu komentar sebelumnya, tentunya hanya dua warna yang relevan adalah 'biru' dan 'bukan biru' maka bagian tentang banyak warna tidak diperlukan.

Dennis Jaheruddin

4

Sebuah tepat, matematika, benar probabilitas / palsu tidak dapat dihitung dengan informasi yang Anda berikan.

Namun, dalam kehidupan nyata informasi seperti itu tidak pernah tersedia dengan pasti. Oleh karena itu, menggunakan intuisi kita (dan ke mana semua uang saya akan pergi jika kita bertaruh), mobil pasti biru. (beberapa percaya ini bukan statistik lagi, tapi well, pandangan hitam / putih tentang sains tidak terlalu membantu)

Alasannya sederhana. Anggaplah mobil itu tidak berwarna biru. Maka 90% orang (!) Salah. Mereka hanya bisa salah karena daftar masalah termasuk:

buta warna
dusta patologis
berada di bawah pengaruh zat seperti alkohol, LCD, dll
tidak mengerti pertanyaannya
bentuk lain dari gangguan mental
kombinasi di atas

Karena hal di atas jelas tidak akan mempengaruhi 90% dari populasi acak rata-rata (mis. Kebutaan warna mempengaruhi sekitar 8% pria dan 0,6% wanita, yaitu 43 orang dari 1000), maka perlu diperhatikan bahwa mobil biru. (Begitulah semua uang saya akan tetap pergi).

luchonacho
sumber

Ini tampaknya benar secara intuitif bagi saya. Saya pikir kritik terhadap pertanyaan awal adalah bahwa tidak memberikan informasi yang cukup dan bahwa asumsi tertentu harus dibuat .. yah, bukankah itu hampir selalu terjadi di dunia nyata ???

Pat Molloy

@PatMolloy Tidak memberikan informasi yang cukup untuk memberikan jawaban matematis canggih benar / salah yang canggih (yang tentunya merupakan tujuan dari banyak pertanyaan yang ingin didapatkan dari situs ini). Namun, mengingat berkurangnya informasi yang Anda berikan, ketika datang untuk bertaruh uang, inilah jawabannya (100%) yang akan dipilih orang.

luchonacho

1

Saya pikir Anda telah gagal untuk menutupi beberapa alternatif yang paling masuk akal - yang merupakan alternatif yang seharusnya membuat Anda mengubah kesimpulan Anda. Ini termasuk (a) orang tidak dapat mengenali warna biru; (b) tidak ada pemahaman umum tentang "biru" antara penanya dan responden; (c) makna "ilmiah" dari "biru" berbeda dari apa yang orang umumnya pahami sebagai "biru." Yang penting, karena Anda tidak dapat menghitung salah satu dari alternatif ini, atau sebagian besar dari yang Anda sebutkan, bagaimana Anda bisa membenarkan menghitung kemungkinan jawaban? Itu bukan statistik!

whuber

"Karena hal di atas jelas tidak akan mempengaruhi 90% dari populasi acak rata-rata" Jangan terlalu yakin tentang itu. Ingat kita biasanya berbicara dalam hal rata-rata ketika membahas manusia. Jadi yakin, hanya beberapa persen yang memiliki kebutaan warna (dibandingkan dengan rata-rata), tetapi mungkin ada beberapa yang memiliki penglihatan superior, misalnya tetrachromats.

NPSF3000

2

Saya selalu di bawah pengaruh LCD

Alex

2

Saya tidak akan makan kotoran berdasarkan fakta bahwa milyaran lalat tidak mungkin salah. Mungkin ada lusinan alasan lain mengapa 900 orang dari 1000 orang mungkin tertipu karena menganggap mobil itu biru. Lagipula, itulah dasar dari trik-trik magis, memikat orang untuk memikirkan sesuatu yang dihilangkan dari kenyataan. Jika 900 orang dari 1000 melihat seorang penyihir menikam asistennya, mereka akan segera menjawab bahwa asisten itu ditusuk, karena betapa tidak mungkinnya terjadi pembunuhan di atas panggung. Lampu biru pada cat mobil reflektif, ada orang?

pengguna174494
sumber

2

Yang ditanyakan kurang tahu tentang bagaimana jajak pendapat dilakukan untuk menjawab pertanyaan secara akurat. Sejauh yang dia ketahui, jajak pendapat dapat menderita beberapa masalah:

Orang-orang yang mengambil jajak pendapat bisa saja bias:

Mobil itu tampak biru karena ilusi optik .
Warna mobil itu untuk beberapa alasan sulit diamati, dan orang-orang karena beberapa alasan telah menunjukkan banyak mobil biru sebelum ini, membuat sebagian besar dari mereka percaya mobil ini mungkin biru juga.
Anda telah membayar mereka untuk mengatakan bahwa mobil itu berwarna biru.
Anda membuat seseorang menghipnotis mereka semua untuk percaya bahwa mobil itu berwarna biru.
Mereka telah membuat perjanjian untuk berbohong dan menyabot pemilihan.

Mungkin ada korelasi di antara orang-orang yang mengambil jajak pendapat karena bagaimana mereka dipilih atau karena mereka saling mempengaruhi:

Anda secara tidak sengaja melakukan pemilihan pada pertemuan massa untuk orang-orang dengan jenis buta warna yang sama.
Anda melakukan polling di taman kanak-kanak; gadis-gadis itu tidak tertarik pada mobil dan sebagian besar anak lelaki memakai warna biru sebagai warna favorit mereka, membuat mereka membayangkan bahwa mobil itu berwarna biru.
Orang pertama yang ditunjukkan mobil itu mabuk dan berpikir itu tampak biru, berteriak "ITU BIRU", mempengaruhi semua orang untuk berpikir bahwa mobil itu biru.

Jadi, sementara probabilitas bahwa mobil itu biru jika jajak pendapat dilakukan dengan benar sangat tinggi (seperti yang dijelaskan dalam jawaban Ruben van Bergen), keandalan jajak pendapat mungkin telah dikompromikan yang membuat kemungkinan mobil tidak biru tidak tidak penting. Seberapa besar orang yang ditanya memperkirakan peluang ini pada akhirnya tergantung pada perkiraannya tentang seberapa besar kemungkinan keadaan telah mengacaukan polling dan seberapa baik Anda dalam melakukan polling (dan seberapa nakal menurutnya Anda).

Halo selamat tinggal
sumber

2

Apa definisi "biru"?

Budaya dan bahasa yang berbeda memiliki pengertian yang berbeda tentang biru. IIRC, beberapa budaya menyertakan hijau dalam pengertian mereka tentang biru!

Seperti kata bahasa alami, Anda hanya dapat mengasumsikan ada beberapa konvensi budaya kapan (dan kapan tidak) menyebut hal-hal "biru".

Secara keseluruhan, warna dalam bahasa sangat subyektif (tautan dari komentar di bawah, terima kasih @ Count Ibilis)

Anony-Mousse
sumber

7

Dalam konteks pertanyaan, saya percaya aspek khusus ini sangat tidak relevan - saya berasumsi OP memilih kata "biru" sebagai istilah yang sangat umum dan bukan sesuatu seperti "biru", "torqouise" dll. Di mana orang mungkin tidak yakin. Selain itu, mobil biasanya cenderung menggunakan palet yang sangat terbatas dengan warna yang mungkin / biasa. Akhirnya, pertanyaannya bukan "mengapa 100 orang mengatakan non-biru", tetapi "berapa probabilitas bahwa mobil itu sebenarnya biru".

AnoE

2

vimeo.com/120808489

Hitung Iblis

Definisi yang tepat adalah "memancarkan cahaya yang didominasi memiliki panjang gelombang 475nm plusminus ~ 10-20nm dalam kondisi lingkungan saat ini". Ini umumnya diterima sebagai warna biru.

rackandboneman

Ya, tetapi berapa banyak orang yang membawa alat untuk mengukur panjang gelombang dominan? Anda juga lupa mengecualikan panjang gelombang yang tidak terlihat.

Anony-Mousse

1

Pertanyaan tampaknya tentang menggunakan sekelompok orang yang kalibrasi tidak dikenal secara statistik sebagai meter panjang gelombang :)

rackandboneman

1

Kemungkinannya, tergantung pada prasyarat yang lebih disempurnakan, menjadi beberapa nilai yang berbeda, tetapi 99,995% adalah salah satu yang paling masuk akal bagi saya.

Kita tahu, berdasarkan definisi, bahwa mobil itu biru (itu 100%), tetapi tidak dirinci dengan baik apa arti sebenarnya ini (yang akan bertaruh agak filosofis). Saya akan menganggap sesuatu berwarna biru dalam arti bisa-memang-dilihat-sebagai-biru.

Kita juga tahu bahwa 90% subjek uji melaporkan warna biru.

Kami tidak tahu apa yang ditanyakan atau bagaimana evaluasi dilakukan, dan dalam kondisi pencahayaan apa mobil itu berada. Diminta menyebutkan nama warnanya, beberapa subjek mungkin mengatakan misalnya "biru kehijauan" karena kondisi pencahayaan, dan penilai mungkin tidak dihitung sebagai "biru". Orang yang sama mungkin menjawab "ya" jika pertanyaannya adalah "Apakah ini biru?". Saya akan berasumsi bahwa Anda tidak bermaksud menipu dengan sengaja subjek uji Anda.

Kita tahu bahwa kejadian tritanopy adalah sekitar 0,005% yang berarti bahwa jika mobil benar-benar dapat dilihat sebagai biru , maka 99,995% dari subyek uji memang melihat warna sebagai biru. Namun, itu berarti bahwa 9,995% dari subjek uji tidak melaporkan warna biru ketika mereka melihat warna biru dengan jelas. Mereka berbohong tentang apa yang mereka lihat. Ini dekat dengan apa yang dikatakan oleh pengalaman hidup Anda kepada Anda: orang tidak selalu jujur (tapi, kecuali ada motif, mereka biasanya jujur).

Dengan demikian, orang yang tidak memperhatikan dapat menganggap dengan pasti bahwa mobil itu berwarna biru. Itu akan menjadi 100%

Kecuali ... kecuali jika orang yang tidak memperhatikan dirinya menderita tritanopy, dalam hal ini dia tidak akan melihat mobil berwarna biru meskipun semua orang (atau lebih tepatnya, 90% dari mereka) mengatakan demikian. Ini dia filosofis lagi: Jika semua orang mendengar pohon tumbang, tetapi saya tidak, apakah pohon itu tumbang?

Saya berani mengatakan bahwa jawaban yang paling masuk akal dan praktis adalah: Jika orang yang tidak mengamati kebetulan adalah trianope (peluang 0,005%), maka memverifikasi apakah warna yang diprediksi dan warna asli yang dilihat adalah sama akan menghasilkan false. Dengan demikian, kemungkinannya adalah 99,995% daripada 100%.

Selanjutnya, sebagai bonus, karena kami menemukan bahwa 9,995% dari subjek uji adalah pembohong, dan diketahui bahwa semua Kreta adalah pembohong , kita dapat menyimpulkan bahwa kita tidak berada di Kreta!

Damon
sumber

1

Anda memiliki mobil biru (berdasarkan ukuran ilmiah obyektif - biru).

...

"Berapa probabilitas bahwa mobil itu biru?"

Warnanya 100% biru.

Yang mereka tahu adalah 900 orang mengatakan itu biru, dan 100 orang tidak. Anda tidak tahu lebih banyak tentang orang-orang ini (1000).

Menggunakan angka-angka ini (tanpa konteks apa pun ) sama sekali tidak masuk akal. Itu semua bermuara pada interpretasi pribadi dari pertanyaan itu. Kita seharusnya tidak menempuh jalan ini dan menggunakan Wittgenstein: "Wovon man nicht sprechen kann, darüber muss man schweigen."

Bayangkan pertanyaan berikut untuk perbandingan:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Ini pada dasarnya masalah yang sama (kurang informasi), tetapi jauh lebih jelas bahwa apa yang kita pikirkan tentang warna mobil sebagian besar (jika tidak sepenuhnya) keadaan.

Dalam jangka panjang, ketika kita mendapatkan beberapa pertanyaan terkait, maka kita dapat mulai menebak jawaban untuk pertanyaan yang tidak lengkap tersebut. Ini sama untuk algoritma tit-for-tat yang tidak bekerja untuk satu kasus, tetapi bekerja dalam jangka panjang . Dalam arti yang sama, Wittgenstein kembali dari pekerjaannya sebelumnya dengan Investigasi Utama . Kami dapat menjawab pertanyaan-pertanyaan ini, tetapi kami membutuhkan lebih banyak informasi / uji coba / pertanyaan. Itu adalah sebuah proses.

Martijn Weterings
sumber

0

Jika kita menganggap mobil itu biru, maka 100 dari 1.000 mengatakan itu bukan biru menyiratkan semacam bias sampel yang ekstrim. Mungkin Anda hanya mengambil sampel orang buta warna. Jika kita menganggap mobil itu tidak biru, maka bias sampel bahkan lebih buruk. Jadi yang bisa kita simpulkan dari data yang diberikan adalah sampelnya sangat bias, dan karena kita tidak tahu bagaimana itu bias, kita tidak bisa menyimpulkan apa pun tentang warna mobil.

Mike Scott
sumber

Umm, pasti fakta bahwa 900 orang mengatakan itu biru bagus untuk sesuatu? Tidak bisakah kita menyimpulkan itu lebih cenderung berwarna biru daripada tidak ?? Ingat responden hanya tahu angka 900 dan 100. Jadi bisakah mereka benar-benar mengatakan sesuatu tentang bias?

Pat Molloy

0

Ada beberapa jawaban. Saya tidak berarti seorang guru matematika, tetapi ini milik saya.

Hanya ada 4 kemungkinan:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Dari pertanyaan, Anda tahu bahwa jumlah kasus 1 dan kasus 4 adalah 900 orang (90%), dan jumlah kasus 2 dan kasus 3 adalah 100 orang (10%). Namun demikian, inilah tangkapannya: yang tidak Anda ketahui adalah distribusi dalam 2 pasang kasing ini. Mungkin jumlah kasus 1 dan 4 sepenuhnya terdiri dari kasus 1 (yang berarti mobil berwarna biru), atau mungkin seluruh jumlah terdiri dari kasus 4 (yang berarti mobil tidak berwarna biru). Sama berlaku untuk jumlah kasus 2 + 3. Jadi ... Yang Anda butuhkan adalah membuat beberapa cara untuk memprediksi distribusi dalam jumlah kasus. Dengan tidak ada indikasi lain dalam pertanyaan (tidak ada yang mengatakan orang 80% yakin untuk mengetahui warna mereka atau apa pun seperti itu) tidak ada cara Anda bisa datang dengan jawaban, pasti tertentu.

Setelah mengatakan ini ... Saya menduga jawaban yang diharapkan adalah sesuatu di sepanjang baris:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

di mana sisa 50% tidak diketahui, sebut saja margin kesalahan.

Tuncay Göncüoğlu
sumber

0

$X,Y_1,Y_2,\ldots,Y_{1000} \in \{0,1\}$ $1$ $p(x)$ $p_x$ $Y_i|X=1$ $p_1$ $Y_i|X=0$ $p_0$ $\theta = (p_x,p_0,p_1)$

Kamu sedang mencari $p(\theta,x|y_{1:1000}) \propto p(\theta)p(x|\theta)\prod_{i=1}^{1000}p(y_i|x)$

$\{x_i\}$ $\{y_i|x\}$

Taylor
sumber

-3

Orang yang tidak dapat melihat mobil tidak tahu bahwa secara ilmiah terbukti berwarna biru. Peluang untuk dia bahwa mobil itu biru adalah 50/50 (itu biru, atau tidak). Polling orang lain dapat mempengaruhi pendapat orang ini tetapi itu tidak mengubah probabilitas bahwa mobil yang tidak terlihat berwarna biru, atau tidak.

Semua matematika di atas menentukan probabilitas bahwa set sampel Anda dapat menentukan apakah itu berwarna biru.

roti jagung
sumber

Saya tidak yakin benar bahwa kemungkinan warna biru adalah 50/50. Faktanya, jaraknya kurang dari 50, karena bisa merah, putih, kuning, dll. Kemungkinan mobil yang dipilih secara acak berwarna biru kurang dari 50%.

pengguna

Jika 900 dari 1000 orang mengatakan mobil berwarna biru, berapakah probabilitas mobil itu berwarna biru?

Jawaban:

Jawaban praktis sederhana:

Skenario 1: Orang diasumsikan sangat pandai mengenali warna biru ketika warna biru ... 0%

Skenario 2: Orang diasumsikan sangat pandai mengenali tidak biru ketika bukan biru ... 100%

Apa definisi "biru"?