Apa nama dari kekeliruan statistik dimana hasil dari koin sebelumnya mempengaruhi kepercayaan tentang koin berikutnya?

28

Seperti yang kita semua tahu, jika Anda melempar koin yang memiliki kesempatan yang sama untuk mendarat kepala seperti halnya ekor, maka jika Anda membalik koin berkali-kali, separuh waktu Anda akan mendapatkan kepala dan separuh waktu Anda akan mendapatkan ekor.

Ketika mendiskusikan hal ini dengan seorang teman, mereka mengatakan bahwa jika Anda membalik koin 1.000 kali, dan katakanlah 100 kali pertama mendaratkan kepala, maka kemungkinan mendaratkan ekor meningkat (logikanya adalah jika itu tidak bias, maka pada saat Anda membalikkannya 1000 kali Anda akan memiliki sekitar 500 kepala dan 500 ekor, jadi ekor harus lebih mungkin).

Saya tahu itu salah, karena hasil di masa lalu tidak memengaruhi hasil di masa depan. Apakah ada nama untuk kekeliruan khusus itu? Juga, adakah penjelasan yang lebih baik mengapa ini salah?

probability distributions sampling oggmonster
sumber

8

Jika Anda membalik koin 100 kali dan mendarat 100 kali, kemungkinannya bukan koin yang tidak bias.

Robert

1

@ Robert Bagaimana? Karena setiap flip tidak tergantung pada yang lain, kemungkinannya adalah H 100x sama dengan jika itu adalah urutan H & T yang tidak cocok, atau 100x T

yuritsuki

11

@thinlyveiledquestionmark Saya ingin bermain poker dengan Anda ... tetapi hanya jika saya diizinkan untuk berurusan. Saya pikir Robert berarti bahwa realisasi 100 H dalam 100 percobaan akan mengubah keyakinannya dari koin menjadi adil menjadi koin menjadi tidak adil. Dengan data ini 100 H dalam 100 percobaan, Anda harus memiliki pengalaman yang sangat kuat sebelum

Pr (H)

$\Pr(H)$ untuk tidak menggeser posterior secara signifikan.

Sycorax berkata Reinstate Monica

5

@thinlyveiledquestionmark Anda harus berhati-hati. Diberikan flips independen, setiap urutan 100-flip dari H atau T adalah sama-sama mungkin: 100H adalah sama seperti 50H 50T, sama mungkin dengan HTHTHTHT ... HT, dan sebagainya. Tetapi jauh lebih kecil kemungkinannya untuk mendapatkan 100H daripada mendapatkan total 50 kepala, karena ada

cara berbeda untuk membuat 50 flips muncul dan 50 flips muncul.

10^{29}

$10^{29}$

Lagerbaer

3

Ide Robert sangat sahih dan mungkin menjadi sumber "kesalahan" sejak awal. Otak kita terhubung dalam Bayesian, bukan pengertian yang sering. Informasi "sempurna" seperti "koin yang benar-benar adil" jarang ada di alam. Dengan demikian, 100 Heads di 100 mencoba akan praktis membuat kita percaya bahwa

P (H e a d s) > 0.5

$P(Heads) > 0.5$

PA6OTA

41

Ini disebut kesalahan Penjudi .

abaumann
sumber

32

Kalimat pertama dari pertanyaan ini, menggabungkan kesalahan (terkait) lainnya:

"Seperti yang kita semua tahu, jika Anda melempar koin yang memiliki peluang yang sama untuk mendarat kepala seperti halnya ekor, maka jika Anda membalik koin berkali-kali, separuh waktu Anda akan mendapatkan kepala dan separuh waktu Anda akan mendapatkan ekor ."

Tidak, kami tidak akan mendapatkan itu, kami tidak akan mendapatkan kepala separuh waktu dan ekor separuh waktu. Jika kita mendapatkannya, maka Gambler tidak akan salah lagi . Ekspresi matematis untuk pernyataan verbal ini adalah sebagai berikut: Untuk beberapa "besar" (tetapi terbatas) , kita memiliki $n'$ , di mana jelasmenunjukkan berapa kali koin mendarat. Karenaadalah terbatas, makajuga terbatas dan nilai yang berbeda dari. Jadi apa yang terjadisetelahitusandal telah dibuat? Entah itu mendarat, atau tidak. Dalam kedua kasus,baru saja berhenti sama dengan "setengah jumlah lemparan". $n_{h} = \frac {n'}{2}$ $n_{h}$ $n'$ $n'+1$ $n'$ $n'+1$ $n_h$

Tapi mungkin apa yang kita benar-benar dimaksudkan adalah "tak terbayangkan besar" ? Lalu kita nyatakan $n$

lim_{n \to \infty} n_{h} = \frac{n}{2}

$\lim_{n\rightarrow \infty}n_{h} = \frac n{2}$

Tetapi di sini, RHS ("sisi kanan") berisi yang oleh LHS ("sisi kiri"), telah beralih hingga tak terbatas. Jadi RHS juga tak terhingga, dan apa yang pernyataan ini katakan adalah bahwa berapa kali koin akan mendarat sama dengan tak terhingga, jika kita melempar koin dalam jumlah tak terhingga kali (pembagian oleh $n$ $2$ dapat diabaikan):

lim_{n \to \infty} n_{h} = \frac{n}{2} = \infty

$\lim_{n\rightarrow \infty}n_{h} = \frac n{2} = \infty$

Ini pada dasarnya adalah pernyataan yang benar, tetapi tidak berguna , dan jelas bukan yang kita pikirkan.

Secara keseluruhan, pernyataan dalam pertanyaan tersebut tidak berlaku, terlepas dari apakah "total lemparan" dianggap terbatas atau tidak.

Mungkin kemudian kita harus menyatakan

lim_{n \to \infty} \frac{n_{h}}{n} = \frac{1}{2} ?

$\lim_{n\rightarrow \infty}\frac {n_{h}}{n} = \frac 1{2} \;\;?$

Pertama, ini diterjemahkan menjadi "Rasio jumlah mendarat kepala lebih jumlah lemparan cenderung nilai ketika jumlah lemparan cenderung tak terbatas", yang merupakan pernyataan yang berbeda - tidak ada "setengah dari total lemparan" sini. Juga, ini adalah bagaimana probabilitas kadang-kadang masih dirasakan -sebagai batas deterministik frekuensi relatif. Masalah dengan pernyataan ini adalah bahwa LHS mengandung dalam bentuk tak tentu: pembilang dan penyebut pergi hingga tak terbatas. $1/2$

Hmmm, mari kita bawa arsenal variabel acak . Tentukan variabel acak sebagai mengambil nilai jika lemparan ke- muncul kepala, jika muncul ekor. Maka kita memiliki $X_i$ $1$ $i$ $0$

\frac{n_{h}}{n} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}

$\frac {n_{h}}{n} = \frac 1n \sum_{i=1}^nX_i$

Bisakah kita sekarang setidaknya menyatakan

lim_{n \to \infty} \frac{1}{n} \sum_{i = 1}^{n} X_{i} = \frac{1}{2} ?

$\lim_{n\rightarrow \infty}\frac 1n \sum_{i=1}^nX_i = \frac 1{2} \;\;?$

Tidak ada . Ini adalah batas deterministik. Hal ini memungkinkan semua kemungkinan realisasi dari urutan 's, dan sehingga bahkan tidak jaminan bahwa batas akan ada, apalagi itu menjadi sama dengan . Sebenarnya pernyataan seperti itu hanya bisa dilihat sebagai kendala $X$ $1/2$ pada urutan, dan itu akan menghancurkan independensi lemparan.

Apa yang kita bisa katakan, adalah bahwa ini rata-rata jumlah konvergen dalam probabilitas ( "lemah") untuk (Bernoulli -Weak Hukum Bilangan Besar), $1/2$

lim_{n \to \infty} Pr (| \frac{1}{n} \sum_{i = 1}^{n} X_{i} - \frac{1}{2} | < ε) = 1, \forall ε > 0

$\lim_{n\rightarrow \infty}\text {Pr}\left(\left|\frac 1n \sum_{i=1}^nX_i-\frac 12 \right|<\varepsilon\right) =1 , \;\;\;\forall \varepsilon >0$

dan dalam kasus yang sedang dipertimbangkan, bahwa ia juga konvergen hampir pasti ("sangat") (Borel -Hukum Kuat Jumlah Besar)

Pr (lim_{n \to \infty} \frac{1}{n} \sum_{i = 1}^{n} X_{i} = \frac{1}{2}) = 1,

$\text {Pr}\left(\lim_{n\rightarrow \infty}\frac 1n \sum_{i=1}^nX_i=\frac 12 \right) =1 , \;\;\;$

Tapi ini adalah pernyataan probabilistik tentang probabilitas terkait dengan perbedaan antara dan , dan bukan tentang batas perbedaan $n_h/n$ $1/2$ $n_h-n_t$ (yang menurut pernyataan palsu harus nol - dan tidak ).

Memang, perlu upaya intelektual khusus untuk benar - benar memahami kedua pernyataan ini, dan bagaimana mereka berbeda (dalam "teori" dan "praktik") dari beberapa yang sebelumnya - saya belum mengklaim pemahaman yang begitu dalam untuk saya sendiri.

Alecos Papadopoulos
sumber

1

Mungkin salah satu respons pendidikan terbaik yang pernah saya baca sejak lama. Sudah selesai dilakukan dengan baik.

Pete Mancini

@AlecosPapadopoulos Saya pikir ini akan membantu jawaban untuk meletakkan hal yang dapat kita katakan dalam formula seperti yang Anda lakukan dengan formulasi yang salah. Saya kira itu adalah sesuatu seperti \ lim P (\ frac {1} {n} \ jumlah X_i) = 1?

kutschkem

@kutschkem Saran yang bagus. Baru saja.

Alecos Papadopoulos

12

Kekeliruan ini memiliki banyak nama.

1) Ini mungkin paling dikenal sebagai kesalahan Gambler

2) kadang-kadang disebut ' hukum angka kecil ' (juga lihat di sini ) (karena berkaitan dengan gagasan bahwa karakteristik populasi harus tercermin dalam sampel kecil) - yang saya pikir adalah nama yang rapi karena kontras dengan hukum sejumlah besar, tetapi sayangnya nama yang sama diterapkan pada distribusi Poisson (dan juga terkadang digunakan oleh matematikawan untuk mengartikan sesuatu yang lain lagi), sehingga dapat membingungkan.

3) di antara orang-orang yang percaya kekeliruan itu kadang-kadang disebut ' hukum rata-rata ', yang secara khusus cenderung dipanggil setelah dijalankan tanpa hasil untuk menyatakan bahwa hasilnya adalah 'karena', tetapi tentu saja tidak ada jangka pendek seperti itu hukum ada - tidak ada yang bertindak untuk 'mengkompensasi' untuk ketidakseimbangan awal - satu-satunya cara ketidaksesuaian awal dihilangkan adalah dengan volume nilai kemudian yang sendiri memiliki rata-rata 1/2 .

Pertimbangkan percobaan di mana koin yang adil dilemparkan berulang kali; membiarkan $H_i$ menjadi jumlah kepala dan $T_i$ menjadi jumlah ekor yang diamati sampai akhir $i$ percobaan ke-5. Catat itu $i=H_i+T_i$

Sangat menarik untuk dicatat bahwa dalam jangka panjang (mis $n\to\infty$ ), while $\frac{H_n}{n}$ does converge in probability to $\frac{_1}{^2}$ , $E|H_n-T_n|$ grows with increasing $n$ - indeed it grows without bound; there's nothing "pushing it back toward 0".

Glen_b -Reinstate Monica
sumber

1

Are you thinking of 'stochastic'? The flip of a fair coin (or the roll of a fair die) is stochastic (ie independent) in the sense that it does not depend on a previous flip of such coin. Assuming a fair con, the fact that the coin had been flipped a hundred times with a hundred heads resulting does not change the fact that the next flip has a 50/50 chance of being heads.

In contrast, the likelihood of drawing a certain card drawing a card from a deck of cards without replacement is not stochastic because the likelihood of drawing a certain card will change the likelihood of drawing the card on the next draw (if it was with replacement, it would be stochastic).

user63551
sumber

stochastic does not mean independent

Ben Voigt

1

"Assuming a fair con...the next flip has a 50/50 chance of being heads", I think you do have a deep philosophical truth here. You could expand the answer to explain what happens if it's an unfair (AKA regular?) con.

hyde

0

Adding on to Glen_b's and Alecos's responses, let's define $X_n$ to be the number of heads in the first $n$ trials. A familiar result using the normal approximation to the binomial is that $X_n$ is approximately $N(n/2, \sqrt{n/4})$ . Now, before observing the first 100 tosses, your friend is correct that there is a good chance that $X_{1000}$ will be close to 500. In fact,

$P( 469 < X_{1000} < 531) \approx .95$ .

However, after observing $X_{100} =100$ , let's define $Y_{900}$ to be number of heads in the last 900 trials, then

$P( 469 < X_{1000} < 531 \mid X_{100}=100) = P( 369 < Y_{900} < 431) \approx .1$

since $Y_{900}$ approximately $N(450, 15)$ .

Thus, after observing 100 heads in the first 100 trials, there is no longer a high probability of observing close to 500 successes in the first 1000 trials, assuming of course that the coin is fair. Note that this is a concrete example illustrating that an initial imbalance is unlikely to be compensated for in the short run.

Further, note that if $n=1,000,000$ , then

$P(499,020 < X_{1,000,000} < 500,980) \approx .95$

but the impact of the imbalance in the first 100 tosses is negligible in the long run since

$P(499,020 < X_{1,000,000} < 500,980 \mid X_{100} = 100) = P( 498,920 < Y_{999,900} < 500880) \approx .949$

jsk
sumber

0

You are refering to Gambler's fallacy, although this is not entirely correct.

Indeed if phrased as "given an assumed fair coin and one observes a given sequence of outcomes, what is the estimation of the elementary probabilities of the coin", this becomes more apparent.

Indeed the "fallacy" is related only to (assumed) fair coins, where the various products of probs are equal. However this entails an interpretation that is in contrast to (study of) similar cases with a coin having another (not-symmetric/biased) probability distribution.

For a further discusion of this (and a little twist) see this question.

This is exactly like the fallacy used in many statistical studies where correlation implies causality. But it can be a hint of a causality relation or common cause.

Nikos M.
sumber

0

Just to note, that if you get a huge run of heads or tails in a row, you may be better off revisiting your prior assumption assumption that the coin was fair.

Avraham
sumber

Apa nama dari kekeliruan statistik dimana hasil dari koin sebelumnya mempengaruhi kepercayaan tentang koin berikutnya?

Jawaban: