Konsep statistik untuk menjelaskan mengapa Anda cenderung untuk membalik jumlah kepala yang sama dengan ekor, karena jumlah flips meningkat?

28

Saya sedang bekerja mempelajari probabilitas dan statistik dengan membaca beberapa buku dan menulis beberapa kode, dan sambil mensimulasikan koin membalik saya perhatikan sesuatu yang menurut saya sedikit berlawanan dengan intuisi naif seseorang. Jika Anda membalik koin yang adil kali, rasio kepala ke ekor bertemu ke arah 1 saat meningkat, persis seperti yang Anda harapkan. Tetapi di sisi lain, ketika bertambah, tampaknya Anda menjadi kurang mungkin membalik jumlah kepala yang sama persis dengan ekor, sehingga mendapatkan rasio tepat 1.n nnnn

Sebagai contoh (beberapa output dari program saya)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Pertanyaan saya adalah ini: adakah konsep / prinsip dalam statistik / teori probabilitas yang menjelaskan hal ini? Jika ya, prinsip / konsep apa itu?

Tautan ke kode jika ada yang tertarik melihat bagaimana saya menghasilkan ini.

- edit -

Untuk apa nilainya, inilah cara saya menjelaskan ini pada diri saya sebelumnya. Jika Anda membalik koin yang adil kali dan menghitung jumlah kepala, Anda pada dasarnya menghasilkan angka acak. Demikian juga jika Anda melakukan hal yang sama dan menghitung ekor, Anda juga menghasilkan angka acak. Jadi jika Anda menghitung keduanya, Anda benar-benar menghasilkan dua angka acak, dan saat semakin besar, angka acak semakin besar. Dan semakin besar angka acak yang Anda hasilkan, semakin banyak peluang bagi mereka untuk "kehilangan" satu sama lain. Apa yang membuat ini menarik adalah bahwa kedua angka itu sebenarnya terhubung dalam arti tertentu, dengan perbandingan mereka yang mengarah ke satu ketika mereka semakin besar, meskipun masing-masing angka itu acak secara terpisah. Mungkin hanya saya, tetapi saya menemukan hal yang rapi. nnn

mindcrime
sumber
Apakah Anda mencari penjelasan intuitif atau matematis?
Glen_b -Reinstate Monica
1
Keduanya benar-benar. Saya pikir saya agak memahami alasan dalam arti intuitif, tetapi saya ingin memahami alasan formal di baliknya.
mindcrime
1
Apakah Anda tahu cara menghitung probabilitas binomial dan menerapkannya pada situasi ini? Jika tidak, cari, dan kerjakan perhitungannya.
Mark L. Stone
Wow, ada beberapa jawaban bagus untuk pertanyaan ini. Saya merasa sedih karena harus menerima yang satu dan bukan yang lain. Izinkan saya mengatakan bahwa saya menghargai semua jawaban dan semua orang yang meluangkan waktu untuk berbagi wawasan mereka tentang ini.
mindcrime

Jawaban:

31

Perhatikan bahwa kasus di mana jumlah kepala dan jumlah ekor sama dengan "persis separuh waktu Anda mendapatkan kepala". Jadi mari kita tetap menghitung jumlah kepala untuk melihat apakah itu setengah dari jumlah lemparan atau membandingkan proporsi kepala dengan 0,5.

Semakin banyak Anda membalik, semakin besar jumlah kemungkinan jumlah kepala yang dapat Anda miliki - distribusi menjadi lebih tersebar (misalnya interval untuk jumlah kepala yang mengandung 95% probabilitas akan tumbuh lebih luas seiring dengan meningkatnya jumlah lemparan) , jadi kemungkinan setengah kepala akan cenderung turun saat kita melemparkan lebih banyak.

Sejalan dengan itu, proporsi kepala akan mengambil lebih banyak nilai yang mungkin; lihat di sini, di mana kita bergerak dari 100 kali lemparan ke 200 kali lemparan:

masukkan deskripsi gambar di sini

Dengan 100 kali lemparan, kita dapat mengamati proporsi 0,49 kepala atau 0,50 kepala atau 0,51 kepala (dan seterusnya - tetapi tidak ada di antara nilai-nilai itu), tetapi dengan 200 kali lemparan, kita dapat mengamati 0,49 atau 0,495 atau 0,50 atau 0,505 atau 0,510 - yang probabilitas memiliki lebih banyak nilai untuk "ditutupi" dan karenanya masing-masing akan cenderung mendapatkan bagian yang lebih kecil.

Pertimbangkan daripada Anda harus lemparan dengan beberapa probabilitas p saya mendapatkan i kepala (kita tahu probabilitas ini tapi itu tidak penting untuk bagian ini), dan Anda menambahkan dua lemparan lagi. Dalam 2 n lemparan, n kepala adalah hasil yang paling mungkin ( p n > p n ± 1 dan turun dari sana).2npii2nnpn>pn±1

Apa peluang memiliki head dalam 2 n + 2 lemparan?n+12n+2

(Beri label probabilitas ini dengan jadi kami tidak membingungkannya dengan yang sebelumnya; juga biarkan P (HH) menjadi probabilitas "Head, Head" dalam dua lemparan berikutnya, dan seterusnya)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

yaitu jika Anda menambahkan dua lemparan koin, probabilitas nilai tengah secara alami turun karena rata-rata nilai yang paling mungkin (tengah) dengan rata-rata nilai yang lebih kecil di kedua sisi)

Jadi selama Anda sedang nyaman bahwa puncak akan berada di tengah (untuk ), Probabilitas persis setengah kepala harus menurun sebagai n naik.2n=2,4,6,...n


Bahkan kita dapat menunjukkan bahwa untuk besar , p n berkurang secara proporsional dengan 1npn (tidak mengejutkan, karena distribusi jumlah kepala standar mendekati normalitas dan varians proporsi kepala berkurang dengann).1nn


Seperti yang diminta, inilah kode R yang menghasilkan sesuatu yang dekat dengan plot di atas:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)
Glen_b -Reinstate Monica
sumber
1
Saya setuju dengan @RustyStatistician di atas tentang 1000 kata grafis Anda. Kredit ekstra untuk penunjuk ke kode.
TomRoche
Sosok dan penjelasan yang luar biasa!
@ Tom saya memasukkan kode yang melakukan segalanya kecuali membuat "200" di judul hijau.
Glen_b -Reinstate Monica
1
@ Glen_b Terima kasih atas posnya yang hebat, dan kemurahan hati berbagi baris kode Plot yang indah! Sulit untuk mengakuinya, tapi aku mengalami masalah dengan ekspresi matematis dari konsep dalam posting Anda, dan khususnya penggunaan-huruf . P
Antoni Parellada
1
@Antoni hanya berarti "kemungkinan mendapatkan 'Head, Head' pada dua lemparan tambahan". Untuk mendapatkan n +1 kepala dalam 2n + 2 lemparan, dengan 2n lemparan Anda harus memiliki n-1 kepala (dan kemudian melemparkan 2 kepala) atau n kepala (lalu melemparkan 1 kepala) atau n + 1 kepala (dan kemudian melemparkan 0 kepala). P(HH)
Glen_b -Reinstate Monica
19

Yah kita tahu bahwa Hukum Angka Besar adalah apa yang menjamin kesimpulan pertama dari pengalaman Anda, yaitu, bahwa jika Anda membalik koin yang adil kali, rasio head to tail konvergen ke arah 1 saat n bertambah. nn

Jadi tidak ada masalah di sana. Namun, itu tentang semua Hukum Bilangan Besar memberitahu kita dalam skenario ini.

Tapi sekarang, pikirkan masalah ini secara lebih intuitif. Pikirkan tentang membalik koin beberapa kali, misalnya: .n=2,4,8,10

Saat Anda melempar koin dua kali, yaitu , pikirkan skenario yang mungkin terjadi dari kedua flip . (Di sini H akan menunjukkan kepala dan T akan menunjukkan ekor). Di tinju sandal Anda bisa mendapatkan H dan pada flip kedua Anda bisa mendapatkan T . Tapi itu hanya salah satu cara kedua flip bisa muncul. Anda juga bisa mendapatkan pada flip pertama T dan pada flip kedua H , dan semua kemungkinan kombinasi lainnya. Jadi pada akhir hari, ketika Anda membalik 2 koin, kombinasi yang mungkin Anda bisa lihat pada dua flips adalah S = { H H , H T ,n=2HTHTTH dan jadi ada 4 skenario yang memungkinkan untuk membalik n = 2 koin.

S={HH,HT,TH,TT}
n=2

Jika Anda membalik 4 koin maka jumlah kombinasi yang mungkin Anda lihat adalah dan jadi ada 16 skenario yang memungkinkan untuk membalik n = 4 koin.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Membalik koin mengarah ke 256 kombinasi.n=8

Membalik koin mengarah ke 1.024 kombinasi.n=10

Dan khususnya, membalik jumlah koin mengarah ke 2 n kombinasi yang memungkinkan.n2n

Sekarang, mari kita coba dan dekati sudut pandang probabilistik masalah ini. Melihat kembali pada kasus ketika , kita tahu bahwa probabilitas untuk mendapatkan jumlah Kepala dan Ekor yang sama persis (yaitu, seperti yang Anda katakan, rasio tepat 1) adalah P r ( Rasio tepat 1 ) = 2n=2 Ketikan=4, kita tahu bahwa probabilitas mendapatkan jumlah Kepala dan Ekor yang persis sama adalah Pr(Rasio tepat 1)=6

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

n

n

Pr(Ratio of exactly 1)0

Jadi, untuk menjawab pertanyaan Anda. Benar-benar apa yang Anda amati hanyalah konsekuensi dari kenyataan bahwa akan ada lebih banyak kombinasi membalik koin di mana jumlah kepala dan ekor tidak sama dibandingkan dengan jumlah kombinasi di mana mereka sama.



Seperti yang disarankan @Mark L. Stone, jika Anda merasa nyaman dengan rumus binomial dan variabel acak binomial, maka Anda dapat menggunakannya untuk menunjukkan argumen yang sama.

XnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

Sekarang, sekali lagi, karena cenderung bertambah besar, ekspresi di atas cenderung ke arah 0 karena sebagai .( nnn(nn/2)0.5n0n


sumber
2
Anda perlu mengatakan sedikit lebih dari itu sebagai ... Anda juga perlu mengatakan sesuatu tentang juga. (Sebagai perbandingan: hanya karena , tidak berarti ). n ( n0.5n0n 0,5n0n! 0,5n0(nn/2)0.5n0n!0.5n0
Silverfish
@Glen_b Saya tidak punya cukup poin untuk mengomentari kiriman Anda, tapi grafiknya luar biasa!
Terima kasih @RustyStatistician, itu sangat membantu. Bagian pertama dari penjelasan Anda cukup cocok dengan cara saya memikirkannya, tetapi saya tidak cukup jauh bersama dengan statistik saya belum tahu bagaimana cara mengatasinya menggunakan distribusi Binomial. Saya pada dasarnya membaca buku saya sekali, tidak menyelesaikan masalah atau apa pun, dan sekarang saya akan kembali dari awal, dan menulis kode untuk mengeksplorasi berbagai aspek materi.
mindcrime
@mindcrime terdengar hebat! Senang bisa membantu.
5

Lihat Pascal's Triangle .

Kemungkinan hasil flip koin diwakili oleh angka-angka di sepanjang baris bawah. Hasil dari kepala dan ekor yang sama adalah angka tengah. Saat pohon tumbuh lebih besar (yaitu, lebih banyak membalik), angka tengah menjadi proporsi yang lebih kecil dari jumlah baris bawah.

Joshua O'Brien
sumber
1

Mungkin ada baiknya menjelaskan bahwa ini terkait dengan hukum arcsine. Ia mengatakan bahwa untuk satu jalur hasil probabilitas bahwa jalur tetap untuk sebagian besar waktu di domain positif atau negatif jauh lebih tinggi daripada yang naik dan turun dari yang Anda harapkan dari intuisi . Berikut beberapa tautan:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law

Karl
sumber
1

Sementara rasio head to tail konvergen ke 1, kisaran angka yang mungkin menjadi lebih luas. (Saya mengarang angka-angka). Katakanlah untuk 100 lemparan, probabilitasnya adalah 90% bahwa Anda memiliki antara 45% dan 55% kepala. Itu 90% bahwa Anda mendapatkan 45 hingga 55 kepala. 11 kemungkinan untuk jumlah kepala. Sekitar 9% kira-kira Anda mendapatkan jumlah kepala dan ekor yang sama.

Katakanlah untuk 10.000 lemparan, probabilitasnya adalah 95% yang Anda dapatkan antara 49% dan 51% kepala. Jadi rasionya sudah mendekati 1. Tetapi sekarang Anda memiliki antara 4.900 dan 5.100 kepala. 201 kemungkinan. Peluang angka yang sama hanya sekitar 0,5%.

Dan dengan sejuta lemparan, Anda cukup yakin memiliki antara 49,9% dan 50,1% kepala. Itu berkisar dari 499.000 hingga 501.000 ekor. 2.001 kemungkinan. Kesempatan sekarang turun menjadi 0,05%.

Ok, matematika dibuat. Tapi ini seharusnya memberi Anda ide tentang "mengapa". Meskipun rasio mendekati 1, jumlah kemungkinan menjadi lebih besar, sehingga memukul tepat setengah kepala, setengah ekor, menjadi semakin kecil kemungkinannya.

Efek praktis lain: Dalam praktiknya tidak mungkin Anda memiliki koin di mana kemungkinan melempar kepala tepat 50%. Mungkin 49,99371% jika Anda memiliki koin yang sangat bagus. Untuk sejumlah kecil lemparan, ini tidak membuat perbedaan. Untuk jumlah besar, persentase head akan konvergen menjadi 49,99371%, bukan 50%. Jika jumlah lemparan cukup besar, melempar 50% atau lebih kepala akan menjadi sangat, sangat tidak mungkin.

gnasher729
sumber
0

Nah, satu hal yang perlu diperhatikan adalah bahwa dengan jumlah flip yang genap (jika tidak, probabilitas head dan tail yang sama tentu saja nol), hasil yang paling mungkin akan selalu menjadi salah satu dengan jumlah flip yang sama persis dengan flips yang dibalik.

n

(1+x2)n.
n
pn=2n(nn/2).

n!

p1πn/2
n/2n2n
pengguna95629
sumber
2
np
0

Misalkan Anda melempar koin dua kali. Ada empat kemungkinan hasil: HH, HT, TH, dan TT. Dalam dua hal ini, Anda memiliki jumlah kepala dan ekor yang sama, jadi ada kemungkinan 50% Anda mendapatkan jumlah kepala dan ekor yang sama.

Sekarang anggaplah Anda melempar koin 4,306,492,102 kali. Apakah Anda mengharapkan peluang 50 persen bahwa Anda akan berakhir dengan tepat 2.153.246.051 ekor dan 2.153.246.051 ekor?

Daniel McLaury
sumber
Tidak, intuisi saya mengatakan bahwa peluang mendapatkan kecocokan tepat rendah, hanya karena jumlahnya semakin besar. Tetapi saya ingin mensimulasikannya hanya untuk mengkonfirmasi pemikiran saya. Ketika saya melihat bahwa ternyata seperti itu, saya tertarik dengan alasan formal di balik mengapa demikian. Bagi saya itu menarik bahwa rasio yang dihasilkan adalah konvergen menuju 1 sementara secara bersamaan menjadi kurang mungkin menjadi 1.
mindcrime
3
nn