Saya sedang bekerja mempelajari probabilitas dan statistik dengan membaca beberapa buku dan menulis beberapa kode, dan sambil mensimulasikan koin membalik saya perhatikan sesuatu yang menurut saya sedikit berlawanan dengan intuisi naif seseorang. Jika Anda membalik koin yang adil kali, rasio kepala ke ekor bertemu ke arah 1 saat meningkat, persis seperti yang Anda harapkan. Tetapi di sisi lain, ketika bertambah, tampaknya Anda menjadi kurang mungkin membalik jumlah kepala yang sama persis dengan ekor, sehingga mendapatkan rasio tepat 1.n n
Sebagai contoh (beberapa output dari program saya)
For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)
Pertanyaan saya adalah ini: adakah konsep / prinsip dalam statistik / teori probabilitas yang menjelaskan hal ini? Jika ya, prinsip / konsep apa itu?
Tautan ke kode jika ada yang tertarik melihat bagaimana saya menghasilkan ini.
- edit -
Untuk apa nilainya, inilah cara saya menjelaskan ini pada diri saya sebelumnya. Jika Anda membalik koin yang adil kali dan menghitung jumlah kepala, Anda pada dasarnya menghasilkan angka acak. Demikian juga jika Anda melakukan hal yang sama dan menghitung ekor, Anda juga menghasilkan angka acak. Jadi jika Anda menghitung keduanya, Anda benar-benar menghasilkan dua angka acak, dan saat semakin besar, angka acak semakin besar. Dan semakin besar angka acak yang Anda hasilkan, semakin banyak peluang bagi mereka untuk "kehilangan" satu sama lain. Apa yang membuat ini menarik adalah bahwa kedua angka itu sebenarnya terhubung dalam arti tertentu, dengan perbandingan mereka yang mengarah ke satu ketika mereka semakin besar, meskipun masing-masing angka itu acak secara terpisah. Mungkin hanya saya, tetapi saya menemukan hal yang rapi. n
sumber
Jawaban:
Perhatikan bahwa kasus di mana jumlah kepala dan jumlah ekor sama dengan "persis separuh waktu Anda mendapatkan kepala". Jadi mari kita tetap menghitung jumlah kepala untuk melihat apakah itu setengah dari jumlah lemparan atau membandingkan proporsi kepala dengan 0,5.
Semakin banyak Anda membalik, semakin besar jumlah kemungkinan jumlah kepala yang dapat Anda miliki - distribusi menjadi lebih tersebar (misalnya interval untuk jumlah kepala yang mengandung 95% probabilitas akan tumbuh lebih luas seiring dengan meningkatnya jumlah lemparan) , jadi kemungkinan setengah kepala akan cenderung turun saat kita melemparkan lebih banyak.
Sejalan dengan itu, proporsi kepala akan mengambil lebih banyak nilai yang mungkin; lihat di sini, di mana kita bergerak dari 100 kali lemparan ke 200 kali lemparan:
Dengan 100 kali lemparan, kita dapat mengamati proporsi 0,49 kepala atau 0,50 kepala atau 0,51 kepala (dan seterusnya - tetapi tidak ada di antara nilai-nilai itu), tetapi dengan 200 kali lemparan, kita dapat mengamati 0,49 atau 0,495 atau 0,50 atau 0,505 atau 0,510 - yang probabilitas memiliki lebih banyak nilai untuk "ditutupi" dan karenanya masing-masing akan cenderung mendapatkan bagian yang lebih kecil.
Pertimbangkan daripada Anda harus lemparan dengan beberapa probabilitas p saya mendapatkan i kepala (kita tahu probabilitas ini tapi itu tidak penting untuk bagian ini), dan Anda menambahkan dua lemparan lagi. Dalam 2 n lemparan, n kepala adalah hasil yang paling mungkin ( p n > p n ± 1 dan turun dari sana).2n pi i 2n n pn>pn±1
Apa peluang memiliki head dalam 2 n + 2 lemparan?n+1 2n+2
(Beri label probabilitas ini dengan jadi kami tidak membingungkannya dengan yang sebelumnya; juga biarkan P (HH) menjadi probabilitas "Head, Head" dalam dua lemparan berikutnya, dan seterusnya)q
yaitu jika Anda menambahkan dua lemparan koin, probabilitas nilai tengah secara alami turun karena rata-rata nilai yang paling mungkin (tengah) dengan rata-rata nilai yang lebih kecil di kedua sisi)
Jadi selama Anda sedang nyaman bahwa puncak akan berada di tengah (untuk ), Probabilitas persis setengah kepala harus menurun sebagai n naik.2n=2,4,6,... n
Bahkan kita dapat menunjukkan bahwa untuk besar , p n berkurang secara proporsional dengan 1n pn (tidak mengejutkan, karena distribusi jumlah kepala standar mendekati normalitas dan varians proporsi kepala berkurang dengann).1n√ n
Seperti yang diminta, inilah kode R yang menghasilkan sesuatu yang dekat dengan plot di atas:
sumber
Yah kita tahu bahwa Hukum Angka Besar adalah apa yang menjamin kesimpulan pertama dari pengalaman Anda, yaitu, bahwa jika Anda membalik koin yang adil kali, rasio head to tail konvergen ke arah 1 saat n bertambah.n n
Jadi tidak ada masalah di sana. Namun, itu tentang semua Hukum Bilangan Besar memberitahu kita dalam skenario ini.
Tapi sekarang, pikirkan masalah ini secara lebih intuitif. Pikirkan tentang membalik koin beberapa kali, misalnya: .n = 2 , 4 , 8 , 10
Saat Anda melempar koin dua kali, yaitu , pikirkan skenario yang mungkin terjadi dari kedua flip . (Di sini H akan menunjukkan kepala dan T akan menunjukkan ekor). Di tinju sandal Anda bisa mendapatkan H dan pada flip kedua Anda bisa mendapatkan T . Tapi itu hanya salah satu cara kedua flip bisa muncul. Anda juga bisa mendapatkan pada flip pertama T dan pada flip kedua H , dan semua kemungkinan kombinasi lainnya. Jadi pada akhir hari, ketika Anda membalik 2 koin, kombinasi yang mungkin Anda bisa lihat pada dua flips adalah S = { H H , H T ,n = 2 H T H T T H
dan jadi ada 4 skenario yang memungkinkan untuk membalik n = 2 koin.
Jika Anda membalik 4 koin maka jumlah kombinasi yang mungkin Anda lihat adalah dan jadi ada 16 skenario yang memungkinkan untuk membalik n = 4 koin.
Membalik koin mengarah ke 256 kombinasi.n = 8
Membalik koin mengarah ke 1.024 kombinasi.n = 10
Dan khususnya, membalik jumlah koin mengarah ke 2 n kombinasi yang memungkinkan.n 2n
Sekarang, mari kita coba dan dekati sudut pandang probabilistik masalah ini. Melihat kembali pada kasus ketika , kita tahu bahwa probabilitas untuk mendapatkan jumlah Kepala dan Ekor yang sama persis (yaitu, seperti yang Anda katakan, rasio tepat 1) adalah P r ( Rasio tepat 1 ) = 2n = 2
Ketikan=4, kita tahu bahwa probabilitas mendapatkan jumlah Kepala dan Ekor yang persis sama adalah
Pr(Rasio tepat 1)=6
Jadi, untuk menjawab pertanyaan Anda. Benar-benar apa yang Anda amati hanyalah konsekuensi dari kenyataan bahwa akan ada lebih banyak kombinasi membalik koin di mana jumlah kepala dan ekor tidak sama dibandingkan dengan jumlah kombinasi di mana mereka sama.
Seperti yang disarankan @Mark L. Stone, jika Anda merasa nyaman dengan rumus binomial dan variabel acak binomial, maka Anda dapat menggunakannya untuk menunjukkan argumen yang sama.
Sekarang, sekali lagi, karena cenderung bertambah besar, ekspresi di atas cenderung ke arah 0 karena sebagai .( nn n→∞( nn / 2) 0,5n→ 0 n → ∞
sumber
Lihat Pascal's Triangle .
Kemungkinan hasil flip koin diwakili oleh angka-angka di sepanjang baris bawah. Hasil dari kepala dan ekor yang sama adalah angka tengah. Saat pohon tumbuh lebih besar (yaitu, lebih banyak membalik), angka tengah menjadi proporsi yang lebih kecil dari jumlah baris bawah.
sumber
Mungkin ada baiknya menjelaskan bahwa ini terkait dengan hukum arcsine. Ia mengatakan bahwa untuk satu jalur hasil probabilitas bahwa jalur tetap untuk sebagian besar waktu di domain positif atau negatif jauh lebih tinggi daripada yang naik dan turun dari yang Anda harapkan dari intuisi . Berikut beberapa tautan:
http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml
https://en.wikipedia.org/wiki/Arcsine_law
sumber
Sementara rasio head to tail konvergen ke 1, kisaran angka yang mungkin menjadi lebih luas. (Saya mengarang angka-angka). Katakanlah untuk 100 lemparan, probabilitasnya adalah 90% bahwa Anda memiliki antara 45% dan 55% kepala. Itu 90% bahwa Anda mendapatkan 45 hingga 55 kepala. 11 kemungkinan untuk jumlah kepala. Sekitar 9% kira-kira Anda mendapatkan jumlah kepala dan ekor yang sama.
Katakanlah untuk 10.000 lemparan, probabilitasnya adalah 95% yang Anda dapatkan antara 49% dan 51% kepala. Jadi rasionya sudah mendekati 1. Tetapi sekarang Anda memiliki antara 4.900 dan 5.100 kepala. 201 kemungkinan. Peluang angka yang sama hanya sekitar 0,5%.
Dan dengan sejuta lemparan, Anda cukup yakin memiliki antara 49,9% dan 50,1% kepala. Itu berkisar dari 499.000 hingga 501.000 ekor. 2.001 kemungkinan. Kesempatan sekarang turun menjadi 0,05%.
Ok, matematika dibuat. Tapi ini seharusnya memberi Anda ide tentang "mengapa". Meskipun rasio mendekati 1, jumlah kemungkinan menjadi lebih besar, sehingga memukul tepat setengah kepala, setengah ekor, menjadi semakin kecil kemungkinannya.
Efek praktis lain: Dalam praktiknya tidak mungkin Anda memiliki koin di mana kemungkinan melempar kepala tepat 50%. Mungkin 49,99371% jika Anda memiliki koin yang sangat bagus. Untuk sejumlah kecil lemparan, ini tidak membuat perbedaan. Untuk jumlah besar, persentase head akan konvergen menjadi 49,99371%, bukan 50%. Jika jumlah lemparan cukup besar, melempar 50% atau lebih kepala akan menjadi sangat, sangat tidak mungkin.
sumber
Nah, satu hal yang perlu diperhatikan adalah bahwa dengan jumlah flip yang genap (jika tidak, probabilitas head dan tail yang sama tentu saja nol), hasil yang paling mungkin akan selalu menjadi salah satu dengan jumlah flip yang sama persis dengan flips yang dibalik.
sumber
Misalkan Anda melempar koin dua kali. Ada empat kemungkinan hasil: HH, HT, TH, dan TT. Dalam dua hal ini, Anda memiliki jumlah kepala dan ekor yang sama, jadi ada kemungkinan 50% Anda mendapatkan jumlah kepala dan ekor yang sama.
Sekarang anggaplah Anda melempar koin 4,306,492,102 kali. Apakah Anda mengharapkan peluang 50 persen bahwa Anda akan berakhir dengan tepat 2.153.246.051 ekor dan 2.153.246.051 ekor?
sumber