Kemungkinan dilahirkan pada hari kabisat?

31

Mengingat hari ini adalah hari kabisat, adakah yang tahu kemungkinan dilahirkan pada hari kabisat?

StatsStudent
sumber
30
Perhatikan bahwa kelahiran tidak didistribusikan secara seragam sepanjang tahun, sehingga kemungkinan hari yang dipilih secara acak menjadi hari kabisat tidak sama dengan probabilitas dilahirkan pada hari kelahiran.
Ben Millwood
17
Dari siapa dilahirkan? Semua orang dalam sejarah? Hari ini? Semua orang hidup? Prospek ke masa depan? Probabilitas tidak ada artinya kecuali peristiwa yang dirujuknya didefinisikan dengan baik.
whuber
15
100% dari orang yang lahir hari ini adalah. Apakah itu membantu?
aslum
8
Banyak orang tua tidak ingin anak-anak mereka dilahirkan pada hari kabisat. Jadi dengan munculnya seksi C yang dijadwalkan, kemungkinannya akan lebih rendah dari hari yang acak. fivethirtyeight.com/features/…
James Lawruk
3
Saya setuju dengan @whuber, bahwa pertanyaannya tidak jelas. Tanpa definisi ruang probabilitas yang tepat pertanyaan tidak dapat dijawab. Karena itu downvote.
mpiktas

Jawaban:

24

Yakin. Lihat di sini untuk penjelasan yang lebih rinci: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .

Tetapi pada dasarnya penulis menyimpulkan, "Ada 485 tahun kabisat dalam 2 milenium. Jadi, dalam 2 milenium, ada total hari. Dari hari-hari itu, 29 Februari terjadi pada 485 dari mereka (tahun kabisat), sehingga probabilitas adalah 485 / 730.485 = 0,0006639424 "485(366)+(2000485)(365)=730485485/730485=0.0006639424

StatsStudent
sumber
9
Mengapa tidak bisa dihitung sebagai 1 / (Jumlah hari dalam 4 tahun) = 1/1461 = 0,00068 ?
Siddhesh
21
@ Sidhesh Ada aturan tentang berabad-abad. Jadi misal 2100 bukan tahun kabisat
Rentrop
8
@ Sidhesh, Sayangnya, tidak sesederhana itu. Tahun kabisat sedikit lebih kompleks. Panjang rata-rata tahun sebenarnya, rata-rata, 365,2425 hari bukan 365,25. Seperti yang tertulis di halaman tahun kabisat wikipedia, "Kalender Gregorian ... menghapus tiga hari kabisat setiap 400 tahun, yang merupakan lamanya siklus kabisatnya. Ini dilakukan dengan menghapus 29 Februari dalam tiga abad tahun (kelipatan 100) yang tidak dapat secara persis dibagi dengan 400. [3] Tahun 2000 dan 2400 adalah tahun kabisat, sedangkan 1800, 1900, 2100, 2200, 2300 dan 2500 adalah tahun-tahun yang umum. "
StatsStudent
10
Saya tidak mengerti mengapa Anda perlu mempertimbangkan 2000 tahun; tahun kabisat berada pada siklus 400 tahun, jadi mengapa tidak mengurangi menjadi "ada 97 tahun kabisat dalam 400 tahun"?
Philip Kendall
7
Mengapa kita harus mempertimbangkan pengaruh kecil seperti "dibatalkan" hari kabisat di abad ini bukan kelipatan 400 tetapi di sisi lain bukan faktor dalam pengaruh eksternal, seperti hampir semua kelahiran ditunda atau diperkenalkan sebelum 29 Februari, hanya untuk menyelamatkan anak dari ketidaknyamanan (atau alasan lain)? - Setidaknya di sini, di Jerman, kemungkinan kelahiran terjadi pada tanggal 29 Februari adalah (diperkirakan) hampir nol.
Saya dengan Monica
23

Untuk secara akurat memprediksi probabilitas itu menggunakan statistik, akan sangat membantu untuk mengetahui di mana kelahiran itu terjadi.

Halaman ini http://chmullig.com/2012/06/births-by-day-of-year/ memiliki grafik yang menunjukkan subset jumlah kelahiran per hari (mengalikan 29 dengan 4, yang salah, dan tidak diinginkan untuk pertanyaan ini, tetapi juga tautan ke data asli dan memberikan indikasi kasar tentang apa yang dapat Anda harapkan) di Amerika Serikat. Saya akan berasumsi bahwa kurva ini tidak berlaku untuk negara lain, dan terutama tidak untuk benua lain. Khususnya belahan bumi selatan dan wilayah khatulistiwa dapat menunjukkan derivasi substansial dari hasil ini - dengan asumsi bahwa iklim adalah faktor penentu.

Selain itu, ada masalah "kelahiran elektif" (disentuh oleh penulis http://bmjopen.bmj.com/content/3/8/e002920.full ) - di wilayah yang lebih miskin di dunia, saya mengharapkan perbedaan distribusi kelahiran, hanya karena seksio sesarea (tidak darurat) atau kelahiran yang diinduksi lebih jarang daripada di negara maju. Ini mengacaukan distribusi final kelahiran.

Menggunakan data Amerika, dengan asumsi ~ 71 Juta kelahiran (rata-rata grafik kasar * 366) dan 46.000 kelahiran pada tanggal 29 Februari, tidak mengoreksi distribusi tahun kabisat dalam data, karena periode yang tepat tidak diindikasikan, saya sampai pada probabilitas sekitar ~ 0,000648. Ini sedikit di bawah nilai yang diharapkan karena distribusi kelahiran yang datar, dan dengan demikian sesuai dengan kesan umum yang diberikan oleh grafik.

Saya akan menyerahkan uji signifikansi estimasi kasar ini kepada pembaca yang termotivasi. Tetapi mengingat bahwa tanggal 29 (meskipun tidak dikoreksi - tahun 2000 menyuntikkan bias di bawah rata-rata ke dalam data) mendapat skor rendah bahkan untuk standar Februari yang sudah rendah, saya mengasumsikan keyakinan yang relatif tinggi bahwa nol-hipotesa dari distribusi yang sama dapat ditolak.

Rick Moritz
sumber
1
Kumpulan data memiliki tanggal lahir 30 Februari dan 31. Itu lucu. Perlu pembersihan sebelum analisis, tetapi memiliki banyak data yang bagus.
Aksakal
22

Saya pikir jawaban untuk pertanyaan ini hanya bisa bersifat empiris. Setiap jawaban teoritis akan cacat tanpa memperhitungkan fenomena pemilihan ulang tahun, musim dll. Hal-hal ini tidak mungkin untuk ditangani secara teoritis.

Data ulang tahun sulit ditemukan di AS karena alasan privasi. Ada satu data anonim yang ditetapkan di sini . Itu dari aplikasi asuransi di AS. Perbedaan dari laporan lain, seperti artikel NYT yang sering dikutip , adalah bahwa artikel ini mencantumkan frekuensi kelahiran berdasarkan tanggal, bukan peringkat sederhana dalam sehari dalam setahun. Titik lemah tentu saja bias pengambilan sampel, karena berasal dari asuransi: orang yang tidak diasuransikan tidak termasuk dll.

Menurut data ada 325 kelahiran di 29 Februari dari total 481040. Menurut Roy Murphy , sampel mencakup dari 1981 hingga 1994. Ini termasuk 3 tahun kabisat dari total 14 tahun. Tanpa penyesuaian apa pun, probabilitasnya adalah 0,0675% dilahirkan pada 29 Februari antara 1981 dan 1994.

14/12pFo=325fL=3

Fo=fL/NFp,
N=14F=481040

pL1/4PL

PL=pLppLNfLFoF0.079%

p

p=NfLFoF0.32%

PLp

Tentu saja, diskusi ini adalah sentris AS. Siapa yang tahu apa pola di negara lain.

PEMBARUAN: Kami secara otomatis mengasumsikan bahwa OP adalah kalender Gregorian. Ini menjadi lebih menarik jika Anda mempertimbangkan kalender yang berbeda seperti kalender lunar Hijriah , di mana tahun kabisat adalah setiap 30 tahun atau lebih.

PEMBARUAN 2:

pFp=1,527Amitabh Chandra, Harvard University

Sekarang, seberapa besar kemungkinannya bahwa hari-hari yang sangat aneh dalam kalender Gregorian: 1 Januari, 25 Desember dan Deb 29 akan datang secara acak sebagai hari ulang tahun paling populer? Saya katakan itu sangat tidak mungkin kejadian acak. Oleh karena itu, bahkan lebih menarik untuk melihat apa yang terjadi di kalender lain seperti Hijriah.

PEMBARUAN 3:

PL,p

p^1/3660.27
P^Lp3663654+10.068

PEMBARUAN 4:

χ2

14365+3

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

KELUARAN:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

masukkan deskripsi gambar di sini

Aksakal
sumber
3
Ini adalah analisis yang berguna (+1). Itu membuat saya bertanya-tanya tentang hubungan apa yang ada, jika ada, antara frekuensi yang Anda analisis dan probabilitas (samar-samar didefinisikan) yang diminta dalam pertanyaan.
whuber
1
@whuber, probabilitas dalam jawaban saya adalah untuk kasus-kasus seperti analisis aplikasi asuransi atau beberapa data pengguna. Misalnya, Anda memiliki situs web dan ingin menandai data pengguna yang bermasalah. Anda dapat membandingkan frekuensi ulang tahun 29 Februari dengan probabilitas saya. Namun, jika Anda merencanakan keluarga dan menanyakan pertanyaan ini, maka nomor saya tidak berguna, cukup banyak. Alasannya adalah karena mereka tidak memperhitungkan faktor-faktor seperti kapan tepatnya pasangan tersebut benar-benar bersetubuh atau kesuburan dan pola menstruasi pasangan, misalnya, yang merupakan penentu utama dari tanggal hari kelahiran.
Aksakal
Senang melihat Anda tidak memulai dengan matematika sebelum mempertimbangkan faktor-faktor lain, di luar statistik murni
TheBlastOne
8

Sampul buku favorit saya pernah memberikan beberapa bukti yang sangat relevan terhadap asumsi alokasi kelahiran yang seragam hingga saat ini. Khususnya bahwa kelahiran di AS sejak tahun 1970 menunjukkan beberapa tren yang saling mempengaruhi: tren yang panjang, multi-dekade, tren non-periodik, tren hari-hari, tren hari-tahun, tren liburan (karena prosedur seperti sesar bagian memungkinkan seseorang untuk secara efektif menjadwalkan tanggal lahir, dan dokter sering tidak melakukannya pada hari libur). Hasilnya adalah bahwa kemungkinan dilahirkan pada hari yang dipilih secara acak dalam satu tahun tidak seragam, dan karena tingkat kelahiran bervariasi antara tahun, tidak semua tahun sama-sama kemungkinan.

Ini juga memberikan bukti bahwa solusi Asksal, meskipun merupakan pesaing yang sangat kuat, juga tidak lengkap. Sejumlah kecil hari kabisat akan "terkontaminasi" oleh semua efek yang dimainkan di sini, jadi perkiraan Asksal juga menangkap (cukup tidak sengaja) efek dari hari-of-minggu dan tren jangka panjang bersama dengan 29 Februari efek. Efek mana yang dan tidak sesuai untuk dimasukkan tidak secara jelas ditentukan oleh pertanyaan Anda.

Dan analisis ini hanya berpengaruh pada AS, yang memiliki tren demografis yang mungkin sangat berbeda dari negara atau populasi lain. Angka kelahiran Jepang telah menurun selama beberapa dekade, misalnya. Tingkat kelahiran Tiongkok diatur oleh negara, dengan beberapa konsekuensi untuk komposisi gender negaranya dan karenanya tingkat kelahiran pada generasi berikutnya.

Demikian juga, analisis Gelman hanya menggambarkan beberapa dekade terakhir, dan belum tentu jelas bahwa ini bahkan merupakan era yang menarik bagi pertanyaan Anda.

masukkan deskripsi gambar di sini

Bagi mereka yang bersemangat tentang hal semacam ini, materi di sampul dibahas panjang lebar dalam bab tentang proses Gaussian.

Sycorax berkata Reinstate Monica
sumber
2
Penjelasan singkat tentang model yang digunakan juga tersedia di posting blog di sini: andrewgelman.com/2012/06/19/…
Sakari Cajanus
3

29 Februari adalah tanggal yang terjadi setiap tahun yang merupakan kelipatan dari 4 .

Namun tahun yang merupakan kelipatan dari 100 tetapi bukan salah satu dari 400, tidak dianggap sebagai tahun kabisat (Misalnya: 1900 bukan tahun kabisat sementara tahun 2000 atau 1600 adalah). Oleh karena itu, saat ini, itu adalah pola yang sama setiap 400 tahun.

Jadi mari kita lakukan matematika pada interval [0; 400 [ :

Pada periode 400 tahun, ada tepat 4 x 25 = 100 tahun yang merupakan kelipatan dari 4 . Tetapi kita harus mengurangi 3 (kelipatan tahun 100 tetapi tidak 400) dari 100, dan kita mendapatkan 100 - 3 = 97 tahun.

Sekarang kita harus mengalikan 97 dengan 366, 97 x 366 = 35502 (jumlah hari dalam satu tahun kabisat dalam periode 400 tahun), itu tetap (365 x (400-97)) = 110 595 (jumlah hari yang datang ' t dalam satu tahun kabisat dalam periode 400 tahun).

Maka kita hanya perlu menambahkan dua angka ini untuk mengetahui jumlah hari dalam periode 400 tahun: 110 595 + 35502 = 146 097 .

Untuk menyelesaikannya, probabilitas kami adalah jumlah 29 Februari dalam periode 400 tahun sehingga 97 mengingat bahwa ada 97 tahun kabisat dibagi dengan jumlah hari interval kami:

p = 97/146097 ≈ 0,0006639424492

Semoga ini benar dan jelas.

Jonathan Poid
sumber
7
Ini adalah analisis yang bagus tentang kemungkinan bahwa tanggal yang dipilih secara acak adalah tanggal 29 Februari. Saya percaya sebagian besar diskusi dalam utas ini berfokus pada fakta bahwa ini tidak benar-benar menjawab pertanyaan tentang peluang kelahiran, yang tidak benar-benar berperilaku seperti penarikan acak dari rangkaian hari-hari yang mungkin.
whuber
1
Cara yang jauh lebih mudah adalah dengan mengatakan bahwa ada 97 tahun kabisat per 400 tahun dengan cara yang telah Anda lakukan. Hitung jumlah hari dalam 400 tahun normal. 400 * 365 = 146000. Maka Anda perlu menambahkan 97 hari kabisat dengan 146097.
CJ Dennis
2

Saya percaya ada dua pertanyaan yang tercampur di sini. Yang satu adalah "Berapa probabilitas hari tertentu menjadi 29 Februari?". Yang kedua adalah (dan yang sebenarnya bertanya) "Berapa probabilitas dilahirkan pada hari kabisat?"

p=971460970,00066394

3149740097400143=6796001.131667

01

data_enthusiast
sumber
2
Errr, saya sudah siap untuk memilih ini, dan kemudian saya pergi ke Yah, bagi siapa pun yang sudah lahir itu mudah. Bisa 0 atau 1. Tidak.
mattdm
Saya kira ini sedikit bergantung pada interpretasi probabilitas. Anggaplah saya telah melempar koin. Saya melihatnya dan mengetahui hasilnya (misalnya kepala). Anda berdiri di sebelah saya, tetapi belum melihat hasilnya. Berapa probabilitas koin menunjukkan kepala (untuk Anda, bagi saya, "secara objektif")? Dalam contoh di atas: untuk orang yang diberikan (lahir) probabilitasnya adalah 0 atau 1 (dengan asumsi dia tahu tanggal berapa dia dilahirkan). Jika Anda memilih seseorang secara acak dan Anda harus menebak hari ulang tahunnya, kemungkinan menjadi 29 Februari adalah pertanyaan empiris.
data_enthusiast
1

Saya perhatikan bahwa sebagian besar jawaban di atas berhasil dengan menghitung jumlah hari kabisat dalam periode tertentu. Ada cara yang lebih sederhana untuk mendapatkan jawabannya, 100% akurat, menurut definisi:

Kami menggunakan tahun kabisat untuk menyesuaikan kalender reguler (365 hari) ke tahun tropis rata-rata (alias tahun matahari rata-rata). Tahun tropis rata-rata "adalah waktu yang dibutuhkan Matahari untuk kembali ke posisi yang sama dalam siklus musim, seperti yang terlihat dari Bumi" (Wikipedia). Tahun tropis sedikit bervariasi, tetapi rata-rata (rata-rata) tahun tropis adalah TENTANG 365.24667.

Jika hari kabisat benar, maka kemungkinan hari yang dipilih secara acak menjadi hari kabisat, adalah ((tahun tropis) - (bukan tahun kabisat)) / tahun tropis

Menghubungkan jumlah perkiraan yang kita miliki, itu (365.24667-365) /365.24667, atau 0.24667 / 365.24667, atau 675 per juta (0,0675%).

Namun, ini untuk hari yang dipilih secara acak. Saya membayangkan bahwa ini secara substansial condong oleh orang tua yang lebih suka tidak perlu menjelaskan kepada anak-anak mereka, "Ulang tahun Anda yang sebenarnya hanya datang sekali per 4 tahun".

AMADANON Inc.
sumber
3
Saya tidak berpikir ini menjawab pertanyaan yang diajukan, karena hari kabisat, 29 Februari, hanya ada di sistem kalender tertentu. Sistem kalender itu hanya digunakan dalam masyarakat tertentu selama era sejarah baru-baru ini. Misalnya, pertanyaan ini tidak dapat dipahami oleh seseorang yang menganggap waktu menggunakan kalender Ibrani, yang sama sekali tidak memiliki "Februari"! Selain itu, bahkan jika kita mengasumsikan kalender dengan hari kabisat, itu masih tidak menyelesaikan ketidakpastian seputar distribusi probabilitas kelahiran ke hari.
Sycorax berkata Reinstate Monica
@ user777, itu tidak relevan. Jika Anda termasuk dalam budaya yang tidak mengenali hari kabisat, masih akan ada individu yang lahir pada hari kabisat kami .
Octopus
1
@Octopus Tidak jika mereka lahir sebelum Oktober 1582, bulan di mana kalender Gregorian diperkenalkan. Pertanyaannya tidak cukup spesifik untuk memungkinkan seseorang membedakan populasi mana yang sedang dipertimbangkan, itulah sebabnya komentar saya sangat relevan.
Sycorax berkata Reinstate Monica
@ user777, Anda rambut rontok. Intinya adalah kalender Gregorian ada hari ini dan dapat digunakan untuk menempatkan setiap hari dalam sejarah, terlepas dari apakah mereka mengamatinya pada waktu itu.
Octopus
1
@Octopus Bagaimana Anda tahu itu intinya?
Sycorax berkata Reinstate Monica
-4

Saya bertanya kepada saudara perempuan saya, yang hari ulang tahunnya 29 Februari, dan dia berkata, "Hasil studi empiris saya sendiri adalah bahwa itu adalah 1,00, jelas."

John Smith
sumber
Sepertinya itu tidak dihargai. Dicatat.
John Smith