Dengan kata lain, berdasarkan hal berikut, apa itu p?
Untuk menjadikan ini masalah matematika daripada antropologi atau ilmu sosial, dan untuk menyederhanakan masalah, asumsikan bahwa pasangan dipilih dengan probabilitas yang sama di seluruh populasi, kecuali bahwa saudara kandung dan sepupu pertama tidak pernah kawin, dan pasangan selalu dipilih dari yang sama generasi.
- - populasi awal
- - jumlah generasi.
- - jumlah rata-rata anak per pasangan. (Jika perlu untuk jawabannya, anggaplah bahwa setiap pasangan memiliki jumlah anak yang persis sama.)
- - persentase orang yang tidak memiliki anak, dan yang tidak dianggap sebagai bagian dari pasangan.
- - populasi pada generasi akhir. (Entah atau harus diberikan, dan (saya pikir) yang lain dapat dihitung.)
- - probabilitas seseorang dalam generasi akhir menjadi keturunan orang tertentu pada generasi awal.
Variabel-variabel ini dapat diubah, dihilangkan, atau ditambahkan, tentu saja. Saya mengasumsikan untuk kesederhanaan bahwa dan tidak berubah seiring waktu. Saya menyadari ini akan mendapatkan perkiraan yang sangat kasar, tetapi ini adalah titik awal.
Bagian 2 (saran untuk penelitian lebih lanjut):
Bagaimana Anda dapat mempertimbangkan bahwa pasangan tidak dipilih dengan probabilitas yang seragam secara global? Pada kenyataannya, pasangan lebih cenderung memiliki wilayah geografis yang sama, latar belakang sosial ekonomi, ras, dan latar belakang agama. Tanpa meneliti probabilitas aktual untuk ini, bagaimana variabel untuk faktor-faktor ini ikut bermain? Seberapa pentingkah ini?
homework
tag. Lebih baik bagi semua yang terlibat untuk membiarkan OP melakukan itu. Anda mungkin tertarik pada utas meta ini jika Anda belum melihatnya.Jawaban:
Karena pertanyaan ini menerima jawaban yang bervariasi dari yang kecil hingga hampir 100%, saya ingin menawarkan simulasi untuk dijadikan referensi dan inspirasi untuk solusi yang lebih baik.
Saya menyebutnya "plot api." Masing-masing mendokumentasikan penyebaran materi genetik dalam suatu populasi saat ia bereproduksi dalam generasi yang berbeda. Plot adalah array segmen vertikal tipis yang menggambarkan orang. Setiap baris mewakili generasi, dengan yang mulai di atas. Keturunan setiap generasi berada di barisan tepat di bawahnya.
Pada awalnya, hanya satu orang dalam populasi berukurann ditandai dan plot berwarna merah. (Sulit dilihat, tetapi mereka selalu diplot di sebelah kanan barisan paling atas.) Keturunan langsung mereka juga digambarkan dalam warna merah; mereka akan muncul dalam posisi yang sepenuhnya acak. Keturunan lainnya diplot sebagai putih. Karena ukuran populasi dapat bervariasi dari satu generasi ke generasi berikutnya, perbatasan abu-abu di sebelah kanan digunakan untuk mengisi ruang kosong.
Berikut ini adalah 20 hasil simulasi independen.
Materi genetik merah akhirnya mati dalam sembilan dari simulasi ini, meninggalkan yang selamat di 11 yang tersisa (55%). (Dalam satu skenario, bagian kiri bawah, sepertinya seluruh populasi akhirnya mati.) Di mana pun ada yang selamat, hampir semua populasi mengandung materi genetik merah. Ini memberikan bukti bahwa peluang individu yang dipilih secara acak dari generasi terakhir yang mengandung gen merah adalah sekitar 50%.
Simulasi ini bekerja dengan secara acak menentukan angka bertahan hidup dan angka kelahiran rata-rata pada awal setiap generasi. Survivorship diambil dari distribusi Beta (6,2): rata-rata 75%. Angka ini mencerminkan angka kematian sebelum dewasa dan orang-orang yang tidak memiliki anak. Tingkat kelahiran diambil dari distribusi Gamma (2,8, 1), sehingga rata-rata 2,8. Hasilnya adalah kisah brutal kapasitas reproduksi yang tidak mencukupi untuk mengimbangi kematian yang umumnya tinggi. Ini mewakili model kasus terburuk yang sangat pesimistis - tetapi (seperti yang telah saya kemukakan dalam komentar) kemampuan populasi untuk tumbuh tidaklah penting. Yang penting di setiap generasi adalah proporsi merah dalam populasi.
Untuk memodelkan reproduksi, populasi saat ini dipersempit menjadi korban dengan mengambil sampel acak sederhana dari ukuran yang diinginkan. Penyintas ini dipasangkan secara acak (penyintas aneh yang tersisa setelah berpasangan tidak dapat mereproduksi). Setiap pasangan menghasilkan sejumlah anak yang diambil dari distribusi Poisson yang rata-rata adalah tingkat kelahiran generasi. Jika salah satu dari orang tua berisi spidol merah, semua anak mewarisinya: ini memodelkan gagasan keturunan langsung melalui salah satu orangtua.
Contoh ini dimulai dengan populasi 512 dan menjalankan simulasi selama 11 generasi (12 baris termasuk awal). Variasi dari simulasi ini dimulai dengan sesedikit dan sebanyak 2 14 = 16 , 384 orang, menggunakan jumlah yang berbeda dari tingkat kesintasan dan kelahiran, semuanya menunjukkan karakteristik yang serupa: pada akhir log 2 ( n ) generasi (sembilan) dalam kasus ini), ada sekitar 1/3 peluang bahwa semua merah telah mati, tetapi jika tidak, maka mayoritas populasi adalah merah. Dalam dua atau tiga generasi lagi, hampir semua populasi berwarna merah dan akan tetap merah (atau populasi akan mati sama sekali).n=8 214=16,384 log2(n)
Omong-omong, bertahannya 75% atau kurang dalam satu generasi tidaklah fantastis. Pada akhir 1347, tikus-tikus yang diserang oleh penyakit pes pertama-tama berjalan dari Asia ke Eropa; selama tiga tahun berikutnya, di suatu tempat antara 10% dan 50% dari populasi Eropa mati sebagai akibatnya. Tulah ini kambuh hampir sekali dalam satu generasi selama ratusan tahun sesudahnya (tetapi biasanya tidak dengan kematian ekstrim yang sama).
Kode
Simulasi dibuat dengan Mathematica 8:
sumber
randomPairs
dannext
pada data uji, fungsinya akan menjadi jelas. Perhatikan penggunaanNestList
untuk beralihnext
untuk menghasilkan beberapa generasi.Apa yang terjadi ketika Anda mencoba menghitung leluhur?
Anda memiliki 2 orang tua, kakek-nenek 4, 8 kakek-nenek besar, ... Jadi, jika Anda kembali generasi maka Anda memiliki 2 n nenek moyang. Mari kita asumsikan panjang generasi rata-rata 25 tahun. Lalu ada sekitar 28 generasi sejak 1300, yang memberi kita sekitar 268 juta leluhur pada waktu itu.n 2n 25 28
Ini adalah stadion baseball yang tepat, tetapi ada yang salah dengan perhitungan ini, karena populasi Bumi pada tahun 1300 tidak bercampur secara seragam, dan kami mengabaikan perkawinan campur dalam "pohon" leluhur Anda, yaitu kami menghitung dua kali beberapa leluhur.
Namun, saya pikir, ini dapat mengarah pada batas atas yang benar pada probabilitas bahwa orang yang dipilih secara acak pada tahun 1300 adalah leluhur Anda dengan mengambil rasio terhadap populasi pada tahun 1300228
sumber
Semakin jauh Anda pergi, semakin besar kemungkinan Anda berhubungan dengan seseorang yang berhasil meneruskan gen mereka yang hidup pada masa itu. Dari 1/4 miliar leluhur yang Anda miliki yang hidup pada tahun 1300, banyak dari mereka akan muncul ratusan (jika tidak ribuan, jutaan) kali di silsilah keluarga Anda. Penyimpangan genetik dan berapa kali kita berhubungan langsung dengan seseorang cenderung lebih relevan dengan perbedaan dalam kode genetik kita daripada siapa leluhur kita.
sumber
Probabilitasnya adalah = 1-z, setiap keturunan dalam masalah ini terkait dengan leluhur di atas. Berapapun tingkat reproduksi awal (1-z) adalah probabilitas Anda untuk menjadi keturunan dari seseorang dalam populasi awal. Satu-satunya kemungkinan yang tidak pasti adalah peluang hidup dalam populasi akhir.
Saya setuju dengan jawaban Erad, meskipun saya sekarang berpikir itu menjawab pertanyaan yang tidak ditanyakan - yaitu berapa probabilitas Anda masih hidup mengingat kendala reproduktif dan populasi tertentu yang diketahui mengenai pembawa depan Anda.
sumber
My updated short answer is:
Answer explained:
Given a particular person today, it is certain that they are a descendant of at least 2 people in 1300.
When picking a particular person in 1300, there is (1-z) chance that person never reproduced, and the other term is for the number of 'parent couples', and the probability for the person to be related to this couple (1 / number of couples).
The (1-z) ends up cancelling out, leaving us with
Now just for fun but not necessary for solving the probability question
Here is the population of any given generation k in the chain between then and today.
Lets plug in some numbers as an example. For assumptions, I use:
g = 28 (25-year generations between 1300 and 2011)
n = 360M (world population estimate in 1300 from wikipedia)
z = 0.2, c = 2.77=8 (not real data, but does end up with about 7B people in 2011)
Resulting in:
Thanks for reading, Erad
sumber
This is a very interesting question as it is asking us to mathematically solve a fractal. Such as the famous game of life.
The % of the population which each generation related to will grow over each iteration, starting atp1=2n1 and at the limit generation will approach limk→∞pk=(1−z) .
If we denotepk as the probability of someone in generation k to be related to the initial population. And for simplicity lets relax the siblings & cousins rule (can be added later). Then:
As each person in the new generation has exactly 2 ancestors in the initial population.
With each generation, the probability to be related to someone at the initial population will undoubtedly grow, but at a decreasing pace. This is because the probability to draw "relatives" which are coming from the same or similar tree will grow.
Lets use ethnicity as an example. Lets say we know for a fact someone is 100% Caucasian. At generation 28 he is most likely related to a significant portion of the Caucasian population in 1300 (As shown by @whuber simulation). Lets say he is marrying someone who is 100% of a different ethnicity. Their offspring will be linked to approximately double the number of people they are linked to from 1300.
Another interesting thought is that given the human (homosapien) race started from ~600 people in Africa, then we are most likely a genetic permutation of all of them who successfully mated.
sumber