Apakah ada seseorang yang lebih cepat dari Usain Bolt saat ini?

12

EDIT: Saya lebih tertarik pada masalah teknis dan metodologi untuk menentukan kemungkinan maksimum "benar" dalam populasi tertentu yang diberikan sampel statistik. Ada masalah dengan memperkirakan kemungkinan pelari yang lebih cepat daripada Tn. Bolt dari waktu dasbor yang mengatur rekor yang jelas dan halus. Humor saya dengan membayangkan ini tidak terjadi.


Baut Usain adalah manusia tercepat yang diukur untuk dash 100m. Namun, mengingat sejumlah kecil atlet, nampaknya manusia tercepat hidup "sejati" itu duduk di sofa di suatu tempat dan tidak pernah mencoba karier lari yang kompetitif.

Saya mencoba menggunakan fakta bahwa perbedaan antara sampel pada ekor distribusi normal menjadi lebih kecil dan lebih kecil. Saya menggunakan ini untuk menghitung kemungkinan ada seseorang yang lebih cepat dari Usain Bolt dengan membandingkan Usain dengan yang tercepat ke-2, tercepat ke-3 dan seterusnya.

Untuk melakukan ini, saya mencoba menghitung nilai terbesar yang ada di luar "Usain Bolt" dengan mengambil turunan dari CDF distribusi normal sehubungan dengan y , menaikkannya ke n (di mana n adalah sekitar 7.000.000.000 atau jumlah sampel kurang dari "maksimum" - logika di balik ini dijelaskan dalam halaman Wikipedia Tank Jerman yang menggeneralisasi di antara distribusi yang berbeda), misalnya:

0yfYN(y)dy=λn0y[12[1+erf(yμσ2)]]n112πσ2e(yμ)22σ2dy

  1. Apakah ini cara yang valid untuk menghitung probabilitas bahwa ada seseorang yang lebih cepat daripada Usain Bolt?

  2. Apakah ada nama untuk pertanyaan semacam ini di luar "Masalah Tank Jerman untuk distribusi lainnya"

  3. Apakah ada cara yang baik untuk memperkirakan standar deviasi dari sampel ekstrim dari suatu distribusi? Menemukan informasi tentang garis 100 m tercepat sepanjang masa itu mudah, menemukan rata-rata & variasi sulit)

Terima kasih atas kesabaran Anda dalam berurusan dengan programmer tanpa latar belakang topik.

ŹV -
sumber
2
Anda membuat asumsi bahwa apakah Anda seorang atlet tidak tergantung pada kecepatan lari Anda. Yang mana ok, tapi dipertanyakan.
bayerj
@bayerj Ya, saya pikir cukup jelas bahwa ini akan menjadi cara yang sangat buruk untuk memprediksi penantang Olimpiade berikutnya. Namun, sepertinya pertanyaan yang menarik secara umum dan saya mencoba menjawabnya dengan kemampuan terbaik saya dengan harapan bahwa seseorang mengasihani dan membantu saya.
ŹV -
1
Saya menemukan pertanyaan yang salah karena kualitas menjadi "cepat (er)", di sini, mengacu pada potensi genetik atau bakat atletik dan bukan kapasitas aktual untuk mencapai kecepatan tinggi.
Digio
@Digio Ganti "lebih cepat" dengan "memiliki nomor seri lebih tinggi" dengan asumsi beberapa perusahaan "Fubarco" membuat seperangkat produk dengan nomor seri yang didistribusikan secara normal.
ŹV -
1
Memotivasi pertanyaan dengan contoh pada umumnya adalah hal yang baik untuk dilakukan. Namun, contoh ini tampaknya mengalihkan perhatian orang dari apa yang sebenarnya ingin Anda tanyakan. Bisakah Anda mengedit ini untuk membahas situasi yang sebenarnya Anda hadapi?
gung - Reinstate Monica

Jawaban:

2

Bertentangan dengan jawaban lain, saya berpendapat bahwa Anda dapat mengatakan sesuatu tentang kemampuan Baut mengingat data yang tersedia. Pertama-tama, mari kita persempit pertanyaan Anda. Anda bertanya tentang manusia tercepat, tetapi karena ada perbedaan dalam distribusi kecepatan lari untuk pria dan wanita, di mana pelari wanita terbaik wanita tampaknya sedikit lebih lambat dari pelari pria terbaik, kita harus fokus pada pelari pria. Untuk mendapatkan beberapa data, kita bisa melihat kinerja tahun terbaik dalam 100 dijalankan dari 45 tahun terakhir . Ada beberapa hal yang perlu diperhatikan tentang data ini:

  • Itu adalah waktu lari terbaik, jadi mereka tidak memberi tahu kita tentang kemampuan semua manusia, tetapi tentang kecepatan minimal yang dicapai.
  • Kami berasumsi bahwa data ini mencerminkan sampel pelari terbaik di dunia. Sementara itu mungkin terjadi bahwa ada pelari yang lebih baik yang tidak berpartisipasi dalam kejuaraan, asumsi ini tampaknya cukup masuk akal.

Pertama, mari kita bahas bagaimana tidak menganalisis data ini. Anda dapat memperhatikan bahwa jika kami merencanakan waktu berjalan dengan waktu, kami akan mengamati hubungan linier yang kuat.

Waktu lari terbaik vs waktu

Ini dapat mengarahkan Anda untuk menggunakan regresi linier untuk memperkirakan seberapa banyak pelari yang lebih baik yang dapat kita amati di tahun-tahun mendatang. Namun ini akan menjadi ide yang sangat buruk , yang tidak terhindarkan akan membawa Anda pada kesimpulan bahwa dalam sekitar dua ribu tahun manusia akan dapat berlari 100 meter dalam nol detik, dan setelah itu mereka akan mulai mencapai waktu berjalan negatif! Ini jelas tidak masuk akal, karena kita dapat membayangkan bahwa ada semacam batas biologis dan fisik dari kapasitas kita, yang tidak kita ketahui.

X 1 , X 2 , ... , X n Y i Z 1 , Z 2 , ... , Z k - Z iY=max(X1,X2,,Xn)X1,X2,,XnYiZ1,Z2,,ZkZiIkuti distribusi GEV untuk minimas. Jadi kita bisa menyesuaikan distribusi GEV dengan data kecepatan lari, yang mengarah ke kecocokan yang cukup bagus (lihat di bawah).

Distribusi GEV untuk kecepatan lari

Jika Anda melihat distribusi kumulatif yang disarankan oleh model, Anda akan melihat bahwa waktu berjalan terbaik oleh Usain Bolt adalah yang terendah1%ekor distribusi. Jadi jika kita berpegang pada data ini, dan analisis contoh mainan ini, kita akan menyimpulkan bahwa waktu berlari yang jauh lebih kecil tidak mungkin (tapi jelas, mungkin). Masalah yang jelas dengan analisis ini adalah bahwa mengabaikan fakta bahwa kami melihat peningkatan tahun-ke-tahun dari waktu berjalan terbaik. Ini membawa kita kembali ke masalah yang dijelaskan di bagian pertama jawaban, yaitu mengasumsikan model regresi di sini berisiko. Hal lain yang dapat ditingkatkan adalah bahwa kita dapat menggunakan pendekatan Bayesian dan mengasumsikan informatif sebelumnya yang akan menjelaskan beberapa pengetahuan out-of-data tentang waktu berjalan fisiologis mungkin, yang mungkin belum diamati (tapi, sejauh yang saya tahu, ini tidak diketahui saat ini). Akhirnya, teori nilai ekstrim serupa sudah digunakan dalam penelitian olahraga, misalnya oleh Einmahl dan Magnus (2008) dalamCatatan dalam Atletik Melalui makalah Teori Nilai Ekstrim .

Anda dapat memprotes bahwa Anda tidak bertanya tentang probabilitas waktu berlari yang lebih cepat, tetapi tentang probabilitas mengamati pelari yang lebih cepat. Sayangnya, di sini kita tidak bisa berbuat banyak karena kita tidak tahu berapa probabilitas seorang pelari akan menjadi atlet profesional dan waktu lari yang tercatat akan tersedia baginya. Ini tidak terjadi secara acak dan ada banyak faktor yang berkontribusi pada kenyataan bahwa beberapa pelari menjadi atlet profesional dan beberapa tidak (atau bahkan seseorang suka berlari dan berlari sama sekali). Untuk ini, kita harus memiliki data rinci populasi-lebar tentang pelari, apalagi karena Anda bertanya tentang ekstrem distribusi, data harus sangat besar. Jadi, saya setuju dengan jawaban yang lain.

Tim
sumber
1

Naluri pertamaku adalah ini adalah ide yang buruk, tetapi biarkan aku merinci sedikit alasannya.

1) Anda ingin mengukur variabel yang tidak dapat diobservasi, keterampilan berlari laten, dengan variabel yang dapat diamati, mencatat waktu berlari. Tidak apa-apa, tapi: Dalam masalah tank Jerman, nomor seri semuanya dihasilkan dari distribusi seragam yang sama. Dalam masalah Anda, Anda harus menyimpulkan keterampilan variabel laten (dari 7 miliar orang) dari waktu berjalan variabel yang dapat diamati. Dalam GTP, beberapa nomor seri diketahui. Dalam masalah Anda, Anda tidak mengumpulkan data sama sekali dan hanya berjalan maksimal (Baut). Selain itu, Anda tampaknya menganggap bahwa keterampilan laten yang tidak dapat diobservasi ini tidak berkorelasi dengan waktu berlari aktual ke titik di mana mungkin seseorang yang belum pernah berlari sama sekali lebih baik daripada Bolt. Sepertinya tidak masuk akal!

2) Atlet bukan sampel acak dari populasi. Mereka dipilih dengan hati-hati oleh banyak percobaan. Jika kita berasumsi bahwa setiap orang yang mampu berlari sama sekali mungkin telah memacu seseorang setidaknya sekali dalam hidup mereka dan bahwa setiap orang telah membuat keputusan apakah mereka harus melanjutkan ke tingkat kompetisi yang lebih tinggi berdasarkan seberapa sering atau seberapa banyak mereka memenangkan ini. ras --- maka tampaknya tidak masuk akal bahwa Bolt benar-benar manusia tercepat yang ada.

Ini hanya alasan pertama yang muncul di pikiran. Jujur saja, Anda sedikit suruh dalam urusan ini. Tidak ada cara untuk mengukur "probabilitas" dari jenis hal yang Anda bicarakan.

degenerasi goni
sumber
Responden lain membuat pernyataan yang sama dan tidak diragukan lagi bahwa memperkirakan kemungkinan ada seseorang lebih cepat daripada Tuan Bolt atas dasar ini sangat cacat. Juga akan lebih menarik untuk mengetahui apakah logika teknis prediksi berdasarkan nilai-nilai ekstrem ini pada prinsipnya benar.
ŹV -
3
Saya akan menyarankan mengabstraksi pertanyaan kemudian untuk mendapatkan inti dari apa yang sebenarnya Anda coba tanyakan, karena konteksnya akan menciptakan banyak gangguan. Bagi saya masih belum jelas apa yang dimaksud dengan "distribusi normal" yang Anda maksudkan. Waktu menjalankan yang sebenarnya? Kemampuan lari atlet?
degenerate hessian
-2

Jawabannya adalah tidak.

Anda mengasumsikan bahwa ada sampel dari populasi (atlet), dan Bolt adalah maks pada sampel ini. Jadi, Anda mencari probabilitas bahwa jumlah populasi lebih besar dari jumlah sampel. Itu hipotesis Anda.

Bagaimana jika anggapan Anda salah, dan bahwa sampel itu memang populasi?

Saya dapat membuat argumen yang masuk akal bahwa setiap orang yang dapat berlari memiliki kesempatan untuk mengalahkannya. Tidak ada yang melakukannya, jadi dia adalah max sebenarnya dari populasi Bumi.

Jelas bahwa para atlet bukan sampel acak. Saya harap tidak ada pertanyaan tentang ini. Tentu saja ada tingkat keacakan bagaimana seseorang menjadi atlet. Di sisi lain, jika seseorang bukan atlet maka keterampilan dan prestasi atletiknya tidak akan dibandingkan dengan atlet. Saya bisa menganggap bahwa seseorang BISA POTENSI berlari lebih cepat dari Bolt mengingat semua kondisi untuk pelatihan DAN MEMILIKI dilatih sekeras Bolt. Namun, itu adalah probabilitas nol bahwa Anda menarik non atlet dan dia mengalahkan Bolt dalam 100m dasbor di bawah kondisi trek dan lapangan.

Aksakal
sumber
Saya lebih tertarik pada metodologi di balik itu benar, bayangkan Tanks yang nomor seri biasanya didistribusikan tanpa duplikat mungkin :)
ŹV -