Analisis statistik elang yang menghilang

8

Ringkasan nasib tag oleh model tag

Elang yang ditandai oleh satelit akan hilang di Skotlandia, dan tabel di atas menunjukkan nasib tag menurut model tag. Saya terutama tertarik pada tag yang "Dihentikan - tidak ada kerusakan", karena mungkin saja burung-burung ini juga dibunuh dan mayat serta tag dibuang.

Saya telah melihatnya menyatakan bahwa tabel ini dan tabel ini sendiri adalah bukti bahwa "Bahkan dengan analisis statistik paling jauh, jelas bahwa ada hubungan antara" Berhenti - Tidak Ada Kerusakan "dan jenis tag yang digunakan" Jadi pertanyaan saya adalah, bisakah ini pernyataan didukung?

42/135  (31%) tags stopped for all types 
 8/17   (47%) tags stopped for 80NS     
29/77   (38%) tags stopped for 70GPS    
 3/22   (14%) tags stopped for 105GPS   
 2/13   (15%) tags stopped for 70GSM    
 0/6     (0%) tags stopped for 95BTOGSM 

Jadi saya kira pernyataan itu benar jika tingkat kegagalan 80NS 47% secara signifikan lebih buruk daripada rata-rata global 31%. Dan itu tidak akan benar jika probabilitas mendapatkan 8 kegagalan dalam sampel acak dari 17 tag dari 135 itu sebenarnya cukup tinggi. Lebih abstrak lagi, jika ada 42 bola hitam dan 93 bola putih di dalam tas dan saya memilih 17 secara acak, berapa probabilitas saya memilih 8 bola hitam dan 9 bola putih?

Saya dapat menghitung kemungkinan 8 yang pertama menjadi hitam (42/135) * (41/134) dll. Tapi saya buntu ketika mencoba mencari tahu kemungkinan 8 dari 17 menjadi hitam.


EDIT: Tag satelit dilampirkan ke burung selama periode 13 tahun, 2004 hingga 2016. Tabel ini menunjukkan 131 tag daripada 135. 4 tag dikeluarkan karena mereka tidak dapat memastikan lokasi penyebaran yang tepat dari empat tag awal.

Jenis tag menurut tahun tag

Berikut adalah tabel lain dari laporan yang menunjukkan beberapa data tentang masa pakai tag 70GPS / 70GSM:

Menghentikan durasi operasi tidak ada kerusakan tag

Colin
sumber
2
Colin, pertanyaan Anda tidak memiliki variabel kunci: waktu sejak tag diterapkan. Mungkin juga variabel lain mungkin dikacaukan dengan model tag: misalnya, mungkin model yang berbeda digunakan pada spesies yang berbeda, atau burung dengan ukuran berbeda, atau ada yang lebih tua dan beberapa lebih muda. Dengan asumsi, kemudian, bahwa ini adalah masalah nyata yang benar-benar diperhatikan, pertimbangkan untuk memasukkan data tersebut dalam analisis Anda.
whuber
2
@Antoine, saya bisa mengerti mengapa Anda berpikir itu adalah pekerjaan rumah, tapi saya khawatir sekarang saya terlalu tua untuk mengerjakan pekerjaan rumah. Ini adalah masalah dunia nyata yang saya minati. Sebagian karena saya tertarik pada statistik dan penyalahgunaan statistik, dan sebagian karena saya tidak suka penganiayaan raptor. Ini adalah posting pertama saya di area statistik pertukaran stack, jadi jika tidak sesuai, saya minta maaf
Colin
5
Sama sekali tidak pantas! Kami hanya mendapatkan banyak orang yang menempelkan pekerjaan rumah mereka dan sepertinya mengharapkan kami untuk menjawabnya untuk mereka, jadi ada beberapa sensitivitas di sekitar itu. Tetapi sebagai pertanyaan NYATA, ini pasti pada topik.
jbowman
2
Jika Anda tidak keberatan, tinggalkan tabel waktu. Ini menambah tantangan menarik untuk pertanyaan. Apakah Anda tahu tahun berapa tag hilang? Idealnya, kita dapat menghubungkan lampiran, nasib, & jenis yang sesuai untuk setiap tag.
gung - Reinstate Monica
1
Untuk pertanyaan Anda: "Bisakah pernyataan itu didukung?" Saya akan menjawab ya, itu bisa. Namun, hubungannya bukan sebab-akibat, ada faktor pembaur yang jelas seperti usia perangkat yang tidak dapat dikendalikan. Untuk pernyataan apa pun "jelas untuk melihat hubungan kausal ini dan itu", seseorang tidak perlu menjawab dengan inferensi kausal yang tepat yang menunjukkan kesimpulan yang berlawanan. Orang hanya harus menemukan variabel perancu yang mengancam identifikasi hubungan sebab akibat ini. Sekarang, jika tujuan Anda adalah melakukan inferensi kausal yang tepat, itu adalah cerita yang berbeda.
dv_bn

Jawaban:

0

Saya menemukan cara untuk mendapatkan jawaban saya dari komentar ini " lihat distribusi hypergeometrik " di math.stackexchange:

Dari entri Wikipedia tentang distribusi hypergeometric

Dalam teori dan statistik probabilitas, distribusi hypergeometrik adalah distribusi probabilitas diskrit yang menggambarkan probabilitas keberhasilan k (penarikan acak yang objeknya digambarkan memiliki fitur tertentu) dalam n gambar, tanpa penggantian.

Kemudian, menggunakan Kalkulator Hypergeometrik online dan gambar-gambar berikut:

Populasi: 135

Jumlah keberhasilan dalam populasi: 42

Ukuran sampel: 17

Jumlah keberhasilan dalam sampel: 8

Saya menemukan bahwa probabilitas mendapatkan tepat 8 adalah 0,0703, dan probabilitas mendapatkan 8 atau lebih adalah 0,1095

Saya pikir angka "8 atau lebih" adalah yang relevan dalam kasus ini, dan saya harus mengatakan bahwa probabilitas ini lebih rendah dari perkiraan intuisi saya.

Jadi angka menunjukkan bahwa ada kemungkinan 89% bahwa ada sesuatu yang berbeda tentang tingkat kegagalan ketika dipisahkan berdasarkan jenis tag. Itu tidak berarti bahwa penyebab perbedaannya adalah jenis tag.

Colin
sumber
1
Ini tidak mengontrol usia tag, membuat keraguan tentang arti atau kegunaan probabilitas.
whuber
@whuber kami memiliki "ilmuwan" yang mengklaim bahwa "tag tertentu memiliki persentase kerugian yang jauh lebih tinggi (80NS pada 47%) [...] jika kita menggunakan tag, ini menunjukkan bahwa mungkin ada tag dan memanfaatkan lebih rentan terhadap kegagalan yang tidak diketahui daripada sisanya "jadi hal pertama yang ingin saya ketahui adalah probabilitas mendapatkan tingkat kegagalan 47% jika kita mengasumsikan bahwa semua tag memiliki tingkat kegagalan yang sama.
Colin
@whuber Sebenarnya, argumen ini mungkin diperdebatkan karena jika Anda membaca laporan asli, 80NS sebagian besar diabaikan dalam diskusi tentang keandalan tag dan alasan untuk menyatakan bahwa "menghentikan tidak ada kerusakan" hasil sebagian besar disebabkan oleh penganiayaan sebagian besar didasarkan pada penganiayaan. bukti dari tag 70GPS / GSM. Model 80NS hanya digunakan pada tahun-tahun awal, dinyatakan kurang dapat diandalkan, dan menggunakan desain harness yang lebih mungkin untuk jatuh sebelum waktunya.
Colin