Misalkan saya menjalankan percobaan yang dapat memiliki 2 hasil, dan saya berasumsi bahwa distribusi "benar" yang mendasari dari 2 hasil adalah distribusi binomial dengan parameter dan : .
Saya dapat menghitung kesalahan standar, , dari bentuk varian dari : mana . Jadi, . Untuk kesalahan standar yang saya dapatkan: , tapi saya pernah melihat bahwa . Apa kesalahan yang telah aku perbuat?
binomial
standard-error
jujur
sumber
sumber
Jawaban:
Sepertinya Anda menggunakan dua kali dalam dua cara yang berbeda - baik sebagai ukuran sampel dan sebagai jumlah uji coba bernoulli yang terdiri dari variabel acak Binomial; untuk menghilangkan ambiguitas, saya akan menggunakan untuk merujuk pada yang terakhir.n k
Jika Anda memiliki sampel independen dari distribusi , varians dari mean sampelnya adalahn Binomial(k,p)
di mana dan adalah rata-rata yang sama. Ini mengikuti sejakq=1−p X¯¯¯¯
(1) , untuk variabel acak apa pun, , dan konstanta apa pun .var(cX)=c2var(X) X c
(2) varians dari jumlah variabel acak independen sama dengan jumlah varians .
Kesalahan standar adalah akar kuadrat dari varians: . Karena itu,X¯¯¯¯ kpqn−−−√
Ketika , Anda mendapatkan rumus yang Anda tunjukkan:√k=n pq−−√
Ketika , dan variabel Binomial hanyalah uji coba bernoulli , Anda mendapatkan rumus yang Anda lihat di tempat lain:√k=1 pqn−−√
sumber
Sangat mudah untuk membuat dua distribusi binomial bingung:
npq adalah jumlah keberhasilan, sedangkan npq / n = pq adalah rasio keberhasilan. Ini menghasilkan formula kesalahan standar yang berbeda.
sumber
Kita dapat melihat ini dengan cara berikut:
Misalkan kita sedang melakukan percobaan di mana kita perlu melemparkan koin yang tidak bias kali. Hasil keseluruhan dari percobaan adalah yang merupakan penjumlahan dari lemparan individu (katakanlah, kepala 1 dan ekor 0). Jadi, untuk percobaan ini, , di mana adalah hasil dari lemparan individu.Y Y = ∑ n i = 1 X i X in Y Y=∑ni=1Xi Xi
Di sini, hasil dari setiap lemparan, , mengikuti distribusi Bernoulli dan hasil keseluruhan mengikuti distribusi binomial. YXi Y
Eksperimen lengkap dapat dianggap sebagai sampel tunggal. Jadi, jika kita mengulangi eksperimen, kita bisa mendapatkan nilai , yang akan membentuk sampel lain. Semua nilai mungkin merupakan populasi lengkap.YY Y
Kembali ke lemparan koin tunggal, yang mengikuti distribusi Bernoulli, varians diberikan oleh , di mana adalah probabilitas head (sukses) dan .ppq p q=1–p
Sekarang, jika kita melihat Varians , . Tetapi, untuk semua eksperimen Bernoulli individual, . Karena ada lemparan atau percobaan Bernoulli dalam percobaan, . Ini menyiratkan bahwa memiliki varian .Y V(Y)=V(∑Xi)=∑V(Xi) V(Xi)=pq n V(Y)=∑V(Xi)=npq Y npq
Sekarang, proporsi sampel diberikan oleh , yang memberikan 'proporsi keberhasilan atau kepala'. Di sini, adalah konstan karena kami berencana untuk mengambil tidak ada lemparan koin yang sama untuk semua percobaan dalam populasi.p^=Yn n
Jadi, .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n
Jadi, kesalahan standar untuk (statistik sampel) adalahp^ pq/n−−−−√
sumber
$x$
memberi .Saya pikir ada juga beberapa kebingungan dalam posting awal antara kesalahan standar dan standar deviasi. Deviasi standar adalah sqrt dari varian distribusi; standard error adalah standar deviasi dari estimasi rata-rata sampel dari distribusi itu, yaitu penyebaran cara yang akan Anda amati jika Anda melakukan sampel itu berkali-kali. Yang pertama adalah properti intrinsik dari distribusi; yang terakhir adalah ukuran kualitas estimasi properti Anda (rata-rata) dari distribusi. Ketika Anda melakukan percobaan uji coba N Bernouilli untuk memperkirakan probabilitas keberhasilan yang tidak diketahui, ketidakpastian estimasi Anda p = k / N setelah melihat k kesuksesan adalah kesalahan standar dari estimasi proporsi, sqrt (pq / N) di mana q = 1 p Distribusi yang benar dicirikan oleh parameter P, probabilitas keberhasilan yang sebenarnya.
sumber