Saya telah melihat ke dalam cara kerja kesalahan standar baru-baru ini, dan saya mendapati diri saya tidak dapat memahami cara kerjanya. Pemahaman saya tentang kesalahan standar adalah bahwa itu adalah standar deviasi dari distribusi mean sampel. Pertanyaan saya adalah:
• bagaimana kita tahu kesalahan standar adalah standar deviasi dari sampel berarti ketika kita biasanya mengambil hanya satu sampel?
• mengapa persamaan untuk menghitung kesalahan standar tidak mencerminkan persamaan standar deviasi untuk sampel tunggal?
standard-error
luciano
sumber
sumber
Jawaban:
Ya, kesalahan standar mean (SEM) adalah standar deviasi (SD) dari mean. (Kesalahan standar adalah cara lain untuk mengatakan SD dari distribusi pengambilan sampel. Dalam hal ini, distribusi pengambilan sampel adalah sarana untuk sampel dengan ukuran tetap, katakan N.) Ada hubungan matematis antara SEM dan populasi SD: SEM = populasi SD / akar kuadrat dari N. Hubungan matematis ini sangat membantu, karena kita hampir tidak pernah memiliki estimasi langsung dari SEM tetapi kami memang memiliki estimasi populasi SD (yaitu SD dari sampel kami). Mengenai pertanyaan kedua Anda, jika Anda mengumpulkan beberapa sampel ukuran N dan menghitung rata-rata untuk setiap sampel, Anda dapat memperkirakan SEM hanya dengan menghitung SD cara. Jadi rumus untuk SEM memang mencerminkan rumus untuk SD dari sampel tunggal.
sumber
Misalkan independen dan terdistribusi secara identik. Ini adalah situasi yang saya yakin Anda maksudkan. Biarkan rata-rata umum mereka menjadi μ dan varians umum mereka adalah σ 2 .X1,X2,…,Xn μ σ2
Sekarang mean sampel adalah . Linearitas harapan menunjukkan bahwa rata-rata X b juga μ . Asumsi kemandirian menyiratkan varian X b adalah jumlah dari varians dari ketentuan-ketentuannya. Setiap istilah X i / n memiliki varians σ 2 / n 2 (karena varian dari konstanta kali variabel acak adalah konstanta kuadrat dikalikan varians dari variabel acak). Kami memiliki nXb=∑iXi/n Xb μ Xb Xi/n σ2/n2 n variabel terdistribusi secara identik untuk dijumlahkan, sehingga setiap istilah memiliki varian yang sama. Sebagai hasilnya, kita mendapatkan untuk varians dari mean sampel.nσ2/n2=σ2/n
Biasanya kita tidak tahu sehingga kita harus memperkirakannya dari data. Tergantung pada pengaturannya, ada berbagai cara untuk melakukan ini. Dua estimasi tujuan umum yang paling umum dari σ 2 adalah varians sampel s 2 = 1σ2 σ2 dan kelipatan kecilnya,s 2 u =ns2=1n∑i(Xi−Xb)2 (yang merupakan penaksir tidak bias dariσ2). Menggunakan salah satu dari ini di tempatσ2pada paragraf sebelumnya dan mengambil akar kuadrat memberikan kesalahan standar dalam bentuks/√s2u=nn−1s2 σ2 σ2 atausu/ √s/n−−√ .su/n−−√
sumber
+1 untuk kedua @ JoelW. & @MichaelChernick. Saya ingin menambahkan detail ke jawaban @ JoelW. Dia mencatat bahwa "kita hampir tidak pernah memiliki perkiraan langsung dari SEM", yang pada dasarnya benar, tetapi ada baiknya secara eksplisit mengakui peringatan untuk pernyataan itu. Khususnya, ketika sebuah studi membandingkan beberapa kelompok / perawatan (misalnya, plasebo vs obat standar vs obat baru), sebuah ANOVA biasanya digunakan untuk melihat apakah semuanya sama. Hipotesis nol adalah bahwa masing-masing kelompok telah diambil dari populasi yang sama, dan dengan demikian, ketiganya berarti estimasi rata-rata populasi. Yaitu, hipotesis nol dalam ANOVA standar mengasumsikan bahwa Anda memang memiliki perkiraan langsung dari SEM. Pertimbangkan persamaan untuk varian dari distribusi sampling mean: di manaσ 2 p o p adalah varians populasi, dannjadalah jumlah kelompok. Meskipun kami biasanya tidak melakukan perhitungan dengan cara ini, kamihanyabisamenggunakan rumus standar untuk memasukkan nilai estimasi, dan dengan perombakan aljabar minimal, bentukstatistikFseperti: F=nj×s 2 ˉ x
Dalam hal itu kami biasanya percaya bahwa hipotesis nol itu tidak benar, poin @ JoelW benar, tetapi saya bekerja melalui titik ini, karena saya pikir kejelasan yang diberikannya sangat membantu untuk memahami masalah ini.
sumber