Gambar di bawah ini dari artikel ini di Ilmu Psikologi . Seorang kolega menunjukkan dua hal yang tidak biasa tentang hal itu:
- Menurut keterangan, bilah kesalahan menunjukkan "± 2,04 kesalahan standar, interval kepercayaan 95%." Saya hanya pernah melihat ± 1,96 SE digunakan untuk CI 95%, dan saya tidak dapat menemukan apa pun tentang 2,04 SE yang digunakan untuk tujuan apa pun. Apakah 2.04 SE memiliki makna yang diterima ?
- Teks menyatakan bahwa perbandingan berpasangan yang direncanakan menemukan perbedaan yang signifikan untuk besarnya kejut rata-rata dalam uji coba yang dapat diprediksi dengan benar (t (30) = 2,51, p <.01) dan kesalahan vs uji coba yang tidak dapat diprediksi yang benar (t (30) = 2,61, p <0,01) (uji F omnibus juga signifikan pada p <0,05). Namun, grafik menunjukkan bar kesalahan untuk ketiga kondisi yang tumpang tindih secara substansial. Jika interval ± 2.04 SE tumpang tindih, bagaimana bisa nilainya berbeda secara signifikan pada p <0,05? Tumpang tindih cukup besar sehingga saya mengasumsikan bahwa interval ± 1,96 SE juga tumpang tindih.
Jawaban:
Berarti dibandingkan dalam hal kesalahan standar . Kesalahan standar biasanya kali deviasi standar, di mana (mungkin sekitar sini) adalah ukuran sampel. Jika judulnya benar dalam menyebut bilah ini "kesalahan standar," maka standar deviasi harus setidaknya kali lebih besar dari nilai sekitar seperti yang ditunjukkan. Dataset nilai positif dengan standar deviasi dan rata-rata antara dan harus memiliki nilai paling dekat1/n−−√ n 30+1=31 31−−√≈5.5 6 31 6×5.5=33 14 18 0 dan sejumlah kecil nilai besar, yang tampaknya sangat tidak mungkin. (Jika demikian, maka seluruh analisis berdasarkan statistik t Student akan tetap tidak valid.) Kita harus menyimpulkan bahwa angka tersebut kemungkinan menunjukkan standar deviasi, bukan kesalahan standar .
Perbandingan cara tidak didasarkan pada tumpang tindih (atau ketiadaan) interval kepercayaan. Dua 95% CI dapat tumpang tindih, namun masih dapat menunjukkan perbedaan yang sangat signifikan. Alasannya adalah bahwa kesalahan standar dari perbedaan dalam ( independen ) berarti, setidaknya sekitar, akar kuadrat dari jumlah kuadrat dari kesalahan standar rata-rata. Misalnya, jika kesalahan standar rata-rata sama dengan dan kesalahan standar rata-rata sama dengan , maka CI dari rata-rata pertama (menggunakan kelipatan ) akan meluas dari ke dan CI dari yang kedua akan memperpanjang dari14 1 17 1 2.04 11.92 16.08 14.92 ke , dengan tumpang tindih substansial. Namun demikian SE dari perbedaannya akan sama dengan . Perbedaan rata-rata, , lebih besar dari kali nilai ini: signifikan.19.03 12+12−−−−−−√≈1.41 17−14=3 2.04
Ini adalah perbandingan berpasangan . Nilai-nilai individu dapat menunjukkan banyak variabilitas sementara perbedaannya mungkin sangat konsisten. Misalnya, seperangkat pasangan seperti , , , , dll., variasi dalam setiap komponen, tetapi perbedaannya secara konsisten . Meskipun perbedaan ini kecil dibandingkan dengan kedua komponen, konsistensi menunjukkan secara statistik signifikan.( 15 , 15,01 ) ( 16 , 16,01 ) ( 17 , 17,01 ) 0,01(14,14.01) (15,15.01) (16,16.01) (17,17.01) 0.01
sumber
F(2,60)=5.64, p<.05
) menyiratkan bahwa itu adalah tes tindakan berulang, sehingga tes post hoc kemungkinan juga sama.Bagian dari kebingungan di sini adalah representasi data yang membingungkan. Tampaknya menjadi desain tindakan berulang namun bar kesalahan adalah interval kepercayaan seberapa baik nilai rata-rata yang sebenarnya diperkirakan. Tujuan utama dari tindakan berulang adalah untuk menghindari pengumpulan data yang cukup untuk mendapatkan estimasi kualitas dari nilai rata-rata mentah. Karenanya bar kesalahan seperti yang disajikan benar-benar hampir tidak ada kaitannya dengan cerita yang disampaikan. Nilai minat kritis adalah efeknya. Dengan tujuan grafik untuk menyorot poin utama dari cerita, membuat grafik efek, dan interval kepercayaan mereka, akan lebih tepat.
sumber