Maksud saya 74,10 dan standar deviasi 33,44 untuk sampel yang memiliki minimum 0 dan maksimum 94,33.
Profesor saya bertanya kepada saya bagaimana bisa berarti ditambah satu standar deviasi melebihi maksimum.
Saya menunjukkan kepadanya banyak contoh tentang ini, tetapi dia tidak mengerti. Saya perlu referensi untuk menunjukkan padanya. Ini bisa berupa bab atau paragraf apa pun dari buku statistik yang berbicara secara khusus tentang hal ini.
standard-deviation
mean
references
bounds
maximum
Boyun Omuru
sumber
sumber
Jawaban:
Tentunya mean plus satu sd bisa melebihi pengamatan terbesar.
Pertimbangkan sampel 1, 5, 5, 5 -
memiliki mean 4 dan standar deviasi 2, jadi mean + sd adalah 6, satu lebih dari maksimum sampel. Berikut perhitungan di R:
Ini adalah kejadian umum. Ini cenderung terjadi ketika ada banyak nilai tinggi dan buntut ke kiri (yaitu ketika ada kemiringan kiri yang kuat dan puncak mendekati maksimum).
-
Kemungkinan yang sama berlaku untuk distribusi probabilitas, bukan hanya sampel - mean populasi ditambah populasi sd dapat dengan mudah melebihi nilai maksimum yang mungkin.
Berikut ini contoh kepadatan, yang memiliki nilai maksimum 1:beta(10,12)
Dalam hal ini, kita dapat melihat halaman Wikipedia untuk distribusi beta, yang menyatakan bahwa mean adalah:
dan variansnya adalah:
(Meskipun kita tidak perlu bergantung pada Wikipedia, karena cukup mudah untuk diturunkan.)
Jadi untuk dan β = 1α=10 kita memiliki rata-rata≈0,9523dan sd≈0,0628, jadi rata-rata + sd≈1,0152, lebih dari kemungkinan maksimum 1.β=12 ≈0.9523 ≈0.0628 ≈1.0152
Artinya, mudah untuk memiliki nilai rata-rata + sd yang tidak dapat diamati sebagai nilai data .
-
-
Ini hanya rata-rata sampel + perkiraan biasa dari sd untuk binomial ... dan menghasilkan nilai yang tidak mungkin.
Fakta ini - bahwa interval perkiraan normal untuk binomial dapat menghasilkan "nilai yang tidak mungkin" sering dicatat dalam buku dan makalah. Namun, Anda tidak berurusan dengan data binomial. Namun demikian masalah - yang berarti + sejumlah standar deviasi bukanlah nilai yang mungkin - adalah analog.
-
Dalam kasus Anda, nilai "0" yang tidak biasa dalam sampel Anda adalah membuat sd lebih besar daripada menurunkan rata-rata, itulah sebabnya rata-rata + sd tinggi.
-
(Pertanyaannya sebaliknya - dengan alasan apa tidak mungkin? - karena tanpa mengetahui mengapa ada orang yang berpikir ada masalah sama sekali, apa yang kita bahas?)
Tentu saja secara logis, orang menunjukkan itu mungkin dengan memberikan contoh di mana itu terjadi. Anda sudah melakukannya. Dengan tidak adanya alasan lain mengapa harus sebaliknya, apa yang harus Anda lakukan?
Jika sebuah contoh tidak cukup, bukti apa yang dapat diterima?
Benar-benar tidak ada gunanya menunjuk pernyataan dalam sebuah buku, karena buku mana pun dapat membuat pernyataan salah - saya melihat mereka sepanjang waktu. Seseorang harus mengandalkan demonstrasi langsung bahwa itu mungkin, baik bukti dalam aljabar (orang dapat dibangun dari contoh beta di atas misalnya *) atau dengan contoh numerik (yang telah Anda berikan), yang dapat diperiksa siapa pun kebenarannya untuk diri mereka sendiri .
* whuber memberikan kondisi yang tepat untuk case beta dalam komentar.
sumber
Per ketimpangan Chebyshev, kurang dari k -2 poin bisa lebih dari k standar deviasi. Jadi, untuk k = 1 itu berarti kurang dari 100% sampel Anda dapat lebih dari satu standar deviasi.
Lebih menarik untuk melihat batas bawah. Profesor Anda harus lebih terkejut ada poin yang sekitar 2,5 standar deviasi di bawah rata-rata. Tapi sekarang kita tahu bahwa hanya sekitar 1/6 sampel Anda yang bisa 0.
sumber
sumber
Dan kami mau
Kuadratkan kedua sisi untuk mendapatkan
So for example, for any i.i.d. sample drawn from a Bernoulli with, say,p=0.7 , in most cases the sample mean plus the sample standard deviation will exceed the value 1 , which will be the maximum value observed (bar the case of an all-zeros sample!).
For other distributions we always have the opposite direction in the inequality, e.g. for a UniformU(a,b) , it is always the case that E(U)+SE(U)<maxU=b .
Therefore, no general rule exists.
sumber