Dapat berarti plus satu standar deviasi melebihi nilai maksimum?

19

Maksud saya 74,10 dan standar deviasi 33,44 untuk sampel yang memiliki minimum 0 dan maksimum 94,33.

Profesor saya bertanya kepada saya bagaimana bisa berarti ditambah satu standar deviasi melebihi maksimum.

Saya menunjukkan kepadanya banyak contoh tentang ini, tetapi dia tidak mengerti. Saya perlu referensi untuk menunjukkan padanya. Ini bisa berupa bab atau paragraf apa pun dari buku statistik yang berbicara secara khusus tentang hal ini.

Boyun Omuru
sumber
Mengapa Anda ingin menambahkan (atau mengurangi) satu standar deviasi dari rata-rata? SD adalah ukuran penyebaran data. Apakah Anda ingin kesalahan standar rata-rata sebagai gantinya mungkin?
Pasang kembali Monica - G. Simpson
Saya tidak ingin menambah atau mengurangi, yang ingin ini adalah profesor saya. Itulah cara dia memahami penyimpangan standar
Boyun Omuru
5
Contoh yang menarik adalah sampel (0,01,0,02,0,98,0,99). Baik mean plus deviasi standar dan mean minus deviasi standar terletak di luar [0,1].
Glen_b -Reinstate Monica
Mungkin dia hanya memikirkan distribusi normal?
user765195

Jawaban:

28

Tentunya mean plus satu sd bisa melebihi pengamatan terbesar.

Pertimbangkan sampel 1, 5, 5, 5 -

memiliki mean 4 dan standar deviasi 2, jadi mean + sd adalah 6, satu lebih dari maksimum sampel. Berikut perhitungan di R:

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

Ini adalah kejadian umum. Ini cenderung terjadi ketika ada banyak nilai tinggi dan buntut ke kiri (yaitu ketika ada kemiringan kiri yang kuat dan puncak mendekati maksimum).

-

Kemungkinan yang sama berlaku untuk distribusi probabilitas, bukan hanya sampel - mean populasi ditambah populasi sd dapat dengan mudah melebihi nilai maksimum yang mungkin.

Berikut ini contoh kepadatan, yang memiliki nilai maksimum 1:beta(10,12)

masukkan deskripsi gambar di sini

Dalam hal ini, kita dapat melihat halaman Wikipedia untuk distribusi beta, yang menyatakan bahwa mean adalah:

E[X]=αα+β

dan variansnya adalah:

var[X]=αβ(α+β)2(α+β+1)

(Meskipun kita tidak perlu bergantung pada Wikipedia, karena cukup mudah untuk diturunkan.)

Jadi untuk dan β = 1α=10 kita memiliki rata-rata0,9523dan sd0,0628, jadi rata-rata + sd1,0152, lebih dari kemungkinan maksimum 1.β=120.95230.06281.0152

Artinya, mudah untuk memiliki nilai rata-rata + sd yang tidak dapat diamati sebagai nilai data .

-

<1

-

[0,1]

10

p^+2×14p^(1p^)=p^+p^(1p^)=0.75+0.433=1.183

Ini hanya rata-rata sampel + perkiraan biasa dari sd untuk binomial ... dan menghasilkan nilai yang tidak mungkin.

p^(1p^)nn1

Fakta ini - bahwa interval perkiraan normal untuk binomial dapat menghasilkan "nilai yang tidak mungkin" sering dicatat dalam buku dan makalah. Namun, Anda tidak berurusan dengan data binomial. Namun demikian masalah - yang berarti + sejumlah standar deviasi bukanlah nilai yang mungkin - adalah analog.

-

Dalam kasus Anda, nilai "0" yang tidak biasa dalam sampel Anda adalah membuat sd lebih besar daripada menurunkan rata-rata, itulah sebabnya rata-rata + sd tinggi.

masukkan deskripsi gambar di sini

-

(Pertanyaannya sebaliknya - dengan alasan apa tidak mungkin? - karena tanpa mengetahui mengapa ada orang yang berpikir ada masalah sama sekali, apa yang kita bahas?)

Tentu saja secara logis, orang menunjukkan itu mungkin dengan memberikan contoh di mana itu terjadi. Anda sudah melakukannya. Dengan tidak adanya alasan lain mengapa harus sebaliknya, apa yang harus Anda lakukan?

Jika sebuah contoh tidak cukup, bukti apa yang dapat diterima?

Benar-benar tidak ada gunanya menunjuk pernyataan dalam sebuah buku, karena buku mana pun dapat membuat pernyataan salah - saya melihat mereka sepanjang waktu. Seseorang harus mengandalkan demonstrasi langsung bahwa itu mungkin, baik bukti dalam aljabar (orang dapat dibangun dari contoh beta di atas misalnya *) atau dengan contoh numerik (yang telah Anda berikan), yang dapat diperiksa siapa pun kebenarannya untuk diri mereka sendiri .

* whuber memberikan kondisi yang tepat untuk case beta dalam komentar.

Glen_b -Reinstate Monica
sumber
5
0<β<1α>β(1+β)/(1β)(α,β)1
Biarkan saya jelaskan lebih lanjut. Saya mencari persentase akurasi dari alat tertentu yang digunakan untuk koreksi gigi. Dan alat ini melakukan persentase akurasi untuk 7 gigi sebagai berikut:% 76,19,% 77,41,% 94,33,% 91,06,% 0,% 87,77,% 91,96. Dosen saya menambahkan satu standar deviasi ke mean dan menyatakan bahwa hasilnya tidak dapat melebihi nilai maksimum bahkan% 100 karena% 100 adalah persentase akurasi maksimum yang dapat dilakukan appliancek.
Boyun Omuru
2
Dia benar bahwa persentase> 100% tidak masuk akal dalam situasi Anda. Masalahnya sebenarnya adalah premis yang tidak dinyatakan yang menambahkan satu sd ke mean harus masuk akal dalam konteks ini, ketika tidak . Di situlah saya percaya kesulitan Anda berasal. Jika kita mengerti dari mana asalnya, itu mungkin mengarah pada resolusi yang lebih baik. Mungkin fakta sederhana dinyatakan dalam buku di suatu tempat (itu adalah pengamatan sepele, jadi, mungkin juga tidak,), tapi aku ragu itu akan dimasukkan ke dalam cara yang akan memuaskannya, karena kesalahannya premis adalah sumber masalahnya.
Glen_b -Reinstate Monica
1
Memang - poin kecil saya adalah bahwa rasa ingin tahu ini adalah hasil dari apa yang diwakili oleh standar deviasi untuk distribusi yang sangat tidak simetris daripada hasil pengambilan sampel. Tetapi secara umum, saya pikir jawaban Anda sangat bagus
Henry
2
@ Tomka Saya telah berusaha membantu banyak siswa dalam posisi yang sama. Saya akhirnya belajar aturan praktis (mungkin tidak mengejutkan) bahwa secara efektif mustahil untuk mengajar atasan apa pun melalui media siswa mereka.
Glen_b -Reinstate Monica
4

Per ketimpangan Chebyshev, kurang dari k -2 poin bisa lebih dari k standar deviasi. Jadi, untuk k = 1 itu berarti kurang dari 100% sampel Anda dapat lebih dari satu standar deviasi.

Lebih menarik untuk melihat batas bawah. Profesor Anda harus lebih terkejut ada poin yang sekitar 2,5 standar deviasi di bawah rata-rata. Tapi sekarang kita tahu bahwa hanya sekitar 1/6 sampel Anda yang bisa 0.

MSalters
sumber
3

σσ

Mendengkur
sumber
5
Ini sumbangan yang bagus. Saya tidak yakin bahwa SD benar-benar "mengasumsikan" distribusi normal.
gung - Reinstate Monica
3
"Distribusi pas" dan menemukan transformasi ke normal adalah prosedur yang berbeda dengan tujuan yang berbeda.
whuber
2

X10<p<101p

E(X)=p,SE(X)=p(1p)

Dan kami mau

E(X)+SE(X)>1p+p(1p)>1

p(1p)>(1p)

Kuadratkan kedua sisi untuk mendapatkan

p(1p)>(1p)2p>1pp>12

p>1/2E(X)+SE(X)>maxX holds.

So for example, for any i.i.d. sample drawn from a Bernoulli with, say, p=0.7, in most cases the sample mean plus the sample standard deviation will exceed the value 1, which will be the maximum value observed (bar the case of an all-zeros sample!).

For other distributions we always have the opposite direction in the inequality, e.g. for a Uniform U(a,b), it is always the case that E(U)+SE(U)<maxU=b.
Therefore, no general rule exists.

Alecos Papadopoulos
sumber