Nilai yang meningkatkan Deviasi Standar

12

Saya bingung dengan pernyataan berikut:

"Untuk meningkatkan deviasi standar dari satu set angka, Anda harus menambahkan nilai yang lebih dari satu deviasi standar dari rata-rata"

Apa buktinya ? Tentu saja saya tahu bagaimana kita mendefinisikan standar deviasi tetapi bagian itu sepertinya saya lewatkan. Ada komentar?

JohnK
sumber
1
Sudahkah Anda mencoba mencari tahu aljabar yang terlibat?
Alecos Papadopoulos
Ya saya punya. Saya telah mengurangi varians sampel dari nilai-nilai n dari varians dari nilai-nilai n +1 dan saya telah meminta perbedaannya menjadi lebih besar dari nol. Namun saya tidak bisa mengetahuinya.
JohnK
3
Salah satu cara paling sederhana adalah dengan membedakan algoritma Welford sehubungan dengan nilai baru xn dan kemudian berintegrasi untuk menunjukkan bahwa jika memperkenalkan xn meningkatkan varians, maka (xnx¯n1)2nn1vn1di manax¯n1adalah mean dari pertaman1nilai danvn1adalah estimasi varians mereka.
whuber
Oke tapi bisakah ini ditampilkan dengan aljabar sederhana? Pengetahuan saya tentang statistik tidak semaju itu.
JohnK
@JohnK, bisakah Anda membagikan sumber kutipannya?
Pe Dro

Jawaban:

20

Untuk setiap angka y 1 , y 2 , ... , y N dengan rata-rata ˉ y = 1Ny1,y2,,yN, varians diberikan oleh σ 2y¯=1Ni=1Nyi Menerapkan(1)ke himpunanangkan yangdiberikanx1,x2,xn yang kita ambil untuk kemudahan dalam eksposisi memiliki maknaˉx=0, kita memiliki itu σ2=1

σ2=1N1i=1N(yiy¯)2=1N1i=1N(yi22yiy¯+y¯2)=1N1[(i=1Nyi2)2N(y¯)2+N(y¯)2](1)σ2=1N1i=1N(yi2(y¯)2)
(1)nx1,x2,xnx¯=0 Jika sekarang kita menambahkan observasi baruxn+1ke set data ini, maka rata-rata baru dari set data adalah 1
σ2=1n1i=1n(xi2(x¯)2)=1n1i=1nxi2
xn+1 sedangkan varian baru σ 2
1n+1i=1n+1xi=nx¯+xn+1n+1=xn+1n+1
Jadi| xn+1| harus lebih besar dariσ
σ^2=1ni=1n+1(xi2xn+12(n+1)2)=1n[((n1)σ2+xn+12)xn+12n+1]=1n[(n1)σ2+nn+1xn+12]>σ2 only if xn+12>n+1nσ2.
|xn+1| atau, lebih umum,xn+1kebutuhan berbeda dari meanˉxdari kumpulan data asli oleh lebih dariσσ1+1nxn+1x¯ , agar set data yang diperbesar memiliki varians yang lebih besar daripada set data asli. Lihat juga jawaban Ray Koopman ini yang menunjukkan bahwa varians baru lebih besar dari, sama dengan, atau lebih kecil dari, varians asli sesuai sebagaixn+1 berbeda dari rata-rata lebih dari, tepatnya, atau kurang dariσσ1+1nxn+1 .σ1+1n
Dilip Sarwate
sumber
5
σ2=1
Saya sarankan Anda menggunakan S bukan sigma di set pertama persamaan dan terima kasih untuk derivasi. Itu bagus untuk diketahui :)
Theoden
3

nmsxs|xm|s1+1/n

Ray Koopman
sumber
1
Apakah Anda memiliki bukti?
JohnK
2

Mengesampingkan aljabar (yang juga berfungsi) pikirkan seperti ini: Deviasi standar adalah akar kuadrat dari varians. Varians adalah rata-rata jarak kuadrat dari rata-rata. Jika kita menambahkan nilai yang lebih dekat ke rata-rata daripada ini, varians akan menyusut. Jika kita menambahkan nilai yang lebih jauh dari rata-rata dari ini, itu akan tumbuh.

Ini berlaku untuk setiap nilai rata-rata yang tidak negatif. Jika Anda menambahkan nilai yang lebih tinggi dari rata-rata, berarti meningkat. Jika Anda menambahkan nilai yang kurang, itu berkurang.

Peter Flom - Pasang kembali Monica
sumber
Saya akan senang melihat bukti yang kuat juga. Sementara saya mengerti prinsip saya bingung dengan fakta bahwa nilainya harus setidaknya 1 penyimpangan dari rata-rata. Kenapa tepatnya 1?
JohnK
Saya tidak melihat apa yang membingungkan. Perbedaannya adalah rata-rata. Jika Anda menambahkan sesuatu yang lebih besar dari rata-rata (yaitu, lebih dari 1 sd) itu meningkat. Tetapi saya bukan orang yang suka bukti formal
Peter Flom - Reinstate Monica
Itu bisa lebih besar dari rata-rata dengan 0,2 penyimpangan standar. Mengapa itu tidak meningkat?
JohnK
Tidak, tidak lebih besar dari rerata data, lebih besar dari ragamnya, yang merupakan rerata dari jarak kuadrat.
Peter Flom - Reinstate Monica
4
Ini membingungkan karena memasukkan nilai baru mengubah rata-rata, sehingga semua residu berubah. Dapat dibayangkan bahwa bahkan ketika nilai baru jauh dari rata-rata lama, kontribusinya terhadap SD dapat dikompensasi dengan mengurangi jumlah kuadrat dari residu dari nilai-nilai lainnya. Ini adalah salah satu dari banyak alasan mengapa bukti yang kuat berguna: mereka tidak hanya memberikan keamanan dalam pengetahuan seseorang, tetapi juga wawasan (dan bahkan informasi baru). Misalnya, buktinya akan menunjukkan bahwa Anda harus menambahkan nilai baru yang benar - benar lebih jauh dari satu SD dari mean untuk meningkatkan SD.
whuber
2

Z=xμσ.
xZx
σ=i=1NZi2N1
σZN
wcampbell
sumber
Angka yang nilai absolutnya kurang dari 1, jika kuadratkan juga akan menjadi kurang dari 1 dalam abs. nilai. Namun yang saya tidak mengerti adalah bahwa bahkan jika Z_N masuk ke dalam kategori itu, kami menambahkan nilai positif ke σ, jadi tidakkah seharusnya itu meningkat?
JohnK
ZN+1
1
NσZi2
Persis apa yang saya coba ekspresikan!
wcampbell
ZiN1