Mengapa akar kuadrat diambil untuk jumlah sampel "N" dalam rumus standar deviasi?

9

Saya mencoba memahami konsep dasar deviasi standar.

Dari rumus σ=i=1n(xiμ)2N

Saya tidak mengerti mengapa kita harus membagi dua populasi "N" yaitu mengapa kita ingin mengambil N ketika kita tidak melakukanN2 ? Bukankah itu membuat populasi kita condong?

Seharusnya formula tidak menjadi σ=i=1n(xiμ)2N

Mahesh Subramaniya
sumber

Jawaban:

10

Anda mencoba menemukan penyimpangan "tipikal" dari nilai tengah.

Variansnya adalah "jarak kuadrat rata-rata dari rata-rata".

Simpangan baku adalah akar kuadrat dari itu.

Itu menjadikannya deviasi root-mean-square dari mean.

  1. Mengapa kita menggunakan deviasi kuadrat rata-rata? Apa yang membuat varians menarik? Antara lain, karena fakta dasar tentang varians - bahwa varian dari sejumlah variabel yang tidak berkorelasi adalah jumlah dari masing-masing varian. (Ini tercakup dalam sejumlah pertanyaan misalnya di sini di CrossValidated. Fitur praktis ini tidak dibagikan, misalnya, dengan penyimpangan absolut rata-rata.
  2. Mengapa mengambil akar kuadrat dari itu? Karena dengan demikian berada di unit yang sama dengan pengamatan asli. Ini mengukur jenis tertentu 'jarak khas' dari rata-rata (seperti yang disebutkan, jarak RMS) - tetapi karena properti varian di atas - yang memiliki beberapa fitur bagus.
Glen_b -Reinstate Monica
sumber
7

The standar deviasi adalah akar kuadrat dari varians .


Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N
gung - Pasang kembali Monica
sumber
mungkin harus disebutkan bahwa formula varian ini hanya berlaku untuk seragam diskrit. jika tidak, hal itu dapat membingungkan perbedaan antara sampel dan varians populasi
Taylor
@Aylor, saya tidak tahu apa yang Anda maksud. Rumus untuk varians tidak terkait dengan distribusi.
gung - Reinstate Monica
rumus untuk varian (sampel) tidak terkait dengan distribusi ( en.wikipedia.org/wiki/Expected_value#Definition )
Taylor
@Aylor, aku masih tidak tahu apa maksudmu Rumus untuk varians tidak terkait dengan distribusi. Mengutip dari halaman Wikipedia, "Varian dari variabel acak, X, adalah nilai yang diharapkan dari penyimpangan kuadrat dari rata-rata X ... . Definisi ini mencakup variabel acak yang dihasilkan oleh proses yang diskrit, kontinu, tidak ada, atau dicampur. " Formula tidak hanya berlaku untuk seragam diskrit. Var(X)=E[(Xμ)2]
gung - Reinstate Monica
Ya, itu benar, jika Anda mengambil , tetapi tidak harus sama, untuk setiap variabel acak , . Untuk satu, yang pertama adalah konstanta dan yang kedua adalah acak. Sebenarnya tidak jelas apakah jumlah melebihi dukungan atau jumlah sampel. Jika yang terakhir, aneh bahwa Anda tahu , yang jarang dalam praktek. Jika yang pertama, maka ya, itu hanya berlaku untuk seragam diskrit (karena jumlah) (karena bobot semua seragam). μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
Taylor
1

Hal pertama yang harus dipahami adalah standar deviasi (std) berbeda dari rata - rata deviasi absolut . Keduanya mendefinisikan properti matematika yang berbeda tentang data.

Tidak seperti rata-rata deviasi absolut, standar deviasi (std) lebih berbobot dengan nilai yang jauh dari rata-rata, yang dilakukan dengan mengkuadratkan nilai perbedaan.

Misalnya, Untuk mengikuti empat titik data:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

rata-rata deviasi absolut (aad) , dan=16/4=4.0

Simpangan (std) =80/4=20=4.47

Dalam data, ada dua titik yang berjarak 6 jarak dari rata-rata, dan dua titik yang berjarak 2 jarak dari rata-rata. Jadi, penyimpangan 4,47 lebih masuk akal daripada 4.

Karena pengamatan total selalu , untuk komputasi std kita tidak menyelam dengan , sebaliknya kita membagi total varian dengan , dan mengambil akar kuadratnya, untuk membawanya ke unit yang sama dengan data asli.N NNN

aumpen
sumber
0

@ Mahesh Subramaniya - Ini hanya twist matematis . Ketika kita memiliki nilai asli seperti . Kita bisa mendapatkan nilai yang sama menggunakan dua persamaan ini dan .a 2b = c a/b=()da2b=ccb=d

Misalnya lakukan saja dengan = . Tapi, kami hanya menginginkan nilai bukan minus. - 2.5522.5

Sekarang, . Dan,522=12.512.52=2.5

Ellephy
sumber