Hari ini saya mengajar kelas pengantar statistik dan seorang siswa mendatangi saya dengan sebuah pertanyaan, yang saya ulangi di sini sebagai: "Mengapa standar deviasi didefinisikan sebagai sqrt of variance dan bukan sebagai sqrt dari jumlah kuadrat atas N?"
Kami mendefinisikan varians populasi:
Dan standar deviasi: .
Interpretasi kami dapat memberikan ke adalah memberikan deviasi rata-rata unit dalam populasi dari mean populasi .
Namun, dalam definisi sd kita membagi sqrt dari jumlah kuadrat melalui . Pertanyaan yang diajukan siswa adalah mengapa kita tidak membagi squme dari sume of squares dengan sebagai gantinya. Jadi kita sampai pada formula yang bersaing:Siswa berpendapat bahwa rumus ini lebih mirip deviasi "rata-rata" dari rata-rata daripada ketika membagi melalui seperti dalam .
Saya pikir pertanyaan ini tidak bodoh. Saya ingin memberikan jawaban kepada siswa yang lebih jauh daripada mengatakan bahwa sd didefinisikan sebagai sqrt dari varians yang merupakan deviaton kuadrat rata-rata. Dengan kata lain, mengapa siswa harus menggunakan formula yang benar dan tidak mengikuti idenya?
Pertanyaan ini berkaitan dengan utas yang lebih lama dan jawaban yang diberikan di sini . Jawaban ada tiga arah:
- adalah deviasi root-mean-squared (RMS), bukan deviasi "khas" dari mean (yaitu, ). Dengan demikian, didefinisikan secara berbeda.
- Ini memiliki sifat matematika yang bagus.
- Selanjutnya, sqrt akan mengembalikan "unit" ke skala aslinya. Namun, ini juga akan menjadi kasus untuk , yang membaginya dengan N sebagai gantinya.
Kedua poin 1 dan 2 adalah argumen yang mendukung sd sebagai RMS, tapi saya tidak melihat argumen yang menentang penggunaan . Apa argumen yang baik untuk meyakinkan siswa tingkat pengantar tentang penggunaan jarak RMS rata-rata σ dari mean?
"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"
Mungkinkah apa yang ada di dalam kurung entah bagaimana hilang dalam pertanyaan?Jawaban:
Setidaknya ada tiga masalah dasar yang dapat dijelaskan kepada pemula:
SD "baru" bahkan tidak didefinisikan untuk populasi tak terbatas. (Seseorang dapat menyatakannya selalu sama dengan nol dalam kasus seperti itu, tetapi itu tidak akan membuatnya lebih berguna.)
SD baru tidak berperilaku seperti rata-rata harus dilakukan di bawah pengambilan sampel acak.
Meskipun SD baru dapat digunakan dengan semua ketelitian matematika untuk menilai penyimpangan dari rata-rata (dalam sampel dan populasi terbatas), interpretasinya tidak perlu rumit.
1. Penerapan SD baru terbatas
Poin (1) dapat dibawa pulang, bahkan kepada mereka yang tidak berpengalaman dalam integrasi, dengan menunjukkan bahwa karena varians jelas merupakan rata-rata aritmatika (penyimpangan kuadrat), ia memiliki ekstensi yang berguna untuk model populasi "tak terbatas" di mana intuisi tentang keberadaan aritmatika berarti masih berlaku. Oleh karena itu akar kuadratnya - SD biasa - juga didefinisikan dengan baik dalam kasus-kasus seperti itu, dan sama berguna dalam perannya sebagai varian (non-linear reekspresi) varians. Namun, SD membagi baru yang rata dengan sewenang-wenang besar , membuat generalisasi yang bermasalah di luar populasi terbatas dan sampel terbatas: apa yang harus1/ √N−−√ dianggap sama dalam kasus-kasus seperti itu?1/N−−√
2. SD baru bukan rata-rata
Statistik apa pun yang layak untuk nama "rata-rata" harus memiliki properti yang menyatu dengan nilai populasi karena ukuran sampel acak dari populasi meningkat. Setiap kelipatan tetap dari SD akan memiliki properti ini, karena pengganda akan berlaku baik untuk menghitung SD sampel dan populasi SD. (Meskipun tidak secara langsung bertentangan dengan argumen yang ditawarkan oleh Alecos Papadopoulos, pengamatan ini menunjukkan bahwa argumen hanya bersinggungan dengan masalah nyata.) Namun, SD "baru", sama dengan kali yang biasa, jelas konvergen ke0dalam semua keadaan sebagai ukuran sampelNtumbuh besar. Oleh karena itu,meskipun untuk setiap ukuran sampel tetapNSD baru (sesuai ditafsirkan) adalah ukuran variasi yang cukup memadai di sekitar rata-rata,itu tidak dapat dibenarkan dianggap sebagaiukuranuniversal yangberlaku, dengan interpretasi yang sama, untuk semua ukuran sampel, juga tidak bisa itu benar disebut "rata-rata" dalam arti yang bermanfaat.1/N−−√ 0 N N
3. SD baru rumit untuk ditafsirkan dan digunakan
Pertimbangkan untuk mengambil sampel ukuran (katakanlah) . SD baru dalam kasus ini adalah 1 / √N=4 kali SD biasa. Oleh karena itu ia menikmati interpretasi yang sebanding, seperti analog dari aturan 68-95-99 (sekitar 68% dari data harus berada dalamduaSD baru dari rata-rata, 95% dari mereka dalamempatSD baru dari rata-rata,dll; dan versi ketidaksetaraan klasik seperti Chebychev akan berlaku (tidak lebih dari1/k2data dapat terletak lebih dari2kSD baru dari rata-rata mereka), dan Teorema Limit Sentral dapat secara analog disajikan kembali dalam hal SD baru (satu dibagi dengan √1/N−−√=1/2 1/k2 2k kali SD baru untuk membakukan variabel). Dengan demikian, dalam pengertian yang spesifik dan terbatas ini,tidak ada yang salah dengan proposal siswa. Namun, kesulitannya adalah bahwa semua pernyataan ini mengandung - cukup eksplisit - faktor √N−−√ . Meskipun tidak ada masalah matematika yang melekat dengan ini, itu tentu mempersulit pernyataan dan interpretasi dari hukum statistik yang paling mendasar.N−−√=2
Perlu dicatat bahwa Gauss dan yang lainnya pada awalnya parameter parameter distribusi Gaussian oleh , efektif menggunakan √2–√σ kali SD untuk mengukur penyebaran variabel acak Normal. Penggunaan historis ini menunjukkan kepatutan dan efektivitas penggunaankelipatantetapSD lainnya sebagai gantinya.2–√
sumber
Asumsikan bahwa sampel Anda hanya berisi dua realisasi. Saya kira ukuran dispersi intuitif akan menjadi rata-rata deviasi absolut (AAD)
Jadi kita ingin ukuran dispersi lain pada level unit pengukuran yang sama "dekat" dengan yang di atas.
Varians sampel didefinisikan sebagai
Untuk kembali ke unit pengukuran asli, jika kita melakukan apa yang diminta / disarankan oleh siswa, kita akan mendapatkan ukurannya, sebut sajaq
i.e. we would have "downplayed" the "intuitive" measure of dispersion, while if we have considered the standard deviation as defined,
Since we want to "stay as close as possible" to the intuitive measure, we should useSD .
ADDENDUMn We have
Let's consider now a sample of size
and
we can write the right-hand side of the variance expression as
Then the dispersion measureqn will be
Now think informally: note that∑j≠i|xi−x¯||xj−x¯| contains n2−n terms, and so divided by n2 will left us with "one term in the second power". But also "one term in the 2nd power" is what we have in AAD2 : this is a primitive way to "sense" why qn will tend to zero as n grows large. On the other hand the Standard Deviation as defined would be
Continuing are informal thinking, the first term gives usn "terms in the 2nd power", while the second term gives us n−1 "terms in the second power" . So we will be left eventually with one such term, as n grows large, and then we will take its square root.n , as well as for the case when n→∞ .
This does not mean that the Standard Deviation as defined will equal the Average Absolute Deviation in general (it doesn't), but it does show that it is suitably defined so as to be "on a par" with it for any
sumber