Jadi ada Standar Deviasi, Varian, dan Kovarian, tetapi apakah ada standar deviasi?
Jika tidak, mengapa tidak? Apakah ada alasan matematika yang mendasar atau itu hanya konvensi?
Jika demikian mengapa tidak digunakan lebih banyak, atau setidaknya sangat sulit ditemukan menggunakan pencarian Google?
Saya tidak bermaksud ini menjadi pertanyaan sembrono, saya mencoba untuk benar-benar mempertanyakan statistik daripada hanya menghafal banyak rumus.
variance
standard-deviation
covariance-matrix
jurang289
sumber
sumber
Jawaban:
Satu sifat yang berguna dari standar deviasi adalah bahwa ia memiliki satuan yang sama dengan rata-rata, demikian besarnyaσX dan X¯ secara langsung sebanding. Saya belum pernah melihat seseorang menghitung deviasi standar co-(dengan mana saya menganggap maksud Anda akar kuadrat dari kovarians); jika satuanX dan Y dilambangkan sebagai [X] dan [Y] , maka satuan kovarians adalah [X][Y] dan satuan deviasi standar akan menjadi [X][Y]−−−−−√ , yang tidak terlalu berguna. Di sisi lain, korelasinya σXY/(σXσY) adalah unitless, dan merupakan skala yang sangat umum untuk melaporkan asosiasi.
Varians (berbeda dengan deviasi standar) berguna karena umumnya memiliki sifat matematika yang lebih bagus; khususnya
Saat Anda memikirkan cara untuk menskalakan varian, Anda juga dapat mempertimbangkan koefisien variasiσX/X¯ (yang tanpa unit), atau rasio varians terhadap rata-rata σ2X/X¯ (yang memiliki unit aneh tetapi bermakna dalam konteks distribusi jumlah seperti Poisson, yang juga tanpa unit).
sumber
Pertanyaannya sepertinya back-to-front. Dalam matematika kita tidak menemukan nama untuk kuantitas "hanya karena kita bisa", tetapi karena kuantitas yang disebutkan berguna untuk sesuatu.
Pertanyaan OP tidak memberi dan alasan mengapa menurutnya ada kuantitas yang berguna yang bisa dinamai "Deviasi standar" dan jawabannya menebak hal-hal yang mungkin berguna.
Untuk menggeneralisasi konsep dengan regresi linear multi-variabel dengann variabel, "kovarians" menjadi n×n matriks simetris . Anda tentu dapat membuat definisi yang masuk akal dari "akar kuadrat dari matriks simetris" selama itu pasti positif atau semi-pasti, tetapi sulit untuk memikirkan penggunaannya dalam konteks ini - dan itu tidak sama sebagai mengambil akar kuadrat dari setiap istilah dari matriks secara terpisah!
Tentu saja akar kuadrat dari matriks diagonal (misalnya matriks varians) hanyalah akar kuadrat dari masing-masing istilah, sehingga konsep "standar deviasi" memang menggeneralisasi dengan cara yang jelas dan bermanfaat - tetapi "deviasi standar" tidak , IMO. Dan secara umum, "akar kuadrat dari sebuah matriks" bahkan tidak didefinisikan secara unik, jadi akar kuadrat mana yang ingin Anda pilih sebagai standar deviasi?
sumber
Kovarian bisa positif dan negatif.
Jadi akar kuadrat dari kovarians bisa nyata atau imajiner.
Anda dapat membandingkan angka nyata dengan angka imajiner untuk ukuran. Unit untuk "standar co-deviasi" tidak nyaman. Tidak ada untungnya mengambil akar kuadrat.
sumber