Mengapa kita mengambil akar kuadrat varians untuk membuat standar deviasi?

26

Maaf jika ini telah dijawab di tempat lain, saya belum dapat menemukannya.

Saya bertanya-tanya mengapa kita mengambil akar kuadrat , khususnya, varian untuk membuat standar deviasi? Ada apa dengan mengambil akar kuadrat yang menghasilkan nilai yang berguna?

variance standard-deviation Dave
sumber

Terkait erat: stats.stackexchange.com/questions/35123/…

Sycorax mengatakan Reinstate Monica

2

Pikirkan tentang deviasi standar sebagai norma vektor euclidean dan kemudian varians sebagai kuadrat. Definisi varian dan deviasi standar ini ternyata memiliki sifat analitik yang berguna.

theideasmith

44

Dalam beberapa hal ini adalah pertanyaan sepele, tetapi di sisi lain, ini sebenarnya cukup dalam!

Seperti orang lain telah disebutkan, mengambil akar kuadrat menyiratkan memiliki satuan yang sama dengan . $\operatorname{Stdev}(X)$ $X$
Mengambil akar kuadrat memberi Anda homogenitas absolut alias skalabilitas absolut . Untuk skalar dan variabel acak , kami memiliki: Homogenitas absolut adalah properti yang diperlukan dari suatu norma . Deviasi standar dapat diartikan sebagai norma (pada ruang vektor mean nol variabel acak) dengan cara yang sama yaitu adalah norma Euclidian standar dalam tiga dimensi ruang. Deviasi standar adalah ukuran jarak antara variabel acak dan rata-rata. $\alpha$ $X$
$Stdev [α X] = | α | Stdev [X]$ $\operatorname{Stdev}[\alpha X] = |\alpha| \operatorname{Stdev}[X]$ $\sqrt{x^2 + y^2+z^2}$

Simpangan norma $L_2$

Kasus dimensi terbatas:

Dalam ruang vektor dimensi, norma Euclidian standar alias norma didefinisikan sebagai: $n$ $L_2$

‖ x ‖_{2} = \sqrt{\sum_{i} x_{i}^{2}}

$\|\mathbf{x}\|_2 = \sqrt{\sum_i x_i^2}$

Secara lebih luas, -norm mengambil root untuk mendapatkan absolut homogenitas: . $p$ $\|\mathbf{x}\|_p = \left(\sum_i |x_i|^p \right)^{\frac{1}{p}}$ $p$ $\|\alpha \mathbf{x}\|_p = \left( \sum_i |\alpha x_i|^p \right)^\frac{1}{p} = | \alpha | \left( \sum_i |x_i|^p \right)^\frac{1}{p} = |\alpha | \|\mathbf{x}\|_p$

Jika Anda memiliki bobot maka jumlah tertimbang juga merupakan norma yang valid. Lebih jauh lagi, itu adalah standar deviasi jika mewakili probabilitas dan $q_i$ $\sqrt{\sum_i x_i^2 q_i}$ $q_i$ $\operatorname{E}[\mathbf{x}] \equiv \sum_i x_i q_i = 0$

Kasus dimensi tak terbatas:

Dalam ruang Hilbert dimensi yang tak terbatas, kami juga dapat mendefinisikan norma : $L_2$

‖ X ‖_{2} = \sqrt{\int_{ω} X (ω)^{2} d P (ω)}

$\|X\|_2 = \sqrt{\int_\omega X(\omega)^2 dP(\omega) }$

Jika adalah rata-rata nol variabel acak dan adalah ukuran probabilitas, apa standar deviasi? Itu sama: . $X$ $P$ $\sqrt{\int_\omega X(\omega)^2 dP(\omega) }$

Ringkasan:

Mengambil akar kuadrat berarti deviasi standar memenuhi homogenitas absolut , properti yang diperlukan dari suatu norma .

Pada ruang variabel acak, adalah produk dalam dan the norma yang disebabkan oleh produk dalam itu . Dengan demikian deviasi standar adalah norma dari variabel acak yang direndahkan: Ini adalah ukuran jarak dari mean untuk . $\langle X, Y \rangle = \operatorname{E}[XY]$ $\|X\|_2 = \sqrt{\operatorname{E}[X^2]}$

Stdev [X] = ‖ X - E [X] ‖_{2}

$\operatorname{Stdev}[X] = \|X - \operatorname{E}[X]\|_2$

E [X]

$\operatorname{E}[X]$

X

$X$

(Poin teknis: sementara adalah norma, standar deviasi bukan norma atas variabel acak secara umum karena persyaratan untuk ruang vektor bernorma adalah jika dan hanya jika . Standar deviasi 0 tidak t menyiratkan variabel acak adalah elemen nol.) $\sqrt{\operatorname{E}[X^2]}$ $\sqrt{\operatorname{E}[(X - \operatorname{E}[X])^2]}$ $\|x\| = \mathbf{0}$ $x = \mathbf{0}$

Matthew Gunn
sumber

1

Jawaban ini benar-benar menjadi inti permasalahan, membuatnya lebih informatif daripada yang diterima saat ini.

00rometheus

26

Varians didefinisikan sebagai , sehingga merupakan ekspektasi dari perbedaan kuadrat antara X dan nilai yang diharapkan. $X$ $V(X) = E(X-E(X))^2$

Jika adalah waktu dalam detik, dalam detik, tetapi ada di dan lagi dalam detik. $X$ $X-E(X)$ $V(X)$ $\mbox{seconds}^2$ $\sqrt{V(X)}$

HStamper
sumber

Ah saya mengerti, itu hanya membatalkan perubahan skala yang dihasilkan dari mengkuadratkan perbedaan, dalam perhitungan varians?

Dave

11

Benar - tetapi berubah dalam dimensi , bukan dalam skala.

Jean-François Corbett

Tapi itu tidak seperti ada satu istilah di sana: ada banyak dan masing-masing ketika berkuasa 2, membawa lebih atau kurang dari istilah lainnya. Tetapi ketika kita mengambil akar kuadrat, kita agak mengabaikan perbedaan itu, bukan? Kami tidak akan mendapatkan pembilang awal, jumlah semua perbedaan seperti itu. Bukankah lebih baik mengambil akar kuadrat dari setiap istilah individu?

parsecer

Kedengarannya Anda sedang memikirkan taksiran , berdasarkan sampel. Jika demikian, jika Anda melakukannya, perbedaannya akan hilang: .

\hat{V}

$\hat{V}$

\sum_{i = 1}^{n} (x_{i} - \bar{x}) = \sum_{i = 1}^{n} x_{i} - \sum_{i = 1}^{n} x_{i} = 0

$\sum_{i=1}^n (x_i - \bar{x}) = \sum_{i=1}^n x_i - \sum_{i=1}^n x_i = 0$

HStamper

@EricMittman Kecuali bahwa , bukan , dalam hal ini Anda akan mendapatkan kesalahan absolut rata - rata .

\sqrt{a^{2}} = | a |

$\sqrt{a^2} = \lvert a \rvert$

a

$a$

Dougal

6

Jawaban sederhananya adalah bahwa unit berada pada skala yang sama dengan nilai tengah. Contoh: Saya memperkirakan rata-rata untuk siswa sekolah menengah adalah 160cm dengan standar deviasi (SD) 20cm. Secara intuitif lebih mudah untuk merasakan variasi dengan SD daripada varian 400cm ^ 2.

Optimis
sumber

0

Dalam istilah yang lebih sederhana, standar deviasi dirancang untuk memberi kita angka positif yang mengatakan sesuatu tentang penyebaran data kita tentang artinya.

Jika kita hanya menjumlahkan jarak semua titik dari rata-rata, maka titik dalam arah positif dan negatif akan bergabung dengan cara yang akan cenderung condong kembali ke rata-rata dan kita akan kehilangan informasi tentang penyebaran. Inilah sebabnya kami mengukur varians terlebih dahulu, sehingga semua jarak dipertahankan sebagai jumlah positif melalui kuadrat dan mereka tidak membatalkan satu sama lain. Pada akhirnya kami menginginkan nilai positif yang mewakili unit yang kami mulai - ini telah dikomentari di atas - jadi kami mengambil akar kuadrat positif.

DC_Sebelumnya
sumber

-3

Ini adalah kebodohan historis yang kami teruskan karena kemalasan intelektual. Mereka memilih untuk mengkuadratkan perbedaan dari nilai tengah untuk menghilangkan tanda minus. Kemudian mereka mengambil akar kuadrat untuk membawanya ke skala yang mirip dengan rata-rata.

Seseorang harus menghasilkan statistik baru, varian komputasi dan SD menggunakan modulus atau nilai absolut penyimpangan dari mean. Ini akan menghilangkan seluruh kuadrat ini dan kemudian mengambil bisnis akar kuadrat.

Asir Ajmal
sumber

1

Kami sudah memilikinya, dalam bentuk deviasi absolut rata-rata (atau median), norma L1, dan sejenisnya. Namun, para Keuntungan utama dari pendekatan tradisional adalah bahwa, tidak seperti nilai absolut, itu terdiferensiasi, yang memungkinkan Anda untuk analitis meminimalkan dan memaksimalkan hal.

Matt Krause

1

Anda gagal memberikan pembenaran substantif untuk pendirian Anda, harap berikan argumen matematis yang jelas. Jumlah nilai absolut berskala sangat berbeda dengan akar kuadrat dari jumlah kuadrat. Yang terakhir menekankan kontribusi nilai-nilai ekstrem, yang merupakan properti yang berguna. Selain itu, SSQ merupakan pusat dari metode analitik kuadrat terkecil. Luangkan waktu untuk memperluas masalah SD dan bagaimana alternatifnya dibandingkan sehingga pembaca dapat memahami sudut pandang Anda. .

ReneBt

(-1) Terlalu mudah untuk membaca frasa seperti "kebodohan historis" dan "kemalasan intelektual" sebagai referensi diri.

whuber

Mengapa kita mengambil akar kuadrat varians untuk membuat standar deviasi?

Jawaban:

Simpangan normaL2L2L_2

Kasus dimensi terbatas:

Kasus dimensi tak terbatas:

Ringkasan:

Simpangan norma $L_2$