Apa perbedaan antara varian dan standar deviasi?

127

Saya bertanya-tanya apa perbedaan antara varian dan standar deviasi.

Jika Anda menghitung dua nilai, jelas bahwa Anda mendapatkan standar deviasi dari varians, tetapi apa artinya dalam hal distribusi yang Anda amati?

Lebih jauh, mengapa Anda benar-benar membutuhkan deviasi standar?

Le Max
sumber
12
Anda mungkin sudah mendapatkan jawabannya sekarang. Tetap saja tautan ini memiliki penjelasan paling sederhana dan terbaik. mathsisfun.com/data/standard-deviation.html
2
Standar deviasi berguna karena nilainya dalam skala yang sama dengan data dari mana ia dihitung. Jika mengukur meter, standar deviasi adalah meter. Varians, sebaliknya, akan meter kuadrat.
Vladislavs Dovgalecs
1
Variasi standar dapat tidak bias tetapi Deviasi Standar tidak dapat karena fungsi akar kuadrat tidak linier.
Daksh Gargas

Jawaban:

85

Simpangan baku adalah akar kuadrat dari varians.

Standar deviasi dinyatakan dalam satuan yang sama dengan mean, sedangkan varians dinyatakan dalam satuan kuadrat, tetapi untuk melihat distribusi, Anda dapat menggunakan salah satu selama Anda jelas tentang apa yang Anda gunakan. Sebagai contoh, distribusi normal dengan rata-rata = 10 dan sd = 3 persis sama dengan distribusi normal dengan rata-rata = 10 dan varians = 9.

Peter Flom
sumber
58
ya itulah cara matematika untuk menjelaskan dua parameter ini, TAPI whats the explenation logis? Mengapa saya benar-benar membutuhkan dua parameter untuk menunjukkan hal yang sama (penyimpangan di sekitar rata-rata aritmetika) ...
Le Max
5
Anda tidak benar-benar membutuhkan keduanya. Jika Anda melaporkan satu, Anda tidak perlu melaporkan yang lain
Peter Flom
8
Kami membutuhkan keduanya: standar deviasi baik untuk interpretasi, pelaporan. Untuk mengembangkan teori varians lebih baik.
kjetil b halvorsen
4
Manfaat dari pelaporan standar deviasi adalah tetap dalam skala data. Katakanlah, sampel ketinggian orang dewasa adalah dalam meter, maka standar deviasi juga akan dalam meter.
Vladislavs Dovgalecs
5
@RushatRai Ketika berhadapan dengan jumlah variabel acak, varians ditambahkan bersama-sama. Untuk variabel acak independen, . Ungkapan yang serupa ada dalam kasus umum tanpa independensi (dengan koreksi menggunakan istilah kovarians). Secara umum, transformasi akar kuadrat mempersulit hal-hal dan membuat standar deviasi lebih sulit untuk dikerjakan secara analitis. Var(Xi)=Var(Xi)
Knrumsey
49

Anda tidak perlu keduanya. Mereka masing-masing memiliki tujuan berbeda. SD biasanya lebih berguna untuk menggambarkan variabilitas data sedangkan varians biasanya jauh lebih bermanfaat secara matematis. Sebagai contoh, jumlah dari distribusi tidak berkorelasi (variabel acak) juga memiliki varian yang merupakan jumlah dari varian distribusi tersebut. Ini tidak akan berlaku untuk SD. Di sisi lain, SD memiliki kenyamanan diekspresikan dalam satuan variabel asli.

John
sumber
24

Jika John merujuk pada variabel acak independen ketika ia mengatakan "distribusi tidak terkait," maka jawabannya benar. Namun, untuk menjawab pertanyaan Anda, ada beberapa poin yang dapat ditambahkan:

  1. Mean dan varians adalah dua parameter yang menentukan distribusi normal.

  2. Ketidaksamaan Chebyshev membatasi kemungkinan variabel acak yang diamati berada dalam standar deviasi dari rata-rata.k

  3. Standar deviasi digunakan untuk menormalkan statistik untuk uji statistik (mis. Standar deviasi yang diketahui digunakan untuk menormalkan rata-rata sampel untuk uji bahwa rata-rata berbeda dari atau standar deviasi sampel digunakan untuk menormalkan rata-rata sampel ketika standar sebenarnya penyimpangan tidak diketahui, menghasilkan uji ).0 tz0t

  4. Untuk distribusi normal, persen dari distribusi berada dalam standar deviasi. dalam standar deviasi dan lebih dari dalam standar deviasi.1 95,4 % 2 99 % 368%195.4%299%3

  5. Margin of error dinyatakan sebagai kelipatan dari standar deviasi estimasi.

  6. Varians dan bias adalah ukuran ketidakpastian dalam jumlah acak. Kesalahan kuadrat rata-rata untuk estimasi sama dengan varians + bias kuadrat.

Michael Chernick
sumber
4
Anda mungkin tidak boleh mengatakan "parameter alami", yang berarti dibagi dengan varians, dan 1 dibagi dengan varians: en.wikipedia.org/wiki/Natural_parameter
Neil G
σ
Dalam poin 3, bukankah seharusnya "standar deviasi digunakan untuk membakukan statistik" alih-alih menormalkan?
Harry
15

Varian dari set data mengukur dispersi matematis dari data relatif terhadap rata-rata. Namun, meskipun nilai ini secara teori benar, sulit untuk diterapkan dalam arti dunia nyata karena nilai yang digunakan untuk menghitungnya dikuadratkan. Deviasi standar, sebagai akar kuadrat dari varians memberikan nilai yang ada di unit yang sama dengan nilai-nilai aslinya, yang membuatnya lebih mudah untuk bekerja dengan dan lebih mudah untuk diinterpretasikan bersama dengan konsep kurva normal.

Hassan
sumber
Ini sangat membantu menjelaskan mengapa secara sederhana.
gwg
3
Hal lain yang baik untuk dibuat adalah bahwa setiap metrik sd dan var mengukur penyebaran variabel tentang rata-rata. Mengambil akar kuadrat dari varians untuk mendapatkan standar deviasi dapat dilihat sebagai faktor penskalaan yang diterapkan untuk mengembalikan metrik ke dalam unit variabel.
Matt L.
6

Dalam hal distribusi mereka setara (namun jelas tidak dapat dipertukarkan), tetapi berhati-hatilah bahwa dalam hal penduga mereka tidak: akar kuadrat dari estimasi varians BUKAN merupakan (tidak bias) estimator dari standar deviasi. Hanya untuk jumlah sampel yang cukup besar (dan tergantung pada penaksirnya) keduanya saling mendekati. Untuk ukuran sampel kecil Anda perlu mengetahui bentuk parametrik dari distribusi untuk mengkonversi antara keduanya, yang dapat menjadi sedikit melingkar.

Kuarsa
sumber
4

Saat menghitung varians, kami kuadratkan penyimpangannya. Ini berarti bahwa jika data yang diberikan (pengamatan) adalah dalam meter, itu akan menjadi meter persegi. Berharap itu bukan representasi yang benar tentang penyimpangan. Jadi, kita kuadratkan lagi root (SD) yang tidak lain adalah SD.

g ravi
sumber