Saya bertanya-tanya apa perbedaan antara varian dan standar deviasi.
Jika Anda menghitung dua nilai, jelas bahwa Anda mendapatkan standar deviasi dari varians, tetapi apa artinya dalam hal distribusi yang Anda amati?
Lebih jauh, mengapa Anda benar-benar membutuhkan deviasi standar?
Jawaban:
Simpangan baku adalah akar kuadrat dari varians.
Standar deviasi dinyatakan dalam satuan yang sama dengan mean, sedangkan varians dinyatakan dalam satuan kuadrat, tetapi untuk melihat distribusi, Anda dapat menggunakan salah satu selama Anda jelas tentang apa yang Anda gunakan. Sebagai contoh, distribusi normal dengan rata-rata = 10 dan sd = 3 persis sama dengan distribusi normal dengan rata-rata = 10 dan varians = 9.
sumber
Anda tidak perlu keduanya. Mereka masing-masing memiliki tujuan berbeda. SD biasanya lebih berguna untuk menggambarkan variabilitas data sedangkan varians biasanya jauh lebih bermanfaat secara matematis. Sebagai contoh, jumlah dari distribusi tidak berkorelasi (variabel acak) juga memiliki varian yang merupakan jumlah dari varian distribusi tersebut. Ini tidak akan berlaku untuk SD. Di sisi lain, SD memiliki kenyamanan diekspresikan dalam satuan variabel asli.
sumber
Jika John merujuk pada variabel acak independen ketika ia mengatakan "distribusi tidak terkait," maka jawabannya benar. Namun, untuk menjawab pertanyaan Anda, ada beberapa poin yang dapat ditambahkan:
Mean dan varians adalah dua parameter yang menentukan distribusi normal.
Ketidaksamaan Chebyshev membatasi kemungkinan variabel acak yang diamati berada dalam standar deviasi dari rata-rata.k
Standar deviasi digunakan untuk menormalkan statistik untuk uji statistik (mis. Standar deviasi yang diketahui digunakan untuk menormalkan rata-rata sampel untuk uji bahwa rata-rata berbeda dari atau standar deviasi sampel digunakan untuk menormalkan rata-rata sampel ketika standar sebenarnya penyimpangan tidak diketahui, menghasilkan uji ).0 tz 0 t
Untuk distribusi normal, persen dari distribusi berada dalam standar deviasi. dalam standar deviasi dan lebih dari dalam standar deviasi.1 95,4 % 2 99 % 368% 1 95.4% 2 99% 3
Margin of error dinyatakan sebagai kelipatan dari standar deviasi estimasi.
Varians dan bias adalah ukuran ketidakpastian dalam jumlah acak. Kesalahan kuadrat rata-rata untuk estimasi sama dengan varians + bias kuadrat.
sumber
Varian dari set data mengukur dispersi matematis dari data relatif terhadap rata-rata. Namun, meskipun nilai ini secara teori benar, sulit untuk diterapkan dalam arti dunia nyata karena nilai yang digunakan untuk menghitungnya dikuadratkan. Deviasi standar, sebagai akar kuadrat dari varians memberikan nilai yang ada di unit yang sama dengan nilai-nilai aslinya, yang membuatnya lebih mudah untuk bekerja dengan dan lebih mudah untuk diinterpretasikan bersama dengan konsep kurva normal.
sumber
Dalam hal distribusi mereka setara (namun jelas tidak dapat dipertukarkan), tetapi berhati-hatilah bahwa dalam hal penduga mereka tidak: akar kuadrat dari estimasi varians BUKAN merupakan (tidak bias) estimator dari standar deviasi. Hanya untuk jumlah sampel yang cukup besar (dan tergantung pada penaksirnya) keduanya saling mendekati. Untuk ukuran sampel kecil Anda perlu mengetahui bentuk parametrik dari distribusi untuk mengkonversi antara keduanya, yang dapat menjadi sedikit melingkar.
sumber
Saat menghitung varians, kami kuadratkan penyimpangannya. Ini berarti bahwa jika data yang diberikan (pengamatan) adalah dalam meter, itu akan menjadi meter persegi. Berharap itu bukan representasi yang benar tentang penyimpangan. Jadi, kita kuadratkan lagi root (SD) yang tidak lain adalah SD.
sumber