Maaf jika ini telah dijawab di tempat lain, saya belum dapat menemukannya.
Saya bertanya-tanya mengapa kita mengambil akar kuadrat , khususnya, varian untuk membuat standar deviasi? Ada apa dengan mengambil akar kuadrat yang menghasilkan nilai yang berguna?
Jawaban:
Dalam beberapa hal ini adalah pertanyaan sepele, tetapi di sisi lain, ini sebenarnya cukup dalam!
Seperti orang lain telah disebutkan, mengambil akar kuadrat menyiratkan memiliki satuan yang sama dengan .Stdev(X) X
Mengambil akar kuadrat memberi Anda homogenitas absolut alias skalabilitas absolut . Untuk skalar dan variabel acak , kami memiliki: Homogenitas absolut adalah properti yang diperlukan dari suatu norma . Deviasi standar dapat diartikan sebagai norma (pada ruang vektor mean nol variabel acak) dengan cara yang sama yaitu adalah norma Euclidian standar dalam tiga dimensi ruang. Deviasi standar adalah ukuran jarak antara variabel acak dan rata-rata.α X Stdev[αX]=|α|Stdev[X]
x2+y2+z2−−−−−−−−−−√
Simpangan normaL2
Kasus dimensi terbatas:
Dalam ruang vektor dimensi, norma Euclidian standar alias norma didefinisikan sebagai:n L2
Secara lebih luas, -norm mengambil root untuk mendapatkan absolut homogenitas: .p ∥ x ∥hal= ( ∑saya| xsaya|hal)1hal hal ∥ α x ∥hal= ( ∑saya| α xsaya|hal)1hal= | α | ( ∑saya| xsaya|hal)1hal= | α | ∥ x ∥hal
Jika Anda memiliki bobot maka jumlah tertimbang juga merupakan norma yang valid. Lebih jauh lagi, itu adalah standar deviasi jika mewakili probabilitas danqsaya ∑sayax2sayaqsaya------√ qsaya E[ x ] ≡ ∑sayaxsayaqsaya= 0
Kasus dimensi tak terbatas:
Dalam ruang Hilbert dimensi yang tak terbatas, kami juga dapat mendefinisikan norma :L.2
Jika adalah rata-rata nol variabel acak dan adalah ukuran probabilitas, apa standar deviasi? Itu sama: .X P ∫ωX( ω )2dP( ω )------------√
Ringkasan:
Mengambil akar kuadrat berarti deviasi standar memenuhi homogenitas absolut , properti yang diperlukan dari suatu norma .
Pada ruang variabel acak, adalah produk dalam dan the norma yang disebabkan oleh produk dalam itu . Dengan demikian deviasi standar adalah norma dari variabel acak yang direndahkan: Ini adalah ukuran jarak dari mean untuk .⟨ X, Y⟩ = E[ XY] ‖ X ‖ 2 = √∥ X∥2= E[ X2]-----√ Stdev[X]=‖X-E[X]‖2E[X]XStdev[ X] = ∥ X- E[ X] ∥2 E[ X] X
(Poin teknis: sementara adalah norma, standar deviasi bukan norma atas variabel acak secara umum karena persyaratan untuk ruang vektor bernorma adalah jika dan hanya jika . Standar deviasi 0 tidak t menyiratkan variabel acak adalah elemen nol.)E[ X2]-----√ E[ ( X- E[ X] )2]------------√ ‖x‖=0x=0∥ x ∥ = 0 x = 0
sumber
Varians didefinisikan sebagai , sehingga merupakan ekspektasi dari perbedaan kuadrat antara X dan nilai yang diharapkan.V ( X ) = E ( X - E ( X ) ) 2X V( X) = E( X- E( X) )2
Jika adalah waktu dalam detik, dalam detik, tetapi ada di dan lagi dalam detik.X - E ( X ) V ( X ) detik 2 √X X- E( X) V( X) detik2 V( X)-----√
sumber
Jawaban sederhananya adalah bahwa unit berada pada skala yang sama dengan nilai tengah. Contoh: Saya memperkirakan rata-rata untuk siswa sekolah menengah adalah 160cm dengan standar deviasi (SD) 20cm. Secara intuitif lebih mudah untuk merasakan variasi dengan SD daripada varian 400cm ^ 2.
sumber
Dalam istilah yang lebih sederhana, standar deviasi dirancang untuk memberi kita angka positif yang mengatakan sesuatu tentang penyebaran data kita tentang artinya.
Jika kita hanya menjumlahkan jarak semua titik dari rata-rata, maka titik dalam arah positif dan negatif akan bergabung dengan cara yang akan cenderung condong kembali ke rata-rata dan kita akan kehilangan informasi tentang penyebaran. Inilah sebabnya kami mengukur varians terlebih dahulu, sehingga semua jarak dipertahankan sebagai jumlah positif melalui kuadrat dan mereka tidak membatalkan satu sama lain. Pada akhirnya kami menginginkan nilai positif yang mewakili unit yang kami mulai - ini telah dikomentari di atas - jadi kami mengambil akar kuadrat positif.
sumber
Ini adalah kebodohan historis yang kami teruskan karena kemalasan intelektual. Mereka memilih untuk mengkuadratkan perbedaan dari nilai tengah untuk menghilangkan tanda minus. Kemudian mereka mengambil akar kuadrat untuk membawanya ke skala yang mirip dengan rata-rata.
Seseorang harus menghasilkan statistik baru, varian komputasi dan SD menggunakan modulus atau nilai absolut penyimpangan dari mean. Ini akan menghilangkan seluruh kuadrat ini dan kemudian mengambil bisnis akar kuadrat.
sumber