Apakah varians konsep yang lebih mendasar daripada standar deviasi?

18

Di situs psikometrik ini saya membacanya

[A] ta varian tingkat dalam adalah konsep yang lebih mendasar daripada standar deviasi.

Situs ini tidak benar-benar menjelaskan lebih jauh mengapa varians dimaksudkan untuk lebih mendasar daripada standar deviasi, tetapi itu mengingatkan saya bahwa saya telah membaca beberapa hal serupa di situs ini.

Misalnya, dalam komentar ini @ kjetil-b-halvorsen menulis bahwa "standar deviasi baik untuk interpretasi, pelaporan. Untuk mengembangkan teori varians lebih baik".

Saya merasakan bahwa klaim ini terkait, tetapi saya tidak benar-benar memahaminya. Saya mengerti bahwa akar kuadrat dari varians sampel bukanlah penaksir yang tidak bias dari standar deviasi populasi, tetapi tentunya harus ada lebih dari itu.

Mungkin istilah "fundamental" terlalu kabur untuk situs ini. Dalam hal itu, mungkin kita dapat mengoperasionalkan pertanyaan saya dengan menanyakan apakah varians lebih penting daripada standar deviasi dari sudut pandang pengembangan teori statistik. Kenapa / mengapa tidak?

user1205901 - Pasang kembali Monica
sumber
Bukankah mereka hal yang sama? Ini seperti 1 +1 sama dengan 2 * 1?
SmallChess
2
kedua, . The artikel Wikipedia pada cumulants harus terkesan siapa pun dengan cara alami dan penting mereka, tidak hanya untuk studi variabel acak tetapi juga dalam fisika dan kombinatorika. Properti multilinearitas (yang merupakan dasar untuk melakukan perhitungan), serta perluasan kumulans ke distribusi multivarian, tidak dinikmati oleh standar deviasi. κ2
whuber

Jawaban:

16

Jawaban Robert dan Bey memang memberikan bagian dari cerita (yaitu momen cenderung dianggap sebagai sifat dasar distribusi, dan standar deviasi konvensional didefinisikan dalam hal momen sentral kedua daripada sebaliknya), tetapi sejauh mana mereka hal-hal yang benar-benar mendasar sebagian tergantung pada apa yang kita maksud dengan istilah itu.

Tidak akan ada masalah yang tidak dapat diatasi, misalnya, jika kebaktian kita berjalan sebaliknya - tidak ada yang menghentikan kita secara konvensional menentukan beberapa urutan kuantitas yang menggantikan momen-momen biasa, katakanlah untuk (perhatikan bahwa cocok dengan urutan momen dan yang ini sebagai istilah pertama) dan kemudian mendefinisikan momen - dan segala macam perhitungan sehubungan dengan saat - dalam hal mereka. Perhatikan bahwa jumlah ini semua diukur dalam unit asli, yang merupakan salah satu keunggulan dari momen (yang berada dalam kekuatan -th dari unit asli, dan jadi lebih sulit untuk diartikan). Ini akan membuat deviasi standar populasi jumlah yang ditentukan dan varians yang didefinisikan dalam hal itu. p = 1 , 2 , 3 , . . . μ pE[(Xμ)p]1/phal=1,2,3,...μhal

Namun, itu akan membuat kuantitas seperti fungsi penghasil momen (atau beberapa yang setara dengan jumlah baru yang didefinisikan di atas) agak kurang "alami", yang akan membuat hal-hal sedikit lebih canggung (tetapi beberapa konvensi sedikit seperti itu). Ada beberapa sifat nyaman dari MGF yang tidak akan semudah dilemparkan dengan cara lain.

Lebih mendasar, menurut saya (tetapi terkait dengan itu), adalah bahwa ada sejumlah sifat dasar varians yang lebih nyaman ketika ditulis sebagai properti varians daripada ketika ditulis sebagai properti deviasi standar (misalnya varians jumlah penjumlahan independen variabel acak adalah jumlah dari varians).

Aditif ini adalah properti yang tidak dimiliki oleh ukuran dispersi lain dan memiliki sejumlah konsekuensi penting.

[Ada hubungan serupa antara cumulants lain, jadi ini adalah sebuah rasa di mana kita mungkin ingin mendefinisikan hal-hal dalam kaitannya dengan saat-saat yang lebih umum.]

Semua alasan ini bisa dibilang baik konvensi atau kenyamanan tetapi sampai batas tertentu itu masalah sudut pandang (misalnya dari beberapa sudut pandang saat jumlah yang cukup penting, dari yang lain mereka tidak terlalu penting). Mungkin bit "pada level yang dalam" dimaksudkan untuk menyiratkan tidak lebih dari kjetil "ketika mengembangkan teori".

Saya setuju dengan poin kjetil yang Anda angkat dalam pertanyaan Anda; sampai taraf tertentu jawaban ini hanyalah diskusi yang berliku.

Glen_b -Reinstate Monica
sumber
Saya akan mengatakan bahwa keduanya memiliki kedudukan yang sama, masing-masing dengan kenyamanan mereka sendiri.
JM bukan ahli statistik
2

Varians ditentukan oleh momen pertama dan kedua dari suatu distribusi. Sebaliknya, standar deviasi lebih seperti "norma" daripada sesaat. Momen adalah sifat mendasar dari suatu distribusi, sedangkan norma hanyalah cara untuk membuat perbedaan.


sumber
2

Varians lebih mendasar daripada deviasi standar karena deviasi standar didefinisikan sebagai 'akar kuadrat dari varians', misalnya definisi sepenuhnya tergantung pada varians.

Varians, di sisi lain didefinisikan - sepenuhnya independen - sebagai 'harapan perbedaan kuadrat antara sampel dan rata-rata'.

Robert de Graaf
sumber
3
Saya akan melihat ini lebih sebagai laporan tentang cara di mana kita (sering) menggunakan istilah, misalnya dalam mengajar, bukan sebagai refleksi tentang apa yang mendasar. Sangat mungkin untuk memperkenalkan deviasi standar tanpa menyebutkan varians (belum) dan banyak teks dan kursus melakukan hal itu, seperti halnya Anda dapat berbicara tentang teorema Pythagoras tanpa perlu menggunakan nama khusus untuk jumlah kuadrat. Secara historis, perbedaan istilah dalam pengertian statistiknya menunjukkan bahwa deviasi standar, bahkan bentuk kata-kata ini mustahil selama beberapa dekade.
Nick Cox
Saya menyadari deviasi standar yang muncul sebagai label sebelum varians ketika mencoba merumuskan tanggapan terhadap komentar Glen yang sekarang dihapus - pada saat itu saya merefleksikan fakta bahwa istilah yang lebih lama sekarang secara umum didefinisikan dalam istilah istilah yang lebih baru diperkuat. klaim istilah baru itu lebih fundamental daripada melemahkannya.
Robert de Graaf
1
Semua jenis penjelasan dapat ditemukan. Dalam pengajaran pengantar saya tentang SD (untuk ahli geografi, tidak semuanya kuat secara matematis), saya tidak menggunakan istilah varians sama sekali. Saya cepat menunjukkan bahwa SD adalah ukuran skala alami untuk distribusi normal (Gaussian), karena jarak antara rata-rata dan infleksi baik pada fungsi kepadatan. Saya menduga itu lebih untuk hiburan dan kesenangan saya sendiri daripada siswa.
Nick Cox
0

nXVar[X]=σ2S2σ2Sσ

E[S2]=σ2, E[S]σ,
StijnDeVuyst
sumber
2
nn-1
VSebuahr[]VSebuahr[sayaXsaya]=sayaVSebuahr[Xsaya]Xsaya
StijnDeVuyst
1
Memang, tambahan varian independen adalah properti mendasar, tapi itu bukan argumen Anda.
Nick Cox
Mungkin yang menarik adalah bahwa, seperti halnya dengan mean, Anda dapat membuat penduga varians yang tidak bias tanpa menentukan distribusi tertentu (perkiraan yang tidak bias dari standar deviasi adalah spesifik untuk distribusi).
Scortchi - Reinstate Monica