Intuisi dan penggunaan untuk koefisien variasi

11

Saat ini saya menghadiri kursus Pengantar Manajemen Operasi di Coursera.org. Pada titik tertentu dalam kursus, profesor mulai berurusan dengan variasi waktu operasi.

Pengukuran yang ia gunakan adalah Koefisien Variasi , rasio antara standar deviasi dan rata-rata:

cv=σμ

Mengapa pengukuran ini digunakan? Apa kelebihan dan kekurangan bekerja dengan CV selain bekerja dengan, katakanlah, standar deviasi? Apa intuisi di balik pengukuran ini?

Lucas Reis
sumber

Jawaban:

8

Saya menganggapnya sebagai ukuran relatif dari penyebaran atau variabilitas dalam data. Jika Anda memikirkan pernyataan, "Deviasi standar adalah 2,4" itu benar-benar memberi tahu Anda apa-apa tanpa menghormati mean (dan dengan demikian satuan ukuran, saya kira). Jika rata-rata sama dengan 104, standar deviasi 2,4 mengkomunikasikan gambaran yang sangat berbeda dari penyebaran daripada jika rata-rata adalah 25.452 dengan standar deviasi 2,4 ..

Alasan yang sama Anda menormalkan data (kurangi mean dan bagi dengan deviasi standar) untuk menempatkan data yang dinyatakan dalam unit yang berbeda pada pijakan yang sebanding atau sama — demikian juga ukuran variabilitas ini dinormalisasi — untuk membantu dalam perbandingan.

B_Miner
sumber
2

Koefisien variasi secara efektif merupakan ukuran relatif atau normal dari variasi dalam set data, (misalnya deret waktu) karena merupakan proporsi (dan karenanya dapat dinyatakan sebagai persentase). Secara intuitif, jika rata-rata adalah nilai yang diharapkan, maka koefisien variasi adalah variabilitas yang diharapkan dari suatu pengukuran, relatif terhadap rata-rata.

Ini berguna ketika membandingkan pengukuran di beberapa set data heterogen atau lintas beberapa pengukuran yang diambil pada set data yang sama - koefisien variasi antara dua set data, atau dihitung untuk dua set pengukuran dapat langsung dibandingkan, bahkan jika data di masing-masing diukur pada skala yang sangat berbeda, tingkat pengambilan sampel atau resolusi. Sebaliknya, standar deviasi spesifik untuk pengukuran / sampel yang diperolehnya, yaitu absolut daripada ukuran relatif variasi.

BGreene
sumber
Bisakah Anda jelaskan bagian ini lebih lanjut: "Koefisien variasi adalah variabilitas yang diharapkan dari suatu pengukuran dalam suatu interval"?
B_Miner
@ B_Miner Maksud saya interval dalam arti pemrosesan sinyal dan telah diedit di atas. Std dev secara efektif variasi rata-rata atau yang diharapkan.
BGreene
-2

menurut pemahaman saya, yang dimaksud adalah parameter lokasi. sd / mean seharusnya tidak dianggap sebagai koefisien variasi. Mengapa? argumen sederhana adalah bahwa jarak statistik berbeda dari jarak euclidean. untuk mengukur jarak statistik kami menggunakan sd; jarak kasar untuk satu variabel. misalkan 50 berarti dan 2 adalah sd maka 4% akan menjadi cv. sekarang rata-rata adalah 5 dan sd adalah 2 cv = 40%. istilah variasi statistik tidak tergantung pada asal. jadi sd itu sendiri adalah ukuran variasi yang baik. dan ingat satu aturan dari fisika yaitu jangan membandingkan dua unit sistem dalam satu masalah.

tandle devendra
sumber
2
Sulit untuk melihat argumen yang masuk akal di sini. Kita tidak seharusnya menganggap sd / mean menjadi koefisien variasi? Begitulah didefinisikan. Jika Anda bermaksud bahwa itu tidak berguna, jelaskan alasannya. (Jika Anda pikir itu salah, itu cerita yang berbeda.) Jarak statistik berbeda dari jarak Euclidean? Itu hanya pernyataan dan bergantung pada mengetahui apa yang Anda maksud dengan jarak statistik. Karena banyak jenis jarak muncul dalam statistik, pernyataan tetap tidak jelas. (Saya tidak mengundurkan diri, tetapi saya mendorong Anda untuk menulis ulang ini. Anda mungkin perlu bekerja dengan seorang teman dengan perintah bahasa Inggris tertulis yang lebih baik.)
Nick Cox