Hitung rata-rata variabel ordinal

20

Saya sudah membaca di sejumlah tempat yang menghitung rata-rata variabel ordinal tidak tepat. Saya mencoba mendapatkan intuisi mengapa hal itu mungkin tidak pantas. Saya pikir itu karena, secara umum, variabel ordinal tidak terdistribusi secara normal dan perhitungan rata-rata akan memberikan representasi yang tidak akurat. Bisakah seseorang memberikan alasan yang lebih rinci mengapa menghitung rata-rata variabel ordinal mungkin tidak tepat?

luciano
sumber
8
Untuk menghitung rata-rata, Anda perlu penjumlahan terlebih dahulu. Agar penjumlahan menjadi bermakna, Anda membutuhkan 4 + 2 agar sama dengan 3 + 3; ekuivalen, Anda perlu 4-3 = 3-2 = 2-1. Dengan data ordinal - bahkan ketika kategorinya diberi label "1", "2", "3", "4" - ini (secara eksplisit) belum tentu demikian.
Glen_b -Reinstate Monica
Dan mengapa median lebih cocok daripada rata-rata aritmatika?

Jawaban:

24

Jawaban singkatnya adalah ini kontroversial. Bertentangan dengan saran yang Anda sebutkan, orang-orang di banyak bidang memang menggunakan skala timbangan ordinal dan sering bahagia yang berarti melakukan apa yang mereka inginkan. Nilai rata-rata poin atau setara dalam banyak sistem pendidikan adalah salah satu contohnya.

Namun, data ordinal yang tidak didistribusikan secara normal bukan merupakan alasan yang valid, karena rerata

  • banyak digunakan untuk distribusi tidak normal

  • didefinisikan dengan baik secara matematis untuk sangat banyak distribusi non-normal, kecuali dalam beberapa kasus patologis.

Mungkin bukan ide yang baik untuk menggunakan mean dalam praktik jika data jelas tidak terdistribusi normal, tetapi itu berbeda.

Alasan yang lebih kuat untuk tidak menggunakan mean dengan data ordinal adalah karena nilainya tergantung pada konvensi pada pengkodean. Kode numerik seperti 1, 2, 3, 4 biasanya hanya dipilih untuk kesederhanaan atau kenyamanan, tetapi pada prinsipnya mereka bisa sama dengan 1, 23, 456, 7890 sejauh sesuai dengan urutan yang ditentukan seperti yang bersangkutan. Mengambil mean dalam kedua kasus akan melibatkan mengambil konvensi tersebut secara harfiah (yaitu, seolah-olah jumlahnya tidak sewenang-wenang, tetapi dapat dibenarkan), dan tidak ada alasan ketat untuk melakukan itu. Anda membutuhkan skala interval di mana perbedaan yang sama antara nilai-nilai dapat diambil secara harfiah untuk membenarkan cara pengambilan. Itu saya anggap sebagai argumen utama, tetapi seperti yang sudah ditunjukkan orang sering mengabaikannya dan sengaja, karena mereka menemukan cara yang berguna, apa pun teori pengukuran mengatakan.

Ini adalah contoh tambahan. Seringkali orang diminta untuk memilih salah satu dari "sangat tidak setuju" ... "sangat setuju" dan (sebagian tergantung pada apa yang diinginkan perangkat lunak) peneliti mengkode itu sebagai 1 .. 5 atau 0 .. 4 atau apa pun yang mereka inginkan, atau menyatakannya sebagai faktor yang dipesan (atau istilah apa pun yang digunakan perangkat lunak). Di sini pengkodeannya sewenang-wenang dan disembunyikan dari orang-orang yang menjawab pertanyaan.

Tetapi seringkali juga orang-orang ditanya (katakanlah) pada skala 1 sampai 5, bagaimana Anda menilai sesuatu? Banyak contoh: situs web, olahraga, jenis kompetisi lainnya, dan memang pendidikan. Di sini orang diperlihatkan skala dan diminta untuk menggunakannya. Dipahami secara luas bahwa non-integer masuk akal, tetapi Anda hanya diizinkan untuk menggunakan integer sebagai konvensi. Apakah ini skala ordinal? Ada yang bilang ya, ada yang bilang tidak. Jika tidak dimasukkan, bagian dari masalahnya adalah bahwa apa yang dimaksud dengan skala ordinal itu sendiri merupakan area fuzzy atau diperdebatkan.

Pertimbangkan lagi nilai untuk pekerjaan akademik, katakanlah E hingga A. Seringkali nilai tersebut juga diperlakukan secara numerik, katakan sebagai 1 hingga 5, dan secara rutin orang menghitung rata-rata untuk siswa, kursus, sekolah, dll. Dan melakukan analisis lebih lanjut atas data tersebut. Meskipun tetap benar bahwa setiap pemetaan terhadap skor numerik adalah arbitrer tetapi dapat diterima selama itu menjaga ketertiban, namun dalam praktiknya orang yang menugaskan dan menerima nilai tahu bahwa skor memiliki setara numerik dan tahu bahwa nilai akan dirata-ratakan .

Salah satu alasan pragmatis untuk menggunakan cara adalah bahwa median dan mode sering kali merupakan ringkasan yang buruk dari informasi dalam data. Misalkan Anda memiliki skala berjalan dari sangat tidak setuju untuk sangat setuju dan untuk kode kenyamanan poin 1 hingga 5. Sekarang bayangkan satu sampel berkode 1, 1, 2, 2, 2 dan lainnya 1, 2, 2, 4, 5. Sekarang naikkan tangan Anda jika Anda berpikir bahwa median dan mode adalah satu-satunya ringkasan yang dapat dibenarkan karena ini adalah skala ordinal. Sekarang angkat tangan Anda jika Anda menemukan rata-rata berguna juga, terlepas dari apakah jumlahnya didefinisikan dengan baik, dll.

Secara alami, rerata akan menjadi ringkasan hipersensitif jika kode adalah kuadrat atau kubus 1 hingga 5, katakan, dan itu mungkin bukan yang Anda inginkan. (Jika tujuan Anda adalah untuk mengidentifikasi selebaran tingkat tinggi dengan cepat, mungkin itulah yang Anda inginkan!) Tetapi itulah mengapa pengkodean konvensional dengan kode integer yang berurutan adalah pilihan yang praktis, karena sering berhasil dengan cukup baik dalam praktiknya. Itu bukan argumen yang membawa bobot dengan teori pengukuran, juga tidak seharusnya, tetapi analis data harus tertarik dalam menghasilkan ringkasan kaya informasi.

Saya setuju dengan siapa saja yang mengatakan: gunakan seluruh distribusi frekuensi kelas, tapi bukan itu masalahnya.

Nick Cox
sumber
1
Jawaban dan pragmatisme yang bagus itu penting, tetapi saya akan menambahkan satu nada peringatan. Alasan yang baik untuk hanya menggunakan metode yang ditetapkan secara formal adalah bahwa Anda mendapatkan akses ke estimasi kepastian & c. Misalnya jika kita memiliki dua IPK, katakanlah 4,53 dan 4,34, kita mungkin ingin tahu apakah yang satu "secara signifikan" lebih baik daripada yang lain. Tetapi karena kurangnya formalitas dalam rata-rata nilai, kami tidak mendapatkan hal-hal seperti interval kepercayaan & c.
Stephen McAteer
1
@StephenMcAteer Saya melihat maksud Anda dalam hal metode yang diajarkan dalam teks atau kursus pengantar yang khas. Tetapi jika itu keinginan, bootstrapping telah menyediakan teknologi yang memungkinkan interval kepercayaan selama hampir 40 tahun sekarang.
Nick Cox
3

Misalkan kita mengambil nilai urut, misalnya 1 untuk sangat tidak setuju, 2 untuk tidak setuju, 3 untuk setuju, dan 4 untuk sangat setuju. Jika empat orang memberikan jawaban 1,2,3 dan 4, lalu apa artinya? Yaitu (1 + 2 + 3 + 4) /4=2.50.

Bagaimana seharusnya itu ditafsirkan, ketika respon rata-rata empat orang "tidak setuju atau setuju"? Itu sebabnya kita tidak harus menggunakan mean untuk data ordinal.

SAAN
sumber
3
Bermain sedikit sebagai pendukung iblis, dalam contoh ini, saya akan menafsirkan 2.5 sebagai setengah jalan antara 2, "tidak setuju", dan 3, "setuju". Ini masuk akal sebagai rata-rata mengingat bahwa kita memiliki "sangat tidak setuju" vs "sangat setuju", dan "tidak setuju" vs "setuju".
TooTone
1
Setuju berarti 2,5 dalam konteks ini masih masuk akal bagi saya - setengah jalan antara tidak setuju dan setuju, atau dengan kata lain, netral.
luciano
3
Saya pikir Azeem membutuhkan contoh yang lebih kuat. Anda dapat menolak 2.5 sebagai rata-rata 1, 2, 3, 4 anak per keluarga dengan alasan yang sama, bagaimana hal itu ditafsirkan karena bukan salah satu dari nilai yang ditentukan. Itu menimbulkan masalah yang berbeda.
Nick Cox
2
Saya pikir Anda dapat memperkuat jawaban Anda dan saya mendorong Anda melakukan itu. "karena nilai rata-rata mungkin merupakan nilai yang tidak ditentukan" bukanlah argumen yang kuat di sini, secara logis atau psikologis, dan tidak berfokus pada masalah yang lebih dalam tentang apakah perbedaan yang sama benar-benar berarti perbedaan yang sama.
Nick Cox
1
Saya tidak tahu bagaimana saya bisa membuatnya lebih jelas, tetapi (misalnya) "0-4", "5-19", "20-114" dipesan (ordinal) karena hanya ada satu urutan alami untuk pengukuran tersebut. (pendek dari pembalikan). Jika Anda ingin memanggil mereka hal-hal lain juga, itu tidak masalah bagi saya.
Nick Cox
2

Saya sangat setuju dengan @Azeem. Tetapi hanya untuk mendorong titik ini pulang, saya akan sedikit lebih jauh.

Katakanlah Anda memiliki data ordinal seperti dalam contoh dari @Azeem, di mana skala Anda berkisar dari 1 hingga 4. Dan katakan juga Anda memiliki beberapa orang yang memberi peringkat sesuatu (seperti Ice Cream) pada skala ini. Bayangkan Anda mendapatkan hasil berikut:

  • Orang A berkata 4
  • Orang B berkata 3
  • Orang C berkata 1
  • Orang D berkata 2

Ketika Anda ingin menginterpretasikan hasil, Anda dapat menyimpulkan sesuatu sejauh:

  • Orang A menyukai Es Krim lebih dari Orang B
  • Person D lebih menyukai Ice Cream daripada Person C

Namun, Anda tidak tahu apa-apa tentang interval antara peringkat. Apakah perbedaan antara 1 dan 2 sama dengan perbedaan antara 3 dan 4? Apakah peringkat 4 benar-benar berarti bahwa orang tersebut menyukai Es Krim 4 kali lebih banyak daripada seseorang yang menilai 1? Dan seterusnya ... Ketika Anda menghitung rata-rata aritmatika, Anda memperlakukan angka-angka seolah-olah perbedaan di antara mereka sama. Tapi itu asumsi yang cukup kuat dengan data ordinal dan Anda harus membenarkannya.

Jens Kouros
sumber
Saya mengedit referensi untuk jawaban di atas. Jawaban dapat mengubah urutan dan pada kenyataannya jawaban yang di atas adalah pada saat ini di bawah, dan itu bisa berubah. Jadi rujuk silang ke poster, bukan posisi.
Nick Cox
0

Saya setuju dengan konsep bahwa mean aritmatika tidak dapat benar-benar dibenarkan dalam data skala ordinal. Alih-alih menghitung berarti kita dapat menggunakan mode atau median dalam situasi seperti itu yang dapat memberi kita interpretasi hasil yang lebih bermakna.

ayaz
sumber
Ini tidak menjawab pertanyaan mengapa itu mungkin tidak pantas.
Nick Cox