Apakah nominal, ordinal, & biner untuk data kuantitatif, data kualitatif, atau keduanya?

9

Saya mendapatkan berbagai tipe data dan saya butuh bantuan:

masukkan deskripsi gambar di sini

Jika Anda melihat gambar di atas (diambil dari sini ), ia memiliki tipe data seperti ini:

  • Kuantitatif (Terpisah, Berkelanjutan)
  • Kualitatif (Nominal (N), Ordinal (O), Binary (B)).

masukkan deskripsi gambar di sini

Tetapi jika Anda melihat gambar berikut ini (dari sini ), kategorinya adalah:

  • Kuantitatif (Diskrit (NOB))
  • Kualitatif

Satu gambar memiliki NOB di bawah Kualitatif, yang lain memilikinya di bawah Kuantitatif. Yang mana yang benar?

Condong
sumber
5
Setiap peluru dalam deskripsi "data diskrit" salah dan menyesatkan.
whuber

Jawaban:

5

Tipologi ini dapat dengan mudah membingungkan seperti yang dijelaskan.

Misalnya, data biner, seperti yang diperkenalkan dalam banyak teks atau kursus pengantar, tentu terdengar kualitatif: ya atau tidak, selamat atau mati, ada atau tidak ada, pria atau wanita, apa pun. Tapi skorkan dua kemungkinan 1 atau 0 dan semuanya kuantitatif sempurna. Penilaian semacam itu adalah dasar dari semua jenis analisis: proporsi perempuan hanya rata-rata beberapa 0 untuk laki-laki dan 1 untuk perempuan. Jika saya bertemu 7 wanita dan 3 pria, saya bisa rata-rata 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 untuk mendapatkan proporsi 0,7. Dengan respons biner, Anda memiliki jalan terbuka yang luas untuk mencatat dan mengeluarkan regresi, dan sebagainya, yang berfokus pada variasi dalam proporsi, fraksi atau probabilitas yang bertahan, atau sesuatu yang serupa, dengan apa pun yang mengontrol atau memengaruhinya. Tidak ada yang perlu khawatir dengan pengkodean yang sewenang-wenang. Proporsi laki-laki hanya 1 dikurangi proporsi perempuan,

Hampir sama juga berlaku ketika data nominal atau ordinal sedang dipertimbangkan, karena setiap analisis data tersebut bergantung pada penghitungan pertama, berapa banyak yang masuk dalam setiap kategori dan kemudian Anda dapat menjadi kuantitatif yang Anda inginkan. Bagan pie dan bagan batang, seperti yang pertama kali ditemukan pada tahun-tahun awal, menunjukkan hal itu, sehingga membingungkan berapa banyak akun yang melewatkan ini dalam penjelasan.

Dengan kata lain, Anda dapat mengklasifikasikan data mentah atau asli sebagai yang pertama kali dilaporkan dan sebagai yang muncul di katakanlah sel spreadsheet atau database. Tetapi bentuk aslinya tidak berubah. Bayangkan sesuatu yang benar-benar seperti kematian karena kebingungan karena terlalu banyak membaca buku teks yang dangkal. Itu dapat ditulis pada sertifikat, tetapi analisis statistik tidak pernah berhenti di situ. Ada agregasi untuk menghitung (berapa banyak kematian seperti itu di suatu daerah dan periode waktu), pengurangan tingkat (berapa banyak relatif terhadap populasi yang berisiko), dan sebagainya.

Jadi, bagaimana data pertama kali dikodekan jarang menghambat penggunaannya dengan cara lain dan transformasi ke bentuk lain. Etimologi data di sini mengungkapkan: menerjemahkan bahasa Latin asli secara harfiah, mereka seperti yang diberikan kepada Anda, tetapi tidak ada aturan terhadap mengubahnya menjadi banyak bentuk lainnya.

Nick Cox
sumber
5

Semua, saya tidak dapat menemukan satu gambar yang menyatukan semuanya, jadi saya membuat satu berdasarkan apa yang telah saya pelajari. Menempatkan skala pengukuran pada diagram yang sama dengan tipe data membingungkan saya, jadi saya mencoba menunjukkan bahwa ada perbedaan di sana.

masukkan deskripsi gambar di sini

Saya menghargai bantuan dan pikiran Anda! Salam, Miring

Condong
sumber
Variabel kuantitatif diskrit (seperti jumlah) juga dapat diukur menggunakan skala interval atau rasio! Lihat di sini , misalnya.
Rodvi
3

Itu tergantung apa yang Anda maksud dengan "data kuantitatif" dan "data kualitatif".

Saya pikir dua situs yang Anda kutip menggunakan istilah berbeda. Misalkan, Anda bertanya pada orang:

Did you vote for Obama, Romney, someone else or no one in the presidential election?

Jenis data apa ini? Variabelnya nominal: Hanya nama, tidak ada urutannya. Tetapi banyak orang akan menyebutnya kuantitatif karena kuncinya adalah berapa banyak yang memilih kandidat. Itu berlawanan dengan data kualitatif yang mungkin merupakan transkripsi wawancara tentang apa yang paling mereka sukai tentang Obama (atau Romney atau siapa pun).

Cara yang lebih baik untuk melihatnya adalah dengan jelas membedakan data kuantitatif dari variabel kuantitatif.

Peter Flom
sumber
Dalam kasus pertama, ada satu variabel, yang memegang nama presiden. Variabelnya adalah kualitatif, tepatnya nominal. Dalam kasus kedua, setiap nama presiden sesuai dengan variabel individu, yang memegang pemilih. Jika, nama pemilih diketahui, dan, itu memegang nama pemilih, maka variabelnya nominal. Jika memiliki jumlah suara, variabelnya kuantitatif, tepatnya dalam skala rasio.
Ioannis Iliadis - Ilousis
2

Tidak satu pun dari grafik ini yang benar. Mereka agak tidak masuk akal dan Anda benar untuk bingung (selain dari kontradiksi).

Mereka tampaknya menyatukan ide-ide tipe variabel mendasar dan pemilihan variabel untuk memodelkan suatu sistem (dengan pdf).

Ada 3 jenis variabel mendasar (tidak termasuk subtipe): Nominal (kategorikal / kualitatif), Ordinal, dan Berkelanjutan (Numerik, Kuantitatif). Ordinal memiliki sifat kualitatif dan kuantitatif.

Atribut bukan tipe dasar tetapi biasanya dibahas dengan cara itu ketika memilih diagram kontrol yang tepat, di mana seseorang memilih pdf terbaik untuk memodelkan sistem. Ini kadang-kadang disebut "data atribut", tetapi jenisnya adalah nominal (alias kategori dll). Seperti yang disebutkan Nick, kami menghitung nominal, sehingga dapat dikacaukan dengan tipe numerik, tetapi tidak.

mandata
sumber
1
Mandata, berdasarkan apa yang Anda katakan, perubahan apa yang akan Anda buat pada bagan yang saya buat di atas? saya menghargai bantuan Anda. Regards, Leaning
Leaning
Mandata, semua bagan ini dari para ahli yang berbeda sebagian benar. Masalahnya adalah bahwa orang memahami kata-kata dan konsep-konsep yang tidak sepenuhnya identik tetapi mereka lebih suka, untuk waktu yang lama atau pendek, untuk menumpuk ke pemahaman nyaman mereka sendiri. Sebagai contoh, beberapa orang akan menolak untuk menyebut skala ordinal "kuantitatif" sementara yang lain akan menerima, tergantung apakah "kuantitas" perlu diwujudkan dari kategori makhluk yang berpotensi mendasarinya.
ttnphns
@Condong. Bagan itu lebih baik daripada yang terakhir Anda. Saya akan mempertimbangkan kualitas tipe diskrit, bukan tipe itu sendiri. Nominal dan teratur seluruhnya diskrit, sementara kuantitatif (terbatas atau tak terbatas) juga dapat dihitung. Biner juga merupakan karakteristik dari tipe (itu adalah subset dari diskrit). Biner jarang dipesan, dan hampir selalu diwakili oleh variabel nominal. Kategorikal dan nominal adalah sinonim. perbedaan antara variabel yang dipesan hampir tidak berarti, mereka mungkin sebagian atau seluruhnya tidak diketahui, atau tidak relevan (yang terakhir menyiratkan tidak berarti), tetapi saya tidak akan menyatakan itu.
mandata
@ttnphns, saya setuju dengan apa yang Anda katakan dalam semangat, tetapi mereka berdua memiliki kesalahan konseptual yang serius. yang pertama mencampurkan gagasan tipe data atribut, yang digunakan dalam memilih bagan kontrol, yang merupakan tipe data dasar. Yang kedua memiliki nominal sebagai subset diskrit yang merupakan subset kontinu. Saya mungkin mengelompokkan secara terpisah, tetapi nominal termasuk di bawah kualitatif. Mungkin ada di sana karena orang menghitung peristiwa nominal secara terpisah, tetapi bahkan jika itu sebabnya itu tidak benar.
mandata
Saya tidak merasa teori Interval / Rasio adalah cara yang valid untuk menggambarkan tipe variabel. Mungkin baik untuk menentukan fungsi apa yang masuk akal ketika seseorang tidak merasa yakin dengan matematika, tetapi lebih dari itu, saya melihat satu skala sebagai transformasi dari skala lain jika mereka mewakili dimensi atau unit yang sama.
mandata
1

Saya menemukan pertanyaan ini ketika mencari tentang tingkat pengukuran dan konsep terkait. Saya pikir grafik dalam pertanyaan kurang konteks. Ketika kita melakukan kategorisasi, kita mendefinisikan aturan untuk mengelompokkan objek sesuai dengan tujuan kita. Jadi apa tujuannya? Dan apakah kita berbicara tentang variabel?

Kita bisa mengkategorikan variabel berdasarkan tingkat pengukuran , lalu kita bisa memiliki 4 skala (kelompok) dengan aturan berikut:

nominal : atribut suatu variabel hanya dibedakan berdasarkan nama (kategori) dan tidak ada urutan (peringkat, posisi).
ordinal : atribut suatu variabel dibedakan berdasarkan urutan (pangkat, posisi), tetapi kita tidak tahu tingkat perbedaan relatif di antara mereka.
interval : atribut suatu variabel dibedakan berdasarkan derajat perbedaan di antara mereka, tetapi tidak ada nol absolut, dan rasio antara atribut tidak diketahui.
rasio : atribut suatu variabel dibedakan berdasarkan derajat perbedaan di antara mereka, ada nol absolut, dan kita bisa menemukan rasio antara atribut.

Dan ini hanya satu pendekatan dari Stanley Smith Stevens. Ada beberapa tipologi lain.

Variabel kontinu dan diskrit adalah konsep matematika di mana kita memiliki serangkaian bilangan real dan:

variabel kontinu dapat mengambil nilai apa pun dalam rentang ini. Jumlah nilai yang diizinkan tidak terhitung.
sedangkan untuk variabel diskrit , jumlah nilai yang diizinkan dalam rentang adalah terbatas atau tak terhingga tak terhingga.

wombatonfire
sumber