Saya mendapatkan berbagai tipe data dan saya butuh bantuan:
Jika Anda melihat gambar di atas (diambil dari sini ), ia memiliki tipe data seperti ini:
- Kuantitatif (Terpisah, Berkelanjutan)
- Kualitatif (Nominal (N), Ordinal (O), Binary (B)).
Tetapi jika Anda melihat gambar berikut ini (dari sini ), kategorinya adalah:
- Kuantitatif (Diskrit (NOB))
- Kualitatif
Satu gambar memiliki NOB di bawah Kualitatif, yang lain memilikinya di bawah Kuantitatif. Yang mana yang benar?
Jawaban:
Tipologi ini dapat dengan mudah membingungkan seperti yang dijelaskan.
Misalnya, data biner, seperti yang diperkenalkan dalam banyak teks atau kursus pengantar, tentu terdengar kualitatif: ya atau tidak, selamat atau mati, ada atau tidak ada, pria atau wanita, apa pun. Tapi skorkan dua kemungkinan 1 atau 0 dan semuanya kuantitatif sempurna. Penilaian semacam itu adalah dasar dari semua jenis analisis: proporsi perempuan hanya rata-rata beberapa 0 untuk laki-laki dan 1 untuk perempuan. Jika saya bertemu 7 wanita dan 3 pria, saya bisa rata-rata 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 untuk mendapatkan proporsi 0,7. Dengan respons biner, Anda memiliki jalan terbuka yang luas untuk mencatat dan mengeluarkan regresi, dan sebagainya, yang berfokus pada variasi dalam proporsi, fraksi atau probabilitas yang bertahan, atau sesuatu yang serupa, dengan apa pun yang mengontrol atau memengaruhinya. Tidak ada yang perlu khawatir dengan pengkodean yang sewenang-wenang. Proporsi laki-laki hanya 1 dikurangi proporsi perempuan,
Hampir sama juga berlaku ketika data nominal atau ordinal sedang dipertimbangkan, karena setiap analisis data tersebut bergantung pada penghitungan pertama, berapa banyak yang masuk dalam setiap kategori dan kemudian Anda dapat menjadi kuantitatif yang Anda inginkan. Bagan pie dan bagan batang, seperti yang pertama kali ditemukan pada tahun-tahun awal, menunjukkan hal itu, sehingga membingungkan berapa banyak akun yang melewatkan ini dalam penjelasan.
Dengan kata lain, Anda dapat mengklasifikasikan data mentah atau asli sebagai yang pertama kali dilaporkan dan sebagai yang muncul di katakanlah sel spreadsheet atau database. Tetapi bentuk aslinya tidak berubah. Bayangkan sesuatu yang benar-benar seperti kematian karena kebingungan karena terlalu banyak membaca buku teks yang dangkal. Itu dapat ditulis pada sertifikat, tetapi analisis statistik tidak pernah berhenti di situ. Ada agregasi untuk menghitung (berapa banyak kematian seperti itu di suatu daerah dan periode waktu), pengurangan tingkat (berapa banyak relatif terhadap populasi yang berisiko), dan sebagainya.
Jadi, bagaimana data pertama kali dikodekan jarang menghambat penggunaannya dengan cara lain dan transformasi ke bentuk lain. Etimologi data di sini mengungkapkan: menerjemahkan bahasa Latin asli secara harfiah, mereka seperti yang diberikan kepada Anda, tetapi tidak ada aturan terhadap mengubahnya menjadi banyak bentuk lainnya.
sumber
Semua, saya tidak dapat menemukan satu gambar yang menyatukan semuanya, jadi saya membuat satu berdasarkan apa yang telah saya pelajari. Menempatkan skala pengukuran pada diagram yang sama dengan tipe data membingungkan saya, jadi saya mencoba menunjukkan bahwa ada perbedaan di sana.
Saya menghargai bantuan dan pikiran Anda! Salam, Miring
sumber
Itu tergantung apa yang Anda maksud dengan "data kuantitatif" dan "data kualitatif".
Saya pikir dua situs yang Anda kutip menggunakan istilah berbeda. Misalkan, Anda bertanya pada orang:
Jenis data apa ini? Variabelnya nominal: Hanya nama, tidak ada urutannya. Tetapi banyak orang akan menyebutnya kuantitatif karena kuncinya adalah berapa banyak yang memilih kandidat. Itu berlawanan dengan data kualitatif yang mungkin merupakan transkripsi wawancara tentang apa yang paling mereka sukai tentang Obama (atau Romney atau siapa pun).
Cara yang lebih baik untuk melihatnya adalah dengan jelas membedakan data kuantitatif dari variabel kuantitatif.
sumber
Tidak satu pun dari grafik ini yang benar. Mereka agak tidak masuk akal dan Anda benar untuk bingung (selain dari kontradiksi).
Mereka tampaknya menyatukan ide-ide tipe variabel mendasar dan pemilihan variabel untuk memodelkan suatu sistem (dengan pdf).
Ada 3 jenis variabel mendasar (tidak termasuk subtipe): Nominal (kategorikal / kualitatif), Ordinal, dan Berkelanjutan (Numerik, Kuantitatif). Ordinal memiliki sifat kualitatif dan kuantitatif.
Atribut bukan tipe dasar tetapi biasanya dibahas dengan cara itu ketika memilih diagram kontrol yang tepat, di mana seseorang memilih pdf terbaik untuk memodelkan sistem. Ini kadang-kadang disebut "data atribut", tetapi jenisnya adalah nominal (alias kategori dll). Seperti yang disebutkan Nick, kami menghitung nominal, sehingga dapat dikacaukan dengan tipe numerik, tetapi tidak.
sumber
Saya menemukan pertanyaan ini ketika mencari tentang tingkat pengukuran dan konsep terkait. Saya pikir grafik dalam pertanyaan kurang konteks. Ketika kita melakukan kategorisasi, kita mendefinisikan aturan untuk mengelompokkan objek sesuai dengan tujuan kita. Jadi apa tujuannya? Dan apakah kita berbicara tentang variabel?
Kita bisa mengkategorikan variabel berdasarkan tingkat pengukuran , lalu kita bisa memiliki 4 skala (kelompok) dengan aturan berikut:
nominal : atribut suatu variabel hanya dibedakan berdasarkan nama (kategori) dan tidak ada urutan (peringkat, posisi).
ordinal : atribut suatu variabel dibedakan berdasarkan urutan (pangkat, posisi), tetapi kita tidak tahu tingkat perbedaan relatif di antara mereka.
interval : atribut suatu variabel dibedakan berdasarkan derajat perbedaan di antara mereka, tetapi tidak ada nol absolut, dan rasio antara atribut tidak diketahui.
rasio : atribut suatu variabel dibedakan berdasarkan derajat perbedaan di antara mereka, ada nol absolut, dan kita bisa menemukan rasio antara atribut.
Dan ini hanya satu pendekatan dari Stanley Smith Stevens. Ada beberapa tipologi lain.
Variabel kontinu dan diskrit adalah konsep matematika di mana kita memiliki serangkaian bilangan real dan:
variabel kontinu dapat mengambil nilai apa pun dalam rentang ini. Jumlah nilai yang diizinkan tidak terhitung.
sedangkan untuk variabel diskrit , jumlah nilai yang diizinkan dalam rentang adalah terbatas atau tak terhingga tak terhingga.
sumber