Apa perbedaan antara data diskrit dan data kontinu?

63

Apa perbedaan antara data diskrit dan data kontinu?

Albort
sumber
2
Apakah Anda mencoba Google terlebih dahulu? Bagi saya, ini memberi ini .
robin girard
Ini adalah video bagus yang menjawab pertanyaan Anda. youtube.com/watch?v=MIX3ZpzEOdM
2
Bayangkan saja digital vs analog. Hal yang sama - nama berbeda.
Pithikos
Saya benar-benar tidak tahu apa perbedaan antara data "diskrit" dan "kontinu". Untuk beberapa alasan, kelas stat intro tampaknya sangat menikmati membuat siswa menghafal aturan untuk membedakan kedua hal ini. Sejauh yang saya bisa mengerti, perbedaannya bukan pada data - tetapi bagaimana kita memilih untuk memodelkan data.
user795305
1
Ini adalah hasil teratas di Google, @robingirard.
denson

Jawaban:

58

Data diskrit hanya dapat mengambil nilai tertentu. Mungkin ada kemungkinan nilai-nilai itu tak terhingga, tetapi masing-masing berbeda dan tidak ada area abu-abu di antaranya. Data diskrit bisa berupa angka seperti apel - tetapi juga bisa kategorikal - seperti merah atau biru, atau pria atau wanita, atau baik atau buruk.

Data kontinu tidak terbatas pada nilai-nilai terpisah yang ditentukan, tetapi dapat menempati nilai apa pun pada rentang kontinu. Antara dua nilai data kontinu mungkin ada jumlah yang tak terbatas dari yang lain. Data kontinu pada dasarnya selalu berupa angka.

Kadang-kadang masuk akal untuk memperlakukan data numerik yang benar dari satu jenis sebagai yang lain. Misalnya, sesuatu seperti tinggi terus-menerus, tetapi sering kali kita tidak terlalu peduli tentang perbedaan kecil dan malah mengelompokkan ketinggian menjadi sejumlah tempat sampah terpisah . Sebaliknya, jika kita menghitung sejumlah besar entitas diskrit - butiran beras, atau rayap, atau uang dalam perekonomian - kita dapat memilih untuk tidak menganggap 2.000.006 dan 2.000.008 sebagai nilai yang sangat berbeda tetapi sebagai titik terdekat pada suatu perkiraan kontinum.

Kadang-kadang juga bermanfaat untuk memperlakukan data numerik sebagai kategori, misalnya: kurang berat badan, normal, obesitas. Ini biasanya hanya jenis lain dari binning.

Jarang masuk akal untuk menganggap data kategorikal sebagai berkelanjutan.

walkytalky
sumber
@walktalky seperti yang disinggung oleh @jeromy, dalam psikologi setidaknya, variabel kategororial seperti respons terhadap pertanyaan sering dianggap sebagai representasi dari sifat yang mendasarinya, sehingga dalam hal itu data kategororial kadang-kadang dianggap berkelanjutan.
richiemorrisroe
@richiemorrisroe Seseorang dapat menemukan perbedaan antara data dan sifat diduga, tetapi tentu saja Anda benar. Beberapa poin lebih lanjut yang sangat menarik dibuat untuk menjawab pertanyaan lanjutan ini .
walkytalky
terima kasih untuk tautannya, jawaban-jawaban itu memang sangat menarik.
richiemorrisroe
> " Mungkin ada kemungkinan nilai-nilai itu tak terbatas, tetapi masing-masing berbeda dan tidak ada area abu-abu di antaranya " - sebenarnya sangat mungkin untuk memiliki distribusi diskrit dengan nilai yang berbeda, namun pada saat yang sama , untuk dua nilai berbeda yang Anda pilih, selalu memiliki lebih banyak nilai di antara mereka ('wilayah abu-abu' dalam arti tertentu). Mereka tidak sering muncul dalam praktik, tetapi sangat mungkin bagi mereka untuk muncul secara nyata; memang saya bisa memikirkan dua contoh berbeda (jika terkait) yang dapat dengan mudah muncul.
Glen_b
jadi untuk memperjelas, bahkan jika Anda memiliki 10 miliar baris data ohlc untuk aset saham, apakah masih dianggap diskrit? tetapi kemudian tidak dapatkah harga suatu aset berkisar antara 1 hingga tak terbatas, bagaimana cara berpikir dalam situasi seperti ini?
PirateApp
19

Data selalu terpisah. Diberikan sampel nnilai pada suatu variabel, jumlah maksimum dari nilai berbeda yang dapat diambil variabel adalah sama dengan n. Lihat kutipan ini

Semua ruang sampel aktual adalah diskrit, dan semua variabel acak yang dapat diamati memiliki distribusi diskrit. Distribusi kontinu adalah konstruksi matematika, cocok untuk perawatan matematika, tetapi tidak dapat diamati secara praktis. EJG Pitman (1979, hal. 1).

Data pada suatu variabel biasanya diasumsikan diambil dari variabel acak. Variabel acak adalah kontinu pada rentang jika ada jumlah tak terhingga dari nilai yang mungkin bahwa variabel dapat mengambil antara dua titik berbeda dalam rentang. Misalnya, tinggi, berat, dan waktu biasanya dianggap berkelanjutan. Tentu saja, setiap pengukuran variabel-variabel ini akan akurat secara akurat dan dalam beberapa hal terpisah.

Berguna untuk membedakan antara
variabel yang diurutkan (yaitu, ordinal), tidak berurutan (yaitu, nominal), dan biner.

Beberapa buku teks pengantar membingungkan variabel kontinu dengan variabel numerik. Misalnya, skor pada permainan komputer terpisah meskipun itu numerik.

Beberapa buku teks pengantar membingungkan variabel rasio dengan variabel kontinu. Variabel jumlah adalah variabel rasio, tetapi tidak kontinu.

Dalam praktik aktual, suatu variabel sering diperlakukan sebagai kontinu ketika variabel tersebut dapat mengambil sejumlah besar nilai yang berbeda.

Referensi

  • Pitman, EJG 1979. Beberapa teori dasar untuk inferensi statistik. London: Chapman and Hall. Catatan: Saya menemukan kutipan dalam pengantar Bab 2 buku Murray Aitkin, Statistik Inference: An Integrated Bayesian / Likelihood Approach
Jeromy Anglim
sumber
12
Probabilitas juga merupakan "konstruksi matematika" dan bukan "yang dapat diamati secara langsung." Apakah ini berarti probabilitas itu tidak ada? Secara keseluruhan, balasan yang menarik ini tampaknya didasarkan pada premis tidak bisa dipertahankan bahwa data harus ditandai dengan nilai-nilai yang mereka lakukan memiliki bukan oleh nilai-nilai model matematika memungkinkan mereka untuk memiliki. Yang terakhir adalah karakteristik penting, bukan yang pertama. Ini semua menunjukkan bahwa yang penting dalam pembedaan kontinu / diskrit adalah bagaimana kita berpikir tentang data (yaitu, bagaimana kita memodelkannya).
whuber
3
Ada dongeng kecil yang pintar menggambarkan poin @ whuber: Lord (1953), "Tentang perlakuan statistik angka sepakbola", American Psychologist , 8 , pp750-51.
Scortchi
Terima kasih, @ Scortchi. Versi web tersedia melalui pencarian sarjana Google . Tuhan sedang membahas kesalahpahaman, yang diperdebatkan dengan panas 60 tahun yang lalu, tentang sejauh mana "teori pengukuran" harus memengaruhi (atau bahkan membatasi ruang lingkup) analisis statistik. Maksud saya berbeda tentang perbedaan antara konstruksi model dan pengamatan.
whuber
12

Temperatur kontinu. Itu bisa 23 derajat, 23.1 derajat, 23.100004 derajat.

Seks itu terpisah. Anda hanya bisa pria atau wanita (dalam pemikiran klasik). Sesuatu yang bisa Anda wakili dengan bilangan bulat seperti 1, 2, dll

Perbedaannya penting karena banyak algoritma statistik dan data mining dapat menangani satu jenis tetapi tidak yang lain. Misalnya dalam regresi reguler, Y harus kontinu. Dalam regresi logistik Y adalah diskrit.

Neil McGuigan
sumber
5
Ketika Anda suhu catatan ke derajat terdekat, dapat dianggap diskrit - dan mungkin memiliki harus jadi dipertimbangkan untuk bentuk-bentuk tertentu dari analisis. Juga, dalam regresi "reguler" (OLS?), tidak perlu berkelanjutan: banyak - dan praktis semua sifatnya yang berguna - berlaku untuk banyak jenis data diskrit, bahkan tanggapan biner. Apa yang mulai ditunjukkan oleh poin dan tandingan ini adalah bahwa data tidak selalu terpisah atau kontinu, melainkan prosedur statistik terpisah atau kontinu. Y
Whuber
8

Data Diskrit hanya dapat mengambil nilai tertentu.

Contoh: jumlah siswa dalam satu kelas (Anda tidak dapat memiliki setengah siswa).

Data Kontinu adalah data yang dapat mengambil nilai apa pun (dalam kisaran)

Contoh:

  • Tinggi seseorang: bisa berupa nilai apa saja (dalam kisaran ketinggian manusia), bukan hanya ketinggian tetap tertentu,
  • Waktu dalam perlombaan: Anda bahkan bisa mengukurnya hingga sepersekian detik,
  • Berat seekor anjing,
  • Panjang daun,
  • Berat seseorang,
Subrato Mukherjee
sumber
2
Anda juga dapat memberi tahu kami tempat Anda menyalin menempelkan jawaban dari: mathsisfun.com/data/data-discrete-continuous.html
philmcole
Dijelaskan dengan baik.
Arsman Ahmad
0

Dalam kasus basis data, kami akan selalu menyimpan data dalam diskrit bahkan sifat data kontinu. Mengapa saya harus menekankan sifat data? Kita harus mengambil distribusi data yang dapat membantu kita menganalisis data. JIKA sifat data kontinu, saya sarankan Anda menggunakannya dengan analisis kontinu.

Ambil contoh berkelanjutan dan diskrit: MP3. Bahkan jenis "suara" adalah analogi, jika disimpan dengan format digital. Kita harus menganalisanya selalu dengan cara analogi.

Tony
sumber
0

Di satu sisi, dari sudut pandang praktis saya setuju dengan jawaban Jeromy Anglim. Pada akhirnya kita sering berurusan dengan variabel diskrit - meskipun dari sudut pandang teoretis, variabel tersebut kontinu - dan itu memiliki dampak nyata misalnya untuk klasifikasi. Ingat kertas Strobl yang menunjukkan bahwa Hutan Acak bias terhadap variabel dengan beberapa titik potong (akurasi yang lebih tinggi tetapi berpotensi serupa). Dari pengalaman pribadi saya, jaringan neural probabilistik dapat juga menimbulkan bias ketika variabel menghadirkan akurasi yang berbeda kecuali jika jenisnya sama (yaitu, kontinu). Di sisi lain, dari sudut pandang teoritis klasifikasi klasik (misalnya, kontinu, diskrit, nominal, dll.) Adalah, IMHO, benar. Sesuai menurut saya bahwa nama sumber dari makalah Quinlan yang menggambarkan algoritma M5, yang merupakan 'regressor', adalah pilihan yang bagus. Jadi definisi dan implikasi berkelanjutan vs diskrit relevan tergantung pada 'lingkungan'.

Referensi:

Quinlan JR (1992). Belajar dengan kelas berkelanjutan. Dalam: Konferensi Gabungan ke-5 Australia tentang AI. Sydney (Australia), 343–348.

Strobl C., Boulesteix A.-L., Zeileis A., & Hothorn T. (2007). Bias dalam variabel acak ukuran hutan yang penting: ilustrasi, sumber, dan solusi. BMC Bioinformatics, 8, 25. doi: 10.1186 / 1471-2105-8-25

Rafa_Mas
sumber
-1

Data diskrit mengambil nilai tertentu, sementara data kontinu tidak terbatas pada nilai yang terpisah.

Data diskrit berbeda dan tidak ada area abu-abu di antaranya, sedangkan data kontinu menempati nilai apa pun di atas nilai data kontinu.

Ahmad ibraheem
sumber
-2

Data diskrit. Mereka dapat mengambil nilai tertentu. Mereka numerik.

manuella
sumber
Selamat datang di CV! Terima kasih telah menjawab, tapi silakan meluangkan waktu untuk melihat jawaban sebelumnya & mempertimbangkan jika Anda menambahkan sesuatu yang bermanfaat.
Scortchi
-3

Data diskrit hanya dapat mengambil nilai integer sedangkan data kontinu dapat mengambil nilai apa pun. Misalnya, jumlah pasien kanker yang dirawat oleh rumah sakit setiap tahun berbeda tetapi berat badan Anda terus menerus. Beberapa data kontinu tetapi diukur dengan cara yang berbeda misalnya usia Anda. Adalah umum untuk melaporkan usia Anda seperti, 31.

Graham Cookson
sumber
11
Data dapat diskrit tanpa terbatas pada bilangan bulat. Atau angka, dalam hal ini. Itu selalu mungkin untuk mewakili data diskrit dengan bilangan bulat, tetapi itu tidak berarti data hanya dapat mengambil nilai seperti itu.
walkytalky
-4

Diskrit data secara khusus berbicara tentang nilai-nilai terbatas dan pembicaraan data terus-menerus tentang nilai-nilai ifinite .....

Nyonya Shahid
sumber
2
Mau menguraikan?
chl