Apakah salah menggunakan plot garis untuk data diskrit?

12

Saya sering melihat dataset terpisah yang diplot sebagai plot garis, tetapi saya sadar bahwa garis tersebut memberikan nilai pada suatu titik di antara interval pengukuran yang tidak ada artinya bagi dataset terpisah. Apakah karena itu kasus menggunakan plot garis untuk data diskrit salah?

Sebagai contoh, ambil dua dataset deret waktu, satu kontinyu (berat badan saya, diukur setiap hari di pagi hari) dan satu diskrit (jumlah donat yang saya makan per hari). Masuk akal jika dataset pertama menjadi plot garis, karena masuk akal untuk menyimpulkan bahwa berat badan saya pada suatu sore tertentu akan terkait dengan berat badan saya pada pagi hari sebelum dan sesudahnya. Namun, jika jumlah donat direpresentasikan sebagai garis grafik, garis-garis di antara titik-titik tidak ada artinya dapat disimpulkan dari garis itu.

EDIT

Berikut adalah contoh lain: Upah Minimum Federal Setiap Jam Sejak permulaannya plot di http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html

Kecuali saya salah, perubahan upah minimum adalah diskrit, dan karenanya tidak mungkin untuk mencari waktu yang dipilih secara sewenang-wenang dan menetapkan upah minimum pada titik tersebut menggunakan garis yang menghubungkan titik-titik.

pengguna1379351
sumber
3
(+1) Contoh upah minimum per jam sangat baik. Frasa pertanyaan Anda sendiri menyarankan jawaban yang baik: yaitu, bahwa menghubungkan titik-titik pada grafik tidak valid ketika itu akan menyebabkan pembaca membuat interpolasi yang tidak akurat (atau sama sekali tidak valid). Membuat perbedaan antara diskresi dan diskontinuitas akan membantu dengan analisis lebih lanjut: konsumsi donat adalah diskrit sementara upah minimum terputus. Masing-masing berhak mendapatkan bentuk plot yang berbeda.
whuber
Ada plot di mana sebar plot dengan data diskrit menyesatkan atas plot garis. Untuk kasus-kasus tertentu di mana urutan peristiwa diperlukan (histeresis), atau osilasi antara dua tingkat terjadi dan seseorang perlu melacak perubahan keadaan dan lokasi mereka. Jadi: jangan gunakan plot garis untuk menyiratkan interpolasi, tetapi gunakan sebagai pedoman jika sesuai. Ini tidak cukup sederhana untuk membuat aturan pilihan sederhana tetapi membutuhkan pertimbangan data dan model yang ada.
wirrbel
1
Pertanyaan menarik! Terima kasih untuk itu. Saya berurusan dengan banyak data terkait waktu yang sebagian berasal dari model diskrit dan sebagian data yang diukur. Bagaimana dengan opsi menggunakan plot garis stepped untuk data diskrit (yang dapat kontinu dengan cara tetapi kita masih tidak memiliki fungsi antara titik-titik tunggal dan tidak bisa hanya berasumsi memiliki satu) dan yang biasa untuk data kontinu? Begitulah cara saya menghadapinya ..
Cord Kaldemeyer
@CordKaldemeyer terima kasih telah berkomentar - Saya tidak mengetahui tipe grafik "step plot line", tapi itu yang saya cari. Saya juga menemukan tutorial yang bermanfaat ini dalam melakukan plot step stepped
user1379351
@ user1379351: Senang saya bisa membantu!
Cord Kaldemeyer

Jawaban:

9

Plot garis yang terhubung telah terbukti terlalu berguna untuk membatasi interpretasi tunggal. Beberapa kegunaan menonjol:

  • Nilai yang diinterpolasi . Kasus yang Anda sebutkan di mana kedua variabel kontinu dan setiap titik yang diinterpolasi sepanjang garis sebagai interpretasi yang bermakna.
  • Tingkat perubahan . Bahkan ketika nilai di antara keduanya tidak berarti, kemiringan setiap segmen garis adalah representasi yang baik dari tingkat perubahan. Perhatikan bahwa untuk interpretasi ini, nilai X dan Y harus ditempatkan dengan tepat, yang tidak terjadi dalam plot upah yang Anda kutip.
  • Perbandingan Profil . Saat membandingkan kelipatan kecil atau ukuran overlay, garis dapat berguna bahkan untuk faktor kategorikal. Dalam hal ini, garis berfungsi untuk menghubungkan kelompok respons untuk pengenalan pola terbatas. Berikut ini adalah contoh dari peltiertech.com dengan faktor pada sumbu Y (bukan X) untuk keterbacaan label:

masukkan deskripsi gambar di sini

xan
sumber
1
Benar, tetapi grafik ke-2 dan ke-3 benar-benar kurang kuat daripada yang pertama, karena seseorang tidak dapat menggunakan kalkulus sama sekali.
Milind R
5

Yah, donat mungkin terkait dengan berat :-)

Sementara saya melihat poin Anda, saya pikir contoh ini tidak terlalu buruk karena waktu (pada sumbu horizontal, yang mengacu pada garis) kontinu. Arti dari garis itu, bagi saya, tidak begitu banyak, pada setiap waktu hari Anda makan sejumlah donat, tetapi bahwa jumlah donat per hari berubah secara teratur. Jadi, kita bisa menambahkan sesuatu seperti loess yang lebih halus ke garis, dan itu masuk akal. Paling tidak masuk akal untuk memikirkan donat yang dimakan setiap jam, atau bahkan setiap menit (meskipun ini akan lebih masuk akal dengan variabel di mana jumlah per hari lebih tinggi)

Apa yang lebih mengkhawatirkan adalah ketika sumbu horizontal terpisah (dan terutama ketika itu nominal) tetapi garis digambar. Ini benar-benar tidak masuk akal. Misalnya, jika Anda melihat (katakanlah)% voting untuk Obama di antara (katakanlah) penduduk di berbagai wilayah AS, tidak masuk akal untuk menarik garis batas antara Timur Laut dan Midwest; terutama karena urutan daerah adalah arbitrer, tetapi mengubah urutannya akan mengubah garis. Namun saya telah melihat grafik seperti ini.

Peter Flom - Pasang kembali Monica
sumber
1
Sepenuhnya setuju bahwa ada banyak penyalahgunaan grafik garis yang lebih buruk di luar sana. Saya suka pendekatan yang lebih halus karena tidak menghubungkan titik-titik, dan karenanya tidak menyiratkan data yang tidak ada. Tapi itu berfungsi untuk menyoroti tren yang mengkhawatirkan dalam konsumsi donat. Terima kasih!
user1379351
3
Anda tampaknya mengusulkan untuk mengganti satu variabel - konsumsi donat - dengan yang lain; yaitu, kepadatan konsumsi donat (donat per unit waktu). Meskipun ini sering dilakukan - terutama dalam analisis dua dimensi (seperti peta kepadatan populasi) - dan bisa sangat efektif, akan lebih baik bagi pembaca untuk menyadari bahwa ada perbedaan dan untuk mempertimbangkan bagaimana perbedaan itu dapat diungkapkan secara grafis.
whuber
2
@whuber Itu poin yang adil; garis tampaknya membuat penggantian itu. Grafik yang tidak membuat penggantian itu bisa saja berupa titik, tidak terhubung, tetapi tampaknya membuat setidaknya petunjuk tentang konsumsi donat yang terletak pada titik tertentu. Jadi, kita dapat membuat waktu sebagai kontinu dan meletakkan titik pada saat donat dikonsumsi.
Peter Flom - Reinstate Monica