Menghubungkan titik-titik dalam grafik

8

Diberikan grafik yang merupakan produk dari suatu persamaan, kita dapat secara berarti menghitung titik yang memecahkan persamaan, dan akibatnya, juga garis yang melewati titik-titik tersebut. Garis, pada titik mana pun, adalah jawabannya.

Tetapi bagaimana dengan langkah-langkah seperti "jumlah mobil per jam / tempat parkir." Apakah masuk akal untuk menghubungkan titik-titik dari setiap pengukuran per jam? Bukankah ini akan membawa kita ke hasil yang salah, atau setidaknya hasil yang menyesatkan, karena kita tidak tahu berapa banyak mobil yang ada di sana sementara itu?

Feora Quora
sumber

Jawaban:

8

Ada berbagai alasan untuk menghubungkan titik-titik dalam grafik. Jika Anda hanya menunjukkan satu kategori nilai (yaitu jika ada garis hanya akan ada satu) maka aturan kontinu versus diskrit umumnya baik untuk dipatuhi. Namun, bahkan nilai diskrit atau kategoris dapat dihubungkan ketika beberapa garis mungkin diperlukan untuk membuatnya mudah untuk mengikuti variasi pola melintasi sumbu x. Intinya adalah membuat cerita yang koheren, dan jika sebuah baris membuat cerita lebih masuk akal atau lebih mudah diikuti maka tambahkanlah. Jika mengurangi maka hapus.

Dalam kasus Anda, sebuah grafik dengan titik untuk setiap lot dan jam pada sumbu x, saya akan sangat cenderung untuk merencanakan garis yang menghubungkan jam untuk setiap lot. Dan, sementara Anda memiliki nilai rata-rata pada jam, nilai sumbu x adalah interval yang diukur dan secara teori kontinu (semua kontinu dapat dikatakan sebagai interval yang diukur), jadi ada justifikasi lebih lanjut di sana.

Adapun bar, seperti poster lainnya disebutkan. Saya hampir selalu menghindari mereka. Suatu titik biasanya lebih baik bahkan untuk jenis data yang biasanya dianggap diisi oleh bar.

Juga pertimbangkan itu, kecuali tempat parkir ukuran yang sama jumlah mobil menyesatkan. Grafik dengan area tetap dan bilah tipikal menyiratkan bahwa setiap bilah mewakili pengisian item yang sama di ruang sama. Anda hanya menyelesaikan sebagian masalah itu dengan proporsi mobil di tempat parkir. Alternatif ketika hanya ada satu periode waktu adalah memiliki bar kosong yang menunjukkan ukuran lot dan kemudian mengisinya dengan jumlah mobil. Tetapi ini akan terlalu rumit ketika menunjukkan banyak lot. Grafik garis proporsi pengisian terhubung selama berjam-jam dengan garis untuk setiap lot adalah cara terbaik untuk pergi di sini.

John
sumber
Setuju, terutama jika Anda mencoba untuk membandingkan dua set data atau lebih (katakanlah tiga tempat parkir) dari waktu ke waktu. Mencoba untuk menjaga titik-titik warna yang berbeda dan bertukar lurus tanpa garis itu sulit. Biasanya cukup jelas bahwa jika grafik garis adalah garis yang menghubungkan titik-titik maka titik-titik tersebut terpisah, dan bahwa jika hanya garis yang mencerminkan data kontinu.
Wayne
Setuju bahwa garis membantu membedakan set terpisah; Saya telah menunjukkan poin ini dalam jawaban saya.
Nick Stauner
1

IMHO, siapa pun yang terlebih dahulu menghilangkan waktu perubahan yang tepat number of carsadalah yang pertama bertanggung jawab atas hasil yang menyesatkan. Jika Anda memiliki informasi ini (bahkan jika diukur dengan kesalahan), timeakan menjadi variabel kontinu yang tepat, bukan variabel kontinu yang dikelompokkan (lihat Anderson, 1984) tentu saja. Anda akan bebas untuk mengelompokkan pengamatan menjadi hournampan berbasis jika Anda benar-benar ingin, pada titik mana Anda akan memikul tanggung jawab untuk mendapatkan hasil yang menyesatkan. Jika tidak, dengan mempertahankan waktu kedatangan yang tepat, Anda dapat membuat grafik number of cars lebih terus menerus timesecara akurat.

Lagi pula, dengan asumsi Anda terjebak dengan number of carsperhour, Saya setuju dengan @John, Anda harus menggambar garis yang menghubungkan pengamatan jam Anda. Jika Anda kekurangan informasi tentang kapan setiap perubahan tambahan terjadi, agak sulit untuk mengatakan Anda menyesatkan siapa pun kecuali Anda gagal menggambarkan batas-batas informasi yang digambarkan. Demikian pula, jika Anda membuat grafik data per jam Anda dengan diagram batang sederhana tanpa garis yang menghubungkan tempat sampah, Anda tidak benar-benar bersalah menyesatkan siapa pun jika Anda tidak mengklaim bahwa perubahan antara pengamatan per jam terjadi tepat seperti yang digambarkan, pada jam tersebut, semua sekaligus. Jika seseorang salah paham (seperti yang mungkin terjadi dengan statistik atau data yang dipublikasikan), Anda tidak akan salah paham, terutama jika Anda mendeskripsikan data dan prosedur pengumpulan Anda dengan cukup detail. Sebanyak ini seharusnya tidak sulit untuk dilakukan.

Mengingat kejelasan dan ketelitian dasar data dan deskripsi grafik, seharusnya tidak ada kerugian menggambar garis untuk menghubungkan tempat sampah Anda. The keuntungan dari menghubungkan sampah Anda sebenarnya apa yang Anda tampaknya berpikir adalah merugikan: menggambar garis meniru persamaan setengah layak untuk number of carssebagai fungsi kontinu time, meskipun hal ini didasarkan pada diskrit, pengamatan per jam. Anda dapat menggunakan garis lurus di antara pengamatan untuk mewakili asumsi yang cukup masuk akal bahwa perubahan terjadi secara linear atas masing-masing hour, tidak sekaligus. Berdasarkan asumsi seperti itu, setiap pembaca dapat membuat tebakan yang layak minutesetelah hourpengukuran yang diberikan akan melihat mobil berikutnya tiba atau pergi dengan prosedur empat langkah yang cukup masuk akal ini:

  1. Temukan titik pada baris di mana number of cars =1+hourpengamatan sebelumnya
  2. Gambarlah garis lurus ke bawah dari titik ini untuk menemukan di mana ia bersinggungan dengan hoursumbu
  3. Ukur distancetitik ini pada hoursumbu dari titik pengamatan sebelumnya
  4. distance ÷ distance between observations ×60= minutesetelah hourkedatangan mobil berikutnya.

Tentu saja, seseorang dapat memperkirakan kedatangan mobil berikutnya ke detik yang tepat juga, dan Anda tidak dapat menghentikan pembaca dari melakukan ini dengan tidak menyediakan garis - menggambar garis hanya menjadi yang pertama dari lima langkah. Jadi, jika seseorang benar-benar ingin tahu berapa banyak mobil yang ada di sana ... ya, mereka tidak bisa, karena info itu tidak tersedia, tetapi mereka dapat memperkirakan. Jika Anda mengetuk langkah dari proses untuk mereka, saya membayangkan mereka akan berterima kasih.

Melakukan ini untuk pembaca Anda dengan garis-garis lurus dan sederhana hanya menyiratkan kenyamanan Anda dengan asumsi bahwa perubahan terjadi secara linier antara pengamatan per jam, atau lebih tepatnya menyatakan, ketidaksukaan Anda pada ketidakakuratan dalam asumsi ini. Ketidakakuratan tidak sulit dibayangkan. Pertama, perubahan harus terjadi sebagai fungsi nonlinier, inflasi nol time. Ini nonlinier karena pergantian peristiwa adalah ternary : baik mobil datang, pergi, atau tidak - mobil tidak datang atau pergi dengan penambahan fraksional. Tidak ada inflasi karena sebagian besar waktu tidak akan melihat mobil datang atau pergi. Anda dapat menyiasati hal ini dengan memperlakukan garis seperti menggambarkan probabilitymobil yang akan tiba atau pergi pada saat tertentu untuk mencapai seluruh nomor terdekat.

Namun ketidaktepatan lain dari asumsi di balik garis lurus antara pengamatan per jam tetap. Anda mungkin mengharapkan tingkat perubahan (dalam hal probabilityseperti di atas) berubah lebih lancar dari waktu ke waktu daripada garis lurus Anda ditarik secara terpisah di antara titik-titik yang tersirat. Dalam istilah yang lebih matematis, Anda mungkin ingin turunan dari fungsi number of cars( hour) Anda menjadi kontinu di hours. Anda mungkin dapat melakukan ini dengan menyesuaikan fungsi polinomial ke data Anda, tetapi jika tujuan Anda prediktif, waspadalah terhadap.

Keuntungan lain dari garis di atas bilah gaya-histogram (yaitu, tanpa jarak menengah untuk nilai-nilai yang berdekatan dari hour... apalagi bagan dengan bilah yang tidak saling "menyentuh") muncul dari lotvariabel politom Anda . Anda dapat menempatkan seri waktu terpisah Anda untuk setiap lot pada grafik yang sama untuk memfasilitasi perbandingan, yang akan membantu Anda melihat apakah lotvariabel Anda menarik. Berikut ini demonstrasi dengan beberapa data yang dibuat-buat:

Kudos to McCown !

Saya bahkan tidak akan mencoba mencari tahu bagaimana melakukannya secara koheren dengan bar; Saya akan menyerahkannya ke @ ChristianStade-Schuldt;) Agar adil, akan lebih mudah untuk tidak menghubungkan titik-titik ini seperti yang ia sarankan, tetapi menambahkan garis membantu menyamarkan titik-titik yang berkaitan dengan rangkaian waktu yang terpisah satu sama lain. Pada akhirnya, itu masih akan menjadi sedikit subjektif, jadi menilai sendiri:

Saya sendiri mendapati diri saya menggambar garis-garis dalam pikiran saya. BTW, jika Anda merasakan garis-garis pada gambar pertama mengurangi apa pun dari dampak visual dari titik yang tepat, jangan lupa bahwa Anda selalu dapat meningkatkan ukuran titik, mengubah bentuknya, atau menyajikan nilainya secara numerik dalam tabel terpisah .

Referensi
Anderson, JA (1984). Regresi dan variabel kategori terurut. Jurnal Royal Statistics Society B, 46 , 1–30.

Nick Stauner
sumber
1

Garis kontinu menunjukkan suatu kontinum. Jika rata-rata harus diplot, saya akan mempertimbangkan menggunakan diagram batang atau diagram tangga-langkah. Merencanakan poin individual juga dimungkinkan, dan ketika rata-rata diperhatikan, Anda mungkin dapat menambahkan informasi standar deviasi jika diperlukan.

Peter Jansson
sumber
0

Saya tidak akan menghubungkan titik-titik tersebut karena itu adalah nilai diskrit. Bergantung pada jumlah titik data Anda bisa menggunakan bagan kolom / batang atau hanya titik.

Christian Stade-Schuldt
sumber