Diberikan grafik yang merupakan produk dari suatu persamaan, kita dapat secara berarti menghitung titik yang memecahkan persamaan, dan akibatnya, juga garis yang melewati titik-titik tersebut. Garis, pada titik mana pun, adalah jawabannya.
Tetapi bagaimana dengan langkah-langkah seperti "jumlah mobil per jam / tempat parkir." Apakah masuk akal untuk menghubungkan titik-titik dari setiap pengukuran per jam? Bukankah ini akan membawa kita ke hasil yang salah, atau setidaknya hasil yang menyesatkan, karena kita tidak tahu berapa banyak mobil yang ada di sana sementara itu?
sumber
IMHO, siapa pun yang terlebih dahulu menghilangkan waktu perubahan yang tepat
number of cars
adalah yang pertama bertanggung jawab atas hasil yang menyesatkan. Jika Anda memiliki informasi ini (bahkan jika diukur dengan kesalahan),time
akan menjadi variabel kontinu yang tepat, bukan variabel kontinu yang dikelompokkan (lihat Anderson, 1984) tentu saja. Anda akan bebas untuk mengelompokkan pengamatan menjadihour
nampan berbasis jika Anda benar-benar ingin, pada titik mana Anda akan memikul tanggung jawab untuk mendapatkan hasil yang menyesatkan. Jika tidak, dengan mempertahankan waktu kedatangan yang tepat, Anda dapat membuat grafiknumber of cars
seri waktulebih terus menerustime
secara akurat.Lagi pula, dengan asumsi Anda terjebak dengan
number of cars
perhour
, Saya setuju dengan @John, Anda harus menggambar garis yang menghubungkan pengamatan jam Anda. Jika Anda kekurangan informasi tentang kapan setiap perubahan tambahan terjadi, agak sulit untuk mengatakan Anda menyesatkan siapa pun kecuali Anda gagal menggambarkan batas-batas informasi yang digambarkan. Demikian pula, jika Anda membuat grafik data per jam Anda dengan diagram batang sederhana tanpa garis yang menghubungkan tempat sampah, Anda tidak benar-benar bersalah menyesatkan siapa pun jika Anda tidak mengklaim bahwa perubahan antara pengamatan per jam terjadi tepat seperti yang digambarkan, pada jam tersebut, semua sekaligus. Jika seseorang salah paham (seperti yang mungkin terjadi dengan statistik atau data yang dipublikasikan), Anda tidak akan salah paham, terutama jika Anda mendeskripsikan data dan prosedur pengumpulan Anda dengan cukup detail. Sebanyak ini seharusnya tidak sulit untuk dilakukan.Mengingat kejelasan dan ketelitian dasar data dan deskripsi grafik, seharusnya tidak ada kerugian menggambar garis untuk menghubungkan tempat sampah Anda. The keuntungan dari menghubungkan sampah Anda sebenarnya apa yang Anda tampaknya berpikir adalah merugikan: menggambar garis meniru persamaan setengah layak untuk
number of cars
sebagai fungsi kontinutime
, meskipun hal ini didasarkan pada diskrit, pengamatan per jam. Anda dapat menggunakan garis lurus di antara pengamatan untuk mewakili asumsi yang cukup masuk akal bahwa perubahan terjadi secara linear atas masing-masinghour
, tidak sekaligus. Berdasarkan asumsi seperti itu, setiap pembaca dapat membuat tebakan yang layakminute
setelahhour
pengukuran yang diberikan akan melihat mobil berikutnya tiba atau pergi dengan prosedur empat langkah yang cukup masuk akal ini:number of cars
hour
pengamatan sebelumnyahour
sumbudistance
titik ini padahour
sumbu dari titik pengamatan sebelumnyadistance
distance between observations
minute
setelahhour
kedatangan mobil berikutnya.Tentu saja, seseorang dapat memperkirakan kedatangan mobil berikutnya ke detik yang tepat juga, dan Anda tidak dapat menghentikan pembaca dari melakukan ini dengan tidak menyediakan garis - menggambar garis hanya menjadi yang pertama dari lima langkah. Jadi, jika seseorang benar-benar ingin tahu berapa banyak mobil yang ada di sana ... ya, mereka tidak bisa, karena info itu tidak tersedia, tetapi mereka dapat memperkirakan. Jika Anda mengetuk langkah dari proses untuk mereka, saya membayangkan mereka akan berterima kasih.
Melakukan ini untuk pembaca Anda dengan garis-garis lurus dan sederhana hanya menyiratkan kenyamanan Anda dengan asumsi bahwa perubahan terjadi secara linier antara pengamatan per jam, atau lebih tepatnya menyatakan, ketidaksukaan Anda pada ketidakakuratan dalam asumsi ini. Ketidakakuratan tidak sulit dibayangkan. Pertama, perubahan harus terjadi sebagai fungsi nonlinier, inflasi nol
time
. Ini nonlinier karena pergantian peristiwa adalah ternary : baik mobil datang, pergi, atau tidak - mobil tidak datang atau pergi dengan penambahan fraksional. Tidak ada inflasi karena sebagian besar waktu tidak akan melihat mobil datang atau pergi. Anda dapat menyiasati hal ini dengan memperlakukan garis seperti menggambarkanprobability
mobil yang akan tiba atau pergi pada saat tertentu untuk mencapai seluruh nomor terdekat.Namun ketidaktepatan lain dari asumsi di balik garis lurus antara pengamatan per jam tetap. Anda mungkin mengharapkan tingkat perubahan (dalam hal
probability
seperti di atas) berubah lebih lancar dari waktu ke waktu daripada garis lurus Anda ditarik secara terpisah di antara titik-titik yang tersirat. Dalam istilah yang lebih matematis, Anda mungkin ingin turunan dari fungsinumber of cars
(hour
) Anda menjadi kontinu dihour
s. Anda mungkin dapat melakukan ini dengan menyesuaikan fungsi polinomial ke data Anda, tetapi jika tujuan Anda prediktif, waspadalah terhadapoverfitting.Keuntungan lain dari garis di atas bilah gaya-histogram (yaitu, tanpa jarak menengah untuk nilai-nilai yang berdekatan dari
hour
... apalagi bagan dengan bilah yang tidak saling "menyentuh") muncul darilot
variabel politom Anda . Anda dapat menempatkan seri waktu terpisah Anda untuk setiap lot pada grafik yang sama untuk memfasilitasi perbandingan, yang akan membantu Anda melihat apakahlot
variabel Anda menarik. Berikut ini demonstrasi dengan beberapa data yang dibuat-buat:Kudos to McCown !
Saya bahkan tidak akan mencoba mencari tahu bagaimana melakukannya secara koheren dengan bar; Saya akan menyerahkannya ke @ ChristianStade-Schuldt;) Agar adil, akan lebih mudah untuk tidak menghubungkan titik-titik ini seperti yang ia sarankan, tetapi menambahkan garis membantu menyamarkan titik-titik yang berkaitan dengan rangkaian waktu yang terpisah satu sama lain. Pada akhirnya, itu masih akan menjadi sedikit subjektif, jadi menilai sendiri:
Saya sendiri mendapati diri saya menggambar garis-garis dalam pikiran saya. BTW, jika Anda merasakan garis-garis pada gambar pertama mengurangi apa pun dari dampak visual dari titik yang tepat, jangan lupa bahwa Anda selalu dapat meningkatkan ukuran titik, mengubah bentuknya, atau menyajikan nilainya secara numerik dalam tabel terpisah .
Referensi
Anderson, JA (1984). Regresi dan variabel kategori terurut. Jurnal Royal Statistics Society B, 46 , 1–30.
sumber
Garis kontinu menunjukkan suatu kontinum. Jika rata-rata harus diplot, saya akan mempertimbangkan menggunakan diagram batang atau diagram tangga-langkah. Merencanakan poin individual juga dimungkinkan, dan ketika rata-rata diperhatikan, Anda mungkin dapat menambahkan informasi standar deviasi jika diperlukan.
sumber
Saya tidak akan menghubungkan titik-titik tersebut karena itu adalah nilai diskrit. Bergantung pada jumlah titik data Anda bisa menggunakan bagan kolom / batang atau hanya titik.
sumber