Bagaimana cara menafsirkan plot kotak?

8

Saya memiliki beberapa data di mana ada 5 variabel penjelas kategori ( concern, breath, weath, sleep, act) dan 1 variabel respon kontinu ( tto). Selain itu, setiap variabel penjelas kategori dibagi menjadi 5 level yang menunjukkan seberapa kuat seseorang merasakannya. level 1 dan level 5 masing-masing menunjukkan kondisi sempurna dan terburuk.

Saya disarankan untuk membuat plot kotak untuk melihat hubungan antara variabel penjelas dan variabel respons. Plotnya diberikan di bawah ini. Namun, saya tidak tahu cara membaca plot kotak. Adakah yang bisa membantu saya menafsirkannya?

masukkan deskripsi gambar di sini

Baik
sumber
2
Anda mungkin telah membaca artikel Wikipedia: en.wikipedia.org/wiki/Boxplot Bisakah Anda menjelaskan dengan lebih jelas apa yang tidak Anda mengerti?
Stephan Kolassa
Ya saya punya. Jadi saya tahu staf dasar. Namun, saya tidak tahu bagaimana menggunakannya pada ini. Maksud saya ada banyak plot di sini dan saya harus memilih tokoh-tokoh penting. Misalnya, dalam setiap kategori di atas, plot level 5 adalah yang terpanjang. Apa artinya? Apa efeknya bagi saya? Contoh lain adalah mengapa ada banyak poin? Saya tahu mereka mewakili outlier, tetapi tidak tahu bagaimana mengembangkan ini
Günal
2
Pertanyaan terkait yang mencakup batasan apa yang dapat Anda interpretasikan dari plot kotak: Apakah dua distribusi dengan ringkasan 5-angka yang identik selalu memiliki bentuk yang sama?
Silverfish

Jawaban:

10

Interpretasi plot kotak (atau plot kotak dan kumis) bersandar pada pemahaman bahwa plot menyediakan representasi grafis dari ringkasan lima angka, yaitu minimum, kuartil pertama, median, kuartil ketiga, dan maksimum. Kotak tersebut meliputi 50% dari pengamatan. Ujung kumis (garis vertikal memancar dari atas dan bawah kotak) biasanya menunjukkan di mana letak minimum dan maksimum. Namun, di mana outlier mungkin ada (kadang-kadang dinilai berdasarkan 1,5× jarak antar kuartil) poin ditambahkan, seperti halnya untuk gambar Anda.

Mungkin berguna bagi Anda untuk melihat histogram atau plot kepadatan pada kategori data tertentu karena hal itu dapat membantu Anda memahami apa yang dikatakan plot kotak.

@ Glen_b dengan tepat menunjukkan bahwa condong ke kiri jelas dan kecenderungan utama untuk tingkat kekuatan perasaan ke-5 lebih rendah daripada yang lain. Namun sulit untuk melihat apakah perbedaan itu signifikan secara statistik atau tidak.

siswa-t
sumber
8

Berikut ringkasan dasar dari apa yang ada di sana:

  1. Semua distribusi muncul condong ke kiri, "macet" terhadap batas atas 1,0, dengan banyak 'outlier' rendah yang mengarah ke bawah.
  2. Kategori 5 di setiap plot tampaknya lebih rendah dari yang lain. Terkadang kategori 4 juga rendah.
  3. Kelima variabel (perhatian, nafas, weath, tidur, bertindak) tampaknya memiliki pola yang sama secara luas.
Glen_b -Reinstate Monica
sumber