Saya tahu bahwa jika median dan rata-rata kira-kira sama maka ini berarti ada distribusi simetris tetapi dalam kasus khusus ini saya tidak yakin. Rata-rata dan median cukup dekat (hanya perbedaan 0,487 m / empedu) yang akan membuat saya mengatakan ada distribusi simetris tetapi melihat boxplot, sepertinya sedikit miring positif (median lebih dekat ke Q1 daripada Q3 sebagaimana dikonfirmasi oleh nilai-nilai).
(Saya menggunakan Minitab jika Anda memiliki saran khusus untuk perangkat lunak ini.)
Jawaban:
Tidak diragukan Anda telah diberitahu sebaliknya, tetapi mean median tidak menyiratkan simetri.=
Ada ukuran skewness berdasarkan median minus rata-rata (skewness Pearson kedua), tetapi bisa 0 ketika distribusinya tidak simetris (seperti ukuran skewness umum lainnya).
Demikian pula, hubungan antara mean dan median tidak selalu menyiratkan hubungan yang sama antara midhinge ( ) dan median. Mereka dapat menyarankan kemiringan yang berlawanan, atau yang satu mungkin sama dengan median sedangkan yang lain tidak.( Q1+ Q3) / 2
Salah satu cara untuk menyelidiki simetri adalah melalui plot simetri *.
Jika adalah pengamatan terurut dari terkecil hingga terbesar (statistik urutan), dan adalah median, maka plot plot simetri vs , vs , ... dan seterusnya. M Y ( n ) - M M - Y ( 1 ) Y ( n - 1 ) - M M - Y ( 2 )Y( 1 ), Y( 2 ), . . . , Y( n ) M. Y( n )- M. M.- Y( 1 ) Y( n - 1 )- M. M.- Y( 2 )
* Minitab dapat melakukan itu . Memang saya meningkatkan plot ini sebagai kemungkinan karena saya telah melihat mereka dilakukan di Minitab.
Berikut ini empat contoh:
(Distribusi sebenarnya adalah (kiri ke kanan, baris pertama lebih dulu) - Laplace, Gamma (bentuk = 0,8), beta (2,2) dan beta (5,2). Kodenya milik Ross Ihaka, dari sini )
Dengan contoh simetris berekor berat, sering kali titik paling ekstrem bisa sangat jauh dari garis; Anda akan kurang memperhatikan jarak dari garis satu atau dua poin saat Anda berada di dekat kanan atas gambar.
Tentu saja ada plot lain (saya sebutkan plot simetri bukan dari rasa advokasi tertentu, tetapi karena saya tahu itu sudah diterapkan di Minitab). Jadi mari kita jelajahi beberapa yang lain.
Berikut adalah skewplot terkait yang disarankan oleh Nick Cox dalam komentar:
Dalam plot ini, tren naik akan menunjukkan ekor kanan yang biasanya lebih berat daripada kiri dan tren turun akan menunjukkan ekor kiri yang biasanya lebih berat daripada kanan, sementara simetri akan disarankan oleh plot yang relatif datar (walaupun mungkin cukup berisik).
Nick menyarankan bahwa plot ini lebih baik (khususnya "lebih langsung"). Saya cenderung setuju; interpretasi plot tampaknya sedikit lebih mudah, meskipun informasi dalam plot yang sesuai sering sangat mirip (setelah Anda mengurangi kemiringan unit pada set pertama, Anda mendapatkan sesuatu yang sangat mirip dengan set kedua).
[Tentu saja, tak satu pun dari hal-hal ini akan memberi tahu kita bahwa distribusi data yang diambil sebenarnya simetris; kami mendapatkan indikasi seberapa dekat-ke-simetris sampel, dan sejauh itu kita dapat menilai apakah data cukup konsisten dengan diambil dari populasi yang hampir simetris.]
sumber
skewplot
(SSC). Idenya kembali setidaknya untuk saran yang dikaitkan dengan JW Tukey di Wilk, MB dan Gnanadesikan, R. 1968. Probabilitas merencanakan metode untuk analisis data. Biometrika 55: 1-17.Cara termudah adalah menghitung kemiringan sampel . Ada fungsi di Minitab untuk itu. Distribusi simetris akan memiliki nol kemiringan. Kemiringan nol tidak selalu berarti simetris, tetapi dalam kebanyakan kasus praktis itu tidak akan simetris.
Seperti yang dicatat oleh @NickCox, ada lebih dari satu definisi skewness. Saya menggunakan yang kompatibel dengan Excel , tetapi Anda bisa menggunakan yang lain.
sumber
Pusatkan data Anda sekitar nol dengan mengurangi mean sampel. Sekarang bagi data Anda menjadi dua bagian, negatif dan positif. Ambil nilai absolut dari titik data negatif. Sekarang lakukan tes Kolmogorov-Smirnov dua sampel dengan membandingkan dua partisi satu sama lain. Buat kesimpulan Anda berdasarkan nilai-p.
sumber
Letakkan pengamatan Anda diurutkan dalam meningkatkan nilai dalam satu kolom, lalu taruh diurutkan dalam penurunan nilai di kolom lainnya.
Kemudian hitung koefisien korelasi (sebut saja Rm) antara dua kolom ini.
Hitung indeks kiral: CHI = (1 + Rm) / 2.
CHI mengambil nilai dalam interval [0..1].
CHI adalah null JIKA dan HANYA JIKA sampel Anda didistribusikan secara simetris.
Tidak perlu momen ketiga.
Teori:
http://petitjeanmichel.free.fr/itoweb.petitjean.skewness.html
http://petitjeanmichel.free.fr/itoweb.petitjean.html
(sebagian besar makalah yang dikutip dalam dua halaman ini dapat diunduh di sana dalam pdf)
Semoga saja membantu, bahkan belakangan ini.
sumber