Kapan kita akan menggunakan tantile dan medial, daripada quantile dan median?

14

Saya tidak dapat menemukan definisi untuk tantile atau medial di Wikipedia atau Wolfram Mathworld, tetapi penjelasan berikut diberikan dalam Bílková, D. dan Mala, I. (2012), " Penerapan metode L-moment ketika memodelkan distribusi pendapatan di Republik Ceko ", Jurnal Statistik Austria , 41 (2), 125–132.

Medial adalah nilai (sampel) tantil sama seperti median sampel sama dengan nilai 50 % sampel kuantil. Sampel tantil serta sampel kuantil didasarkan pada sampel yang dipesan. Pertama-tama, jumlah kumulatif pengamatan dalam sampel yang dipesan dievaluasi. Kemudian, untuk persentase tertentu p , 0 < p < 100 , sebuah p % tantile didefinisikan sebagai nilai dari variabel dianalisis sehingga membagi semua pengamatan dalam sampel memerintahkan menjadi dua bagian: jumlah pengamatan yang lebih kecil atau sama adalah p %50%50%p0<p<100p%p%dari jumlah total pengamatan dan jumlah pengamatan yang lebih besar mewakili sisa dari jumlah ini.(100p)%

Kapan masuk akal untuk menggunakan ini sebagai ukuran lokasi, daripada median yang lebih konvensional atau kuantil lainnya? Satu situasi yang memungkinkan, pendapatan rumah tangga, diberikan dalam makalah itu:

Dapat diturunkan dari definisi ini bahwa medial dapat digunakan sebagai karakteristik yang wajar dari tingkat pendapatan, karena rumah tangga dengan pendapatan lebih rendah atau sama dengan medial menerima setengah dari total pendapatan dalam sampel, mereka yang memiliki pendapatan lebih tinggi dari medial yang menerima setengah lainnya.

Dalam hal ini, pendapatan rumah tangga rata-rata adalah CZK 117.497 (yaitu setengah dari rumah tangga berpenghasilan lebih dari ini dan setengah berpenghasilan di atas), dibandingkan dengan pendapatan rumah tangga medial dari CZK 133.930 (rumah tangga dengan pendapatan di atas angka ini menerima setengah dari jumlah pemasukan). Perhatikan bahwa perbandingan ini tidak selalu mencerminkan kecenderungan pendapatan rumah tangga, atau bahkan ketidakseragamannya: bahkan jika pendapatan rumah tangga didistribusikan secara seragam, medial akan tetap berada di atas median. Sejauh yang saya mengerti definisi, medial hanya akan sama dengan median jika semua rumah tangga menerima pendapatan yang sama.

Jadi apakah ada alasan khusus untuk memilih medial dalam kasus ini, atau setidaknya menggunakannya sebagai tindakan tambahan? Apa sebenarnya yang dikatakan perbandingan antara median dan medial? Kelihatannya medial itu tidak secara langsung sebanding dengan ukuran kecenderungan sentral lainnya karena alasan yang baru saja saya catat. Apakah ada situasi lain di mana medial / tantiles banyak digunakan atau dilihat sebagai sangat informatif? Contoh-contoh praktis di mana mereka digunakan, dengan makalah penelitian sampel, akan sangat disambut, dan ide intuitif dari konteks yang lebih luas di mana mereka mungkin terbukti bermanfaat akan lebih baik.

Ini harus mengharuskan total dan subtotal menjadi bermakna - sesuatu yang tampaknya relevan dengan uang, dan bagaimana "kue" didistribusikan - tetapi bahkan tindakan penambahan hanya bermakna untuk jumlah tertentu. Untuk sifat intensif daripada sifat ekstensif , seperti kepadatan atau suhu, penjumlahan apa pun tidak akan bermakna secara fisik. Tampaknya bagi saya bahwa properti yang luas diperlukan tetapi tidak mencukupi bagi tantil untuk membantu, karena saya dapat membayangkan seorang analis pengiriman yang tertarik dengan berat barang yang diangkut adalah cut-off sehingga 50% dari semua kargo (berdasarkan berat) adalah dibawa dalam beban yang beratnya atau di atas, namun saya tidak bisa membayangkan seorang ahli ekologi tertarik pada berapa lama kadal sedemikian rupa sehingga 50% dari total panjang semua kadal dikontribusikan oleh kadal dengan panjang itu atau lebih.

Gegat
sumber
3
@NickCox Sejauh yang saya mengerti, median memberikan nilai cut-off di mana secara kasar berbicara (saya benar-benar mengabaikan masalah ikatan) setengah rumah tangga menerima lebih dari cut-off dan setengah rumah tangga menerima kurang dari itu. Medial memberikan cut-off yang berbeda, sehingga total pendapatan rumah tangga yang menerima lebih dari cut-off merupakan 50% dari semua pendapatan, sedangkan total pendapatan rumah tangga yang menerima kurang dari cut-off merupakan 50% dari seluruh pendapatan.
Silverfish
2
Tip topi: Saya menjadi penasaran ingin tahu dari ini setelah komentar oleh @ttnphns pada pertanyaan saya sebelumnya ; berarti (aritmatika, geometris, harmonik, bertenaga, eksponensial, kombinatorial, dll) adalah "rata-rata analitik". Median, kuantil, tantil adalah "rata-rata posisi".
Silverfish
4
Terima kasih; Saya salah membaca ini, dan menghargai koreksi. Saya akan menulis ulang dari "jumlah pengamatan" menjadi "jumlah nilai", karena "jumlah pengamatan" terlalu dekat dengan "jumlah pengamatan" bagi saya. Atau mungkin saya mencari alasan .... Harus ada koneksi ke kurva Lorenz. Ukuran tersebut tampaknya hanya berguna jika variabel yang bersangkutan secara aditif atau luas. Sir David Cox sering menekankan pentingnya apakah variabel itu luas. Jadi masuk akal untuk mempertimbangkan pendapatan total, total curah hujan, tetapi bukan total pendapatan log atau suhu total.
Nick Cox
2
@NickCox Saya pikir ekstensivitas adalah titik yang sangat baik (dan penulisan ulang yang Anda sarankan akan menjadi peningkatan juga dalam pendapat saya), meskipun menurut saya properti yang luas diperlukan tetapi tidak cukup untuk membuat tantile dapat membantu. Tampaknya masuk akal kita mungkin tertarik misalnya dalam berapa berat kargo yang diangkut adalah cut-off sehingga 50% dari semua kargo (berdasarkan berat) diangkut dalam beban yang beratnya atau lebih; tapi saya tidak bisa membayangkan tertarik pada berapa lama kadal adalah sedemikian rupa sehingga 50% dari total panjang kadal dikontribusikan oleh kadal yang panjangnya atau lebih.
Silverfish
1
Saya setuju dalam praktiknya, tetapi saya pikir prinsipnya tidak terpengaruh. Jawaban untuk "Tapi itu tidak akan menarik atau berguna" tidak harus selalu berupa tampilan prinsip matematika atau statistik; ada juga ruang untuk "Jangan lakukan itu!".
Nick Cox

Jawaban:

3

p=0.5Xf(x)μ=EXμ=xf(x)dx

G(t)=txf(x)dx
tG(t)=μ/2

Apakah interpretasi ini benar? Apakah ini yang dimaksudkan?

Untuk kembali ke pertanyaan awal, dalam konteks distribusi pendapatan, tantile adalah nilai pendapatan sehingga setengah dari total pendapatan adalah untuk orang-orang dengan pendapatan di atas itu, dan setengah dari total pendapatan adalah untuk orang-orang dengan pendapatan di bawah itu.

EDIT

G(t)

G(t)t

Istilah lain yang digunakan untuk ide ini adalah "harapan parsial". Lihat misalnya /math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r dan gunakan google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}

kjetil b halvorsen
sumber
1
Terima kasih untuk penambahannya - saya harus melakukan beberapa bacaan dari kelihatannya!
Silverfish