Bagaimana nilai yang diharapkan berhubungan dengan mean, median, dll. Dalam distribusi yang tidak normal?

9

Bagaimana nilai yang diharapkan dari variabel acak kontinu berhubungan dengan rata-rata aritmatika, median, dll. Dalam distribusi non-normal (mis. Skew-normal)? Saya tertarik pada distribusi yang umum / menarik (mis. Log-normal, distribusi bi / multimodal sederhana, hal lain yang aneh dan luar biasa).

Saya mencari sebagian besar jawaban kualitatif, tetapi jawaban kuantitatif atau rumus juga diterima. Saya terutama ingin melihat representasi visual yang membuatnya lebih jelas.

tidak ada apa-apa101
sumber
Bisakah Anda menjadi lebih jelas? Mean aritmatik dan median adalah fungsi yang kami terapkan pada data, bukan apa pun yang intrinsik untuk distribusi tertentu ... misalnya, data tidak harus Normal agar Anda dapat menghitung rata-rata sampel.
tamu
Ok, jadi pertanyaannya secara teknis adalah "bagaimana nilai yang diharapkan berhubungan dengan rata-rata, median dll. Dari data yang diambil secara acak dari distribusi probabilitas tertentu?" Saya mencari pemahaman yang sederhana dan intuitif, mirip dengan cara Anda dapat secara intuitif mengatakan bahwa ketika distribusi lebih condong, median dan rerata semakin terpisah, dan median dapat memberikan indikasi yang lebih baik di mana data berada.
naught101
Heh. Terima kasih Marco. Saya jelas telah membaca kesalahan. Semoga menuliskan itu sebagai jawaban, saya akan memilihnya pada jawaban terbaiknya.
naught101

Jawaban:

8

(sebagian dikonversi dari komentar saya yang sekarang dihapus di atas)

Nilai yang diharapkan dan rata-rata aritmatika adalah hal yang sama persis. Median terkait dengan mean dalam cara yang tidak sepele tetapi Anda dapat mengatakan beberapa hal tentang hubungannya:

  • ketika distribusi simetris, rata-rata dan median adalah sama

  • ketika distribusi miring negatif, median biasanya lebih besar dari rata-rata

  • ketika distribusi condong positif, median biasanya kurang dari rata-rata

Makro
sumber
Menarik. Apa contoh yang ada dari perilaku tidak biasa dari distribusi miring yang negatif di mana rata-rata lebih besar dari median?
naught101
@ naught101: apakah ini salah cetak? Distribusi yang condong secara negatif adalah distribusi di mana hasil kiri-tengah-tengah terjadi lebih sering daripada hasil kanan-tengah, dan karenanya "ekor" hasil frekuensi rendah keluar ke kanan. Dalam situasi seperti itu, punuk di sebelah kiri akan selalu menarik (aritmatika) rata-rata kiri tengah, sedangkan ekor di kanan akan membuat median lebih besar dari rata-rata.
Assad Ebrahim
@ AssadEbrahim: Tidak, itu merujuk pada komentar Makro "median biasanya lebih besar dari rata-rata" - Saya meminta contoh balasan.
naught101
@ naught101: Contoh-contoh balasan dalam kasus distribusi unimodal adalah baris berikutnya: ketika punuk adalah ke kanan maka ekor ke kiri menarik median di bawah rata-rata. Semakin panjang ekor, semakin besar jarak antara median dan rerata.
Assad Ebrahim
1
Apa situasi praktis di mana seseorang akan menggunakan median atas mean atau sebaliknya? Sebagai contoh dalam analisis kelangsungan hidup di mana masa hidup mengikuti distribusi eksponensial, haruskah saya menggunakan median (jadi setengah hal bertahan lebih lama, setengah terakhir kurang) atau rata-rata (umur "diharapkan") jika saya harus memprediksi hidup / mati sebagai biner hasil?
drevicko
5

Ada hubungan yang baik antara harmonik, geometris, dan rata-rata aritmatika dari variabel acak terdistribusi normal-log . MembiarkanXLN(μ,σ2)

  • (rata-rata harmonik),HM(X)=eμ12σ2
  • (rata-rata geometris),GM(X)=eμ
  • (rata-rata aritmatika).AM(X)=eμ+12σ2

Tidak sulit untuk melihat bahwa produk dari rata-rata harmonik dan aritmatika menghasilkan kuadrat dari rata-rata geometrik, yaitu

HM(X)AM(X)=GM2(X).

XXX

GM(X)=HM(X)AM(X).

Selanjutnya, ketimpangan HM-GM-AM yang terkenal

HM(X)GM(X)AM(X)

dapat dinyatakan sebagai

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

GVar(X)=eσ2

Björn Friedrich
sumber
1

Untuk kelengkapan, ada juga distribusi yang rerata tidak didefinisikan dengan baik. Contoh klasik adalah distribusi Cauchy ( jawaban ini memiliki penjelasan yang bagus tentang mengapa). Contoh penting lainnya adalah distribusi Pareto dengan eksponen kurang dari 2.

drevicko
sumber
1
x=0
@Carl poin bagus - Saya mengedit jawaban yang sesuai. Many thx (:
drevicko
0

Meskipun benar bahwa secara matematis mean dan nilai ekspektasi didefinisikan secara identik, untuk distribusi yang miring konvensi penamaan ini menjadi menyesatkan.

Bayangkan Anda bertanya kepada seorang teman tentang harga perumahan di kotanya karena Anda benar-benar menyukainya di sana dan benar-benar berpikir untuk pindah ke kota itu.

Jika distribusi hadiah perumahan tidak simetris dan simetris, maka teman Anda dapat memberi tahu Anda harga rata-rata rumah dan memang Anda bisa berharap menemukan sebagian besar rumah di pasar sekitar nilai rata - rata itu .

Namun, jika distribusi harga perumahan tidak simultan dan miring, misalnya miring kanan dengan sebagian besar rumah di kisaran harga lebih rendah di sebelah kiri dan hanya beberapa rumah selangit di sebelah kanan, maka rata-rata akan "miring" ke harga tinggi di hak.

Untuk unimodal, distribusi harga rumah miring ini Anda dapat berharap untuk menemukan kebanyakan rumah di pasar sekitar median .

Sol Hator
sumber
1
Tidak jelas apa yang Anda maksud ketika Anda mengatakan untuk distribusi unimodal condong distribusi harga rumah memiliki harga di sekitar median. Apa yang bisa dikatakan adalah bahwa setengah dari nilai akan berada pada atau di bawah median & setengahnya berada pada atau di atas median. Itu tidak menunjukkan seberapa dekat nilai-nilai ini dengan mean.
Michael R. Chernick
Saya menganggap bahwa kalimat terakhir Anda seharusnya diakhiri dengan "median"? Jika demikian, saya pikir sudah jelas bahwa median harus menjadi nilai (dapat dicapai) yang paling dekat dengan rata-rata (yang mungkin tidak dapat dicapai, misalnya bukan harga perumahan) dari sampel acak yang diambil dari populasi yang dijelaskan di atas. Itu adalah median yang paling dekat dengan sampel rata-rata itu. Jika tidak, saya tidak membuat klaim tentang seberapa dekat nilai-nilai ini dengan nilai tengah. Saya membuat klaim tentang jarak mereka ke median.
Sol Hator