Mungkinkah dua Variabel Acak dari keluarga distribusi yang sama memiliki harapan dan varian yang sama, tetapi momen lebih tinggi berbeda?

12

Saya sedang memikirkan arti keluarga skala lokasi. Pemahaman saya adalah bahwa untuk setiap anggota keluarga skala lokasi dengan parameter lokasi dan skala, maka distribusi tidak tergantung dari parameter apapun dan itu sama untuk setiap milik keluarga itu.a b Z = ( X - a ) / b XXabZ=(Xa)/bX

Jadi pertanyaan saya adalah dapatkah Anda memberikan contoh di mana dua acak dari keluarga distribusi yang sama distandarisasi tetapi tidak menghasilkan Variabel Acak dengan distribusi yang sama?

Say dan berasal dari keluarga distribusi yang sama (di mana dengan keluarga yang saya maksudkan misalnya Normal atau keduanya Gamma dan seterusnya ..). Menetapkan:YXY

Z1=Xμσ

Z2=Yμσ

kita tahu bahwa dan memiliki ekspektasi dan varian yang sama, .Z 2 μ Z = 0 , σ 2 Z = 1Z1Z2μZ=0,σZ2=1

Tetapi dapatkah mereka memiliki momen lebih tinggi yang berbeda?

Upaya saya untuk menjawab pertanyaan ini adalah bahwa jika distribusi dan tergantung pada lebih dari 2 parameter dari yang seharusnya. Dan saya berpikir tentang umum yang memiliki 3 parameter.Y t - s t u d e n tXYtstudent

Tetapi jika jumlah parameter adalah dan dan berasal dari keluarga distribusi yang sama dengan harapan dan varians yang sama, maka apakah itu berarti bahwa dan memiliki distribusi yang sama (momen lebih tinggi)?X Y Z 1 Z 22XYZ1Z2

gioxc88
sumber
4
Ya mereka bisa. Tetapi, Anda membutuhkan setidaknya 3 parameter dalam distribusi umum.
Carl
5
@Carl Satu parameter sudah cukup.
whuber
5
@Carl Tidak jelas apa yang Anda maksud dengan "distribusi yang sama." Secara harfiah, itu akan merujuk pada distribusi yang unik, dengan satu hukum dan oleh karena itu harapan yang unik, varian yang unik, dan momen unik (sejauh mereka didefinisikan). Jika Anda berarti " keluarga distribusi yang sama ," maka ucapan Anda tidak ada artinya, karena keluarga adalah apa pun yang Anda tetapkan.
whuber
3
@HardCore Karena sepertinya Anda merasa pertanyaan Anda telah dijawab, silakan lihat Apa yang harus saya lakukan ketika seseorang menjawab pertanyaan saya?
Glen_b -Reinstate Monica
2
@Carl Saya juga mengubah jawaban Anda. Penggunaan OP tampaknya mendukung gagasan sebagai memiliki distribusi standar yang sama untuk semua pilihan dalam keluarga. Mari kita lihat jawaban mana yang diterima OP (jika OP pernah membaca komentar Glen_b dan menindaklanjutinya). XZ=(Xa)/bX
Dilip Sarwate

Jawaban:

7

Tampaknya ada beberapa kebingungan mengenai keluarga distribusi dan bagaimana cara menghitung parameter gratis versus parameter gratis plus tetap (ditugaskan). Pertanyaan-pertanyaan itu adalah samping yang tidak terkait dengan maksud OP, dan jawaban ini. Saya tidak menggunakan kata keluarga di sini karena membingungkan. Misalnya, keluarga menurut satu sumber adalah hasil memvariasikan parameter bentuk. @whuber menyatakan bahwa "parameterisasi" dari sebuah keluarga adalah peta kontinu dari subset ℝ n , dengan topologi yang biasa, ke dalam ruang distribusi, yang gambarnya adalah keluarga itu. n Saya akan menggunakan bentuk kata yang mencakup penggunaan kata yang dimaksudkanidentifikasi dan penghitungan keluarga dan parameter . Misalnya rumusx22x+4 memiliki bentuk dari rumus kuadrat, yaitu,a2x2+a1x+a0 dan jikaa1=0 formula masih dari bentuk kuadrat. Namun, ketikaa2=0rumusnya linear dan bentuknya tidak lagi cukup lengkap untuk memuat istilah bentuk kuadratik. Mereka yang ingin menggunakan kata keluarga dalam konteks statistik yang tepat didorong untuk berkontribusi pada pertanyaan terpisah itu .

Mari kita jawab pertanyaan "Bisakah mereka memiliki momen lebih tinggi yang berbeda?". Ada banyak contoh seperti itu. Kami mencatat bahwa pertanyaan tampaknya adalah tentang PDF simetris, yang cenderung memiliki lokasi dan skala dalam kasus dua parameter sederhana. Logikanya: Misalkan ada dua fungsi kerapatan dengan bentuk berbeda yang memiliki dua parameter identik (lokasi, skala). Kemudian ada salah satu parameter bentuk yang menyesuaikan bentuk, atau, fungsi kerapatan tidak memiliki parameter bentuk umum dan dengan demikian fungsi kerapatan tidak ada bentuk umum.

Di sini, adalah contoh bagaimana angka parameter bentuk ke dalamnya. The umum fungsi kepadatan kesalahan dan di sini , adalah jawaban yang tampaknya memiliki kurtosis dipilih secara bebas.

masukkan deskripsi gambar di sini

Oleh Skbkekas - Pekerjaan sendiri, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753

Fungsi densitas PDF (probabilitas "probabilitas" AKA, perhatikan bahwa kata "probabilitas" tidak perlu) adalah

β2αΓ(1β)e(|xμ|α)β

Mean dan lokasi adalah μ , skalanya adalah α , dan β adalah bentuk. Perhatikan bahwa lebih mudah untuk menyajikan PDF simetris, karena PDF tersebut sering memiliki lokasi dan skala sebagai dua kasus parameter paling sederhana sedangkan PDF asimetris, seperti gamma PDF , cenderung memiliki bentuk dan skala sebagai parameter kasus paling sederhana. Melanjutkan dengan fungsi kerapatan kesalahan, variansnya adalah α2Γ(3β)Γ(1β), kemiringannya adalah0, dan kurtosisnya adalahΓ(5β)Γ(1β)Γ(3β)23. Jadi, jika kita menetapkan varians menjadi 1, maka kita menetapkan nilaiαdariα2=Γ(1β)Γ(3β)sambil memvariasikanβ>0, sehingga kurtosis dapat dipilih dalam kisaran dari0.601114hingga.

Yaitu, jika kita ingin memvariasikan momen pesanan yang lebih tinggi, dan jika kita ingin mempertahankan rata-rata nol dan varian 1, kita perlu memvariasikan bentuknya. Ini menyiratkan tiga parameter, yang secara umum adalah 1) rata-rata atau ukuran lokasi yang tepat, 2) skala untuk menyesuaikan varians atau ukuran variabilitas lainnya, dan 3) bentuk. TI MENGAMBIL setidaknya TIGA PARAMETER UNTUK MELAKUKANNYA.

Perhatikan bahwa jika kita membuat substitusi β=2 , α=2σdalam PDF di atas, kita memperoleh

e(xμ)22σ22πσ,

yang merupakan fungsi kepadatan distribusi normal. Dengan demikian, fungsi kepadatan kesalahan umum adalah generalisasi dari fungsi kepadatan distribusi normal. Ada banyak cara untuk menggeneralisasi fungsi kepadatan distribusi normal. Contoh lain, tetapi dengan fungsi kerapatan distribusi normal hanya sebagai nilai pembatas, dan bukan dengan nilai substitusi rentang menengah seperti fungsi kerapatan kesalahan umum, adalah fungsi kerapatan Siswa t . Menggunakan Student t fungsi kepadatan, kita akan memiliki pilihan yang agak lebih terbatas dari kurtosis, dan df2 adalah parameter bentuk karena saat kedua tidak ada untuk df<2. Selain itu, df sebenarnya tidak terbatas pada nilai integer positif, tetapi secara umum nyata 1 . Siswa t hanya menjadi normal dalam batas sebagai df , itulah sebabnya saya tidak memilihnya sebagai contoh. Ini bukan contoh yang baik juga bukan contoh contoh, dan dalam hal ini saya tidak setuju dengan @ Xi'an dan @whuber.

Biarkan saya jelaskan lebih lanjut. Satu dapat memilih dua dari banyak fungsi kepadatan sewenang-wenang dari dua parameter untuk memiliki, sebagai contoh, rata-rata nol dan varian satu. Namun, mereka tidak semua akan memiliki bentuk yang sama. Namun pertanyaannya, berkaitan dengan fungsi kepadatan bentuk SAMA, bukan bentuk yang berbeda. Klaim telah dibuat bahwa fungsi kepadatan yang memiliki bentuk yang sama adalah tugas yang sewenang-wenang karena ini adalah masalah definisi, dan dalam pendapat saya berbeda. Saya tidak setuju bahwa ini sewenang-wenang karena seseorang dapat membuat substitusi untuk mengubah satu fungsi kepadatan menjadi yang lain, atau orang tidak bisa. Dalam kasus pertama, fungsi kerapatan serupa, dan jika dengan substitusi kita dapat menunjukkan bahwa fungsi kerapatan tidak setara, maka fungsi kerapatan tersebut memiliki bentuk yang berbeda.

Jadi, dengan menggunakan contoh Student's t PDF, pilihannya adalah menganggapnya generalisasi dari PDF normal, dalam hal ini PDF normal memiliki bentuk yang diijinkan untuk PDF Student's t , atau tidak, dalam hal ini Student t 's PDF adalah bentuk yang berbeda dari PDF yang normal dan dengan demikian tidak relevan dengan pertanyaan yang diajukan .

Kita bisa memperdebatkan ini dengan banyak cara. Pendapat saya adalah bahwa PDF normal adalah bentuk sub-terpilih dari Student's t 's PDF, tetapi bahwa PDF normal bukan merupakan sub-seleksi dari gamma PDF meskipun nilai batas dari gamma PDF dapat ditunjukkan untuk menjadi PDF normal, dan, alasan saya untuk ini adalah bahwa dalam kasus normal / Siswa ' t , dukungannya sama, tetapi dalam kasus normal / gamma dukungannya tidak terbatas versus semi-tak terbatas, yang merupakan ketidakcocokan yang diperlukan .

Carl
sumber
6
(-1) Seperti yang telah dinyatakan dalam komentar lain, masalahnya adalah "apa arti keluarga distribusi?". Saya dapat dengan mudah mendefinisikan "keluarga" baru dari distribusi yang hanya ditinjau kembali t-distribusi untuk memiliki mean = 0, sd = 1, dengan parameter tunggal: df. Kemudian momen ke-1 dan ke-2 sama untuk semua df, tetapi untuk nilai df yang berbeda, mereka memiliki momen lebih tinggi yang berbeda.
Cliff AB
5
Hard Core, komentar itu sulit dipahami, mengingat bahwa judul Anda sendiri mengandung kata "keluarga"! Selain itu, jika Anda menyangkal bahwa keluarga itu bermakna, maka pertanyaan itu tidak masuk akal. Harap klarifikasi dengan mengedit pertanyaan Anda untuk mencerminkan niat Anda.
Whuber
5
-1 karena Anda mulai dengan mengatakan "Jawabannya adalah TIDAK." dan kemudian lanjutkan untuk memberikan contoh yang secara efektif menjawab Ya (contoh lain diberikan dalam jawaban kjetilbhalvorsen yang Anda sebutkan baik). Ini tidak masuk akal bagi saya. Saya pikir matematika di sini jelas bagi kita semua, jadi downvote saya hanya untuk kurangnya konsistensi dalam presentasi.
Amuba mengatakan Reinstate Monica
3
Carl, ada ketidakkonsistenan antara pertanyaan dan komentar Hard Core. Pertanyaannya eksplisit: untuk "memberikan contoh di mana dua [variabel] acak dari keluarga distribusi yang sama distandarisasi tetapi tidak menghasilkan ... Variabel Acak [s] dengan distribusi yang sama." Jelas beberapa makna "keluarga" dimaksudkan. Arti yang biasa jelas, meskipun ada berbagai varian teknis di sekitar, dan jawaban yang benar (mudah ditunjukkan) adalah "ya, ada banyak contoh seperti itu."
Whuber
4
Terima kasih. Jelas Anda memiliki konsepsi yang baik tentang apa yang Anda tulis, tetapi sayangnya posting Anda menyebarkan sedikit kebingungan tentang apa arti dari "distribusi," "bentuk," "bentuk," dan "parameter" mungkin. Sebagai salah satu contoh seluk-beluk, pertimbangkan keluarga distribusi yang dibuat oleh hukum distribusi yang memiliki momen sentral ketiga yang tidak nol. Keluarga diindeks oleh dua bilangan real ( μ , σ 0 ) dan terdiri dari semua hukum x F ( σ x + μ ) . Ini adalah skala skala lokasi, tetapi bentuk undang-undang ini berbeda tergantung pada tanda σ .F(μ,σ0)xF(σx+μ)σ
Whuber
17

Jika Anda menginginkan contoh yang merupakan "keluarga distribusi parameterized bernama resmi, Anda dapat melihat ke dalam distribusi gamma umum, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Keluarga distribusi ini memiliki tiga parameter, sehingga Anda dapat memperbaiki rata-rata dan varians dan masih memiliki kebebasan untuk memvariasikan momen yang lebih tinggi. Dari halaman wiki, aljabar tidak terlihat mengundang, saya lebih suka melakukannya secara numerik. Untuk aplikasi statistik, cari situs ini untuk gamls, yang merupakan perpanjangan dari gam (aditif umum model, itu sendiri merupakan generalisasi dari glm's) yang memiliki parameter untuk "lokasi, skala dan bentuk".

Contoh lain adalah distribusi- t , diperluas menjadi keluarga skala lokasi. Kemudian parameter ketiga adalah derajat kebebasan, yang akan mewaspadai bentuk untuk lokasi dan skala yang tetap.

kjetil b halvorsen
sumber
1
Meskipun distribusi kesalahan umum mungkin merupakan pilihan yang lebih baik.
Carl
2
Terimakasih banyak atas jawaban Anda!! Saya memilih yang Carl karena lebih detail tapi ini juga baik .. terima kasih banyak !!!
gioxc88
14

Ada distribusi yang tak terhingga dengan nol rata-rata dan varian satu, maka ambil didistribusikan dari salah satu distribusi ini, katakan N ( 0 , 1 ) , dan ϵ 2 dari distribusi lain, katakan t Student dengan 54 derajat kebebasan yang diubah oleh ϵ1N(0,1)ϵ2t sehingga variansnya adalah satu, maka X=μ+σϵ113 menikmati properti yang Anda sebutkan. "Jumlah" parameter tidak relevan dengan properti.

X=μ+σϵ1andY=μ+σϵ2

Jelas, jika Anda menetapkan aturan lebih lanjut untuk definisi keluarga ini, seperti menyatakan misalnya bahwa ada kepadatan tetap sehingga kepadatan X adalah 1fXAnda mungkin berakhir dengan satu kemungkinan distribusi.

1σdf({xμ}/σ)
Xi'an
sumber
terima kasih atas jawabannya, tetapi saya pikir ini bukan yang saya minta
gioxc88
6
XY
ya sebenarnya cukup kabur tetapi jika Anda membaca pertanyaan saya, saya menulis bahwa dalam konteks ini dengan keluarga yang saya maksud misalnya baik Normal atau Gamma dan sebagainya .. Anda membuat contoh dengan satu siswa t normal dan satu
gioxc88
4
Hard Core, Anda sepertinya membingungkan nama keluarga dengan konsepnya . Jawaban ini bagus dan menggambarkan konsepnya dengan baik. Pertanyaan Anda tidak menanyakan bahwa solusinya adalah keluarga skala lokasi. Jika Anda membutuhkannya, Anda selalu dapat mengambil jawaban ini - atau jawaban lainnya - dan memperpanjangnya ke keluarga skala lokasi dengan mengizinkan terjemahan dan pengubahan skala secara sewenang-wenang. Poin Xi'an tentang jumlah parameter masih berlaku.
whuber
df=3,df
6

Saya pikir Anda bertanya apakah dua variabel acak yang berasal dari keluarga skala lokasi yang sama dapat memiliki mean dan varians yang sama, tetapi setidaknya satu momen lebih tinggi berbeda. Jawabannya adalah tidak.

X1X2X1X2Xa1>0,a2>0,b1,b2X1=da1X+b1X2=da2X+b2X1X2

  1. E[X1]=E[X2]a1E[X]+b1=a2E[X]+b2
  2. Var[X1]=Var[X2]a12Var[X]=a22Var[X]

Var[X]=0X1=E[X1]=X2=E[X2]1X1X2Var[X]0|a1|=|a2|a1>0a2>0a1=a2b1=b2

E[X1k]=E[(a1X+b1)k]=E[(a2X+b2)k]=E[X2k],
kX1X2
yyzz
sumber
1
(+1) Saya tidak dapat menemukan kesalahan dengan jawaban ini. Rupanya seseorang melakukannya, dan mereka juga menemukan kesalahan saya. Saya tidak mengerti perilaku yang tidak dapat dijelaskan ini.
Carl
5
@Carl Jawaban ini tidak benar - itulah sebabnya ini sedang downvot. Xi'an telah memberikan contoh tandingan.
Whuber
1
@whuber Silakan lihat komentar saya di bawah jawaban Xi'an. Saya tidak setuju dengannya tetapi tidak mengundurkan diri karena dia dan Anda memiliki hak atas pendapat Anda, meskipun saya menganggapnya salah.
Carl
8
@Carl Setelah membaca kembali jawaban ini, saya perlu menarik kembali penilaian awal saya: jawaban ini benar (dan +1 untuk itu), dan itu benar karena jelas menjelaskan bagaimana ia menafsirkan pertanyaan aslinya. (Secara khusus, ada konsep umum namun sempit tentang "keluarga skala lokasi" sebagai yang terdiri dari hanya satu distribusi standar bersama dengan semua terjemahannya dan peningkatan skala positif.) Saya percaya pertanyaan awal dimaksudkan untuk menanyakan sesuatu yang sedikit berbeda; dasar dari kepercayaan itu adalah referensi ke lebih dari dua parameter dalam posting.
whuber
2
Saya minta maaf jika saya belum begitu jelas dan saya berterima kasih atas waktu yang telah Anda habiskan untuk melihat ini, tetapi bukan itu yang saya minta.
gioxc88
1

Karena pertanyaan dapat ditafsirkan dalam berbagai cara, saya akan membagi jawaban ini menjadi dua bagian.

  • A: keluarga distribusi.
  • B: keluarga distribusi skala lokasi.

Masalah dengan kasus A dapat dengan mudah dijawab / ditunjukkan oleh banyak keluarga dengan parameter bentuk.

RR>0

A: Bisakah dua distribusi berbeda dari keluarga distribusi 2 parameter yang sama memiliki mean dan varians yang sama?

Jawabannya adalah ya dan sudah dapat ditunjukkan menggunakan salah satu contoh yang disebutkan secara eksplisit: distribusi Gamma yang dinormalisasi

Keluarga distribusi gamma yang dinormalisasi

Z=XμσXZ

FZ(z;k)={0ifz<k1Γ(k)γ(k,zk+k)ifzk

γ

Z1Z2μ=0σ=1k

B: Bisakah dua distribusi berbeda dari keluarga distribusi skala 2 parameter yang sama memiliki rerata dan varian yang sama?

Saya percaya bahwa jawabannya adalah tidak jika kita hanya mempertimbangkan keluarga halus (mulus: perubahan kecil dalam parameter akan menghasilkan perubahan kecil pada distribusi / fungsi / kurva). Tetapi jawaban itu tidak sepele dan ketika kita akan menggunakan keluarga yang lebih umum (tidak lancar) maka kita dapat mengatakan ya , meskipun keluarga ini hanya ada dalam teori dan tidak memiliki relevansi praktis.

Menghasilkan keluarga skala lokasi dari satu distribusi dengan terjemahan dan penskalaan

f(x)

f(x;μ,σ)=1σf(xμσ)

Untuk keluarga skala lokasi yang dapat dibuat sedemikian rupa, kami memiliki:

  • f(x;μ1,σ1)f(x;μ2,σ2)f(x;μ1,σ1)=f(x;μ2,σ2)

Bisakah untuk semua dua keluarga skala skala lokasi distribusi anggota mereka dihasilkan dari distribusi anggota tunggal dengan terjemahan dan penskalaan?

θ1θ2μσ

Untuk dua keluarga skala lokasi parameter tertentu seperti keluarga distribusi normal, tidak terlalu sulit untuk menunjukkan bahwa mereka dapat dihasilkan sesuai dengan proses di atas (penskalaan dan penerjemahan anggota contoh tunggal).

Orang mungkin bertanya-tanya apakah mungkin untuk setiap keluarga parameter skala dua lokasi yang dihasilkan dari satu anggota dengan terjemahan dan penskalaan. Atau pernyataan yang saling bertentangan: "Bisakah keluarga skala lokasi dua parameter berisi dua distribusi anggota yang berbeda dengan mean dan varians yang sama?", Yang untuk itu diperlukan bahwa keluarga tersebut merupakan gabungan dari beberapa subfamili yang masing-masing dihasilkan oleh terjemahan dan scaling.

Kasus 1: Keluarga t-distribusi Siswa yang digeneralisasi, parameter oleh dua variabel

R2R3θ1θ2

Mari kita gunakan t-distribusi (tiga parameter) umum Siswa:

f(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πνσ(1+1ν(xμσ)2)ν+12

μ=tan(θ1)σ=θ2ν=0.5+θ1/π

maka kita miliki

f(x;θ1,θ2)=Γ(0.5+θ1/π+12)Γ(0.5+θ1/π2)π0.5+θ1/πθ2(1+10.5+θ1/π(xtan(θ1)θ2)2)0.5+θ1/π+12

yang dapat dianggap sebagai keluarga parameter dua skala lokasi (meskipun tidak terlalu berguna) yang tidak dapat dihasilkan oleh terjemahan dan penskalaan hanya satu anggota.

Kasus 2: Keluarga skala lokasi yang dihasilkan oleh penskalaan negatif dari satu distribusi dengan kemiringan nol

xf(x/b+a)b

Keluarga yang lancar

f:R2R3fungsi kontinu yang akan melakukan pekerjaan seperti kurva Peano).

θ1θ2θ1θ2μσ

θ1=fθ1(μ,σ)θ2=fθ2(μ,σ)

fθ1(μ,σ)μσ

θ1θ1f(x;θ1)x

Sextus Empiricus
sumber
1
xf,b1fθR2R3."Masalah dengan" peta "ini adalah mereka tidak dapat berkelanjutan dan tidak memiliki arti statistik.
whuber
2
R2R3θθ
1
Peluru kedua tidak benar: tidak mengikuti asumsi apa pun juga bukan bagian dari definisi keluarga skala lokasi.
whuber
1
θiθixF(bx+a)F(a,b)R2b>0F
1
μσθ1θ2μσ