Saya sedang memikirkan arti keluarga skala lokasi. Pemahaman saya adalah bahwa untuk setiap anggota keluarga skala lokasi dengan parameter lokasi dan skala, maka distribusi tidak tergantung dari parameter apapun dan itu sama untuk setiap milik keluarga itu.a b Z = ( X - a ) / b X
Jadi pertanyaan saya adalah dapatkah Anda memberikan contoh di mana dua acak dari keluarga distribusi yang sama distandarisasi tetapi tidak menghasilkan Variabel Acak dengan distribusi yang sama?
Say dan berasal dari keluarga distribusi yang sama (di mana dengan keluarga yang saya maksudkan misalnya Normal atau keduanya Gamma dan seterusnya ..). Menetapkan:Y
kita tahu bahwa dan memiliki ekspektasi dan varian yang sama, .Z 2 μ Z = 0 , σ 2 Z = 1
Tetapi dapatkah mereka memiliki momen lebih tinggi yang berbeda?
Upaya saya untuk menjawab pertanyaan ini adalah bahwa jika distribusi dan tergantung pada lebih dari 2 parameter dari yang seharusnya. Dan saya berpikir tentang umum yang memiliki 3 parameter.Y t - s t u d e n t
Tetapi jika jumlah parameter adalah dan dan berasal dari keluarga distribusi yang sama dengan harapan dan varians yang sama, maka apakah itu berarti bahwa dan memiliki distribusi yang sama (momen lebih tinggi)?X Y Z 1 Z 2
Jawaban:
Tampaknya ada beberapa kebingungan mengenai keluarga distribusi dan bagaimana cara menghitung parameter gratis versus parameter gratis plus tetap (ditugaskan). Pertanyaan-pertanyaan itu adalah samping yang tidak terkait dengan maksud OP, dan jawaban ini. Saya tidak menggunakan kata keluarga di sini karena membingungkan. Misalnya, keluarga menurut satu sumber adalah hasil memvariasikan parameter bentuk. @whuber menyatakan bahwa "parameterisasi" dari sebuah keluarga adalah peta kontinu dari subset ℝ n , dengan topologi yang biasa, ke dalam ruang distribusi, yang gambarnya adalah keluarga itu.n Saya akan menggunakan bentuk kata yang mencakup penggunaan kata yang dimaksudkanidentifikasi dan penghitungan keluarga dan parameter . Misalnya rumusx2- 2 x + 4 memiliki bentuk dari rumus kuadrat, yaitu,Sebuah2x2+ a1x + a0 dan jikaSebuah1= 0 formula masih dari bentuk kuadrat. Namun, ketikaSebuah2= 0 rumusnya linear dan bentuknya tidak lagi cukup lengkap untuk memuat istilah bentuk kuadratik. Mereka yang ingin menggunakan kata keluarga dalam konteks statistik yang tepat didorong untuk berkontribusi pada pertanyaan terpisah itu .
Mari kita jawab pertanyaan "Bisakah mereka memiliki momen lebih tinggi yang berbeda?". Ada banyak contoh seperti itu. Kami mencatat bahwa pertanyaan tampaknya adalah tentang PDF simetris, yang cenderung memiliki lokasi dan skala dalam kasus dua parameter sederhana. Logikanya: Misalkan ada dua fungsi kerapatan dengan bentuk berbeda yang memiliki dua parameter identik (lokasi, skala). Kemudian ada salah satu parameter bentuk yang menyesuaikan bentuk, atau, fungsi kerapatan tidak memiliki parameter bentuk umum dan dengan demikian fungsi kerapatan tidak ada bentuk umum.
Di sini, adalah contoh bagaimana angka parameter bentuk ke dalamnya. The umum fungsi kepadatan kesalahan dan di sini , adalah jawaban yang tampaknya memiliki kurtosis dipilih secara bebas.
Oleh Skbkekas - Pekerjaan sendiri, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
Fungsi densitas PDF (probabilitas "probabilitas" AKA, perhatikan bahwa kata "probabilitas" tidak perlu) adalahβ2 α Γ ( 1β)e- ( | x - μ |α)β
Mean dan lokasi adalahμ , skalanya adalah α , dan β adalah bentuk. Perhatikan bahwa lebih mudah untuk menyajikan PDF simetris, karena PDF tersebut sering memiliki lokasi dan skala sebagai dua kasus parameter paling sederhana sedangkan PDF asimetris, seperti gamma PDF , cenderung memiliki bentuk dan skala sebagai parameter kasus paling sederhana. Melanjutkan dengan fungsi kerapatan kesalahan, variansnya adalah α2Γ ( 3β)Γ ( 1β) , kemiringannya adalah0 , dan kurtosisnya adalahΓ ( 5β) Γ ( 1β)Γ ( 3β)2- 3 . Jadi, jika kita menetapkan varians menjadi 1, maka kita menetapkan nilaiα dariα2= Γ ( 1β)Γ ( 3β) sambil memvariasikanβ> 0 , sehingga kurtosis dapat dipilih dalam kisaran dari- 0,601114 hingga∞ .
Yaitu, jika kita ingin memvariasikan momen pesanan yang lebih tinggi, dan jika kita ingin mempertahankan rata-rata nol dan varian 1, kita perlu memvariasikan bentuknya. Ini menyiratkan tiga parameter, yang secara umum adalah 1) rata-rata atau ukuran lokasi yang tepat, 2) skala untuk menyesuaikan varians atau ukuran variabilitas lainnya, dan 3) bentuk. TI MENGAMBIL setidaknya TIGA PARAMETER UNTUK MELAKUKANNYA.
Perhatikan bahwa jika kita membuat substitusiβ= 2 , α = 2-√σ dalam PDF di atas, kita memperolehe−(x−μ)22σ22π−−√σ,
yang merupakan fungsi kepadatan distribusi normal. Dengan demikian, fungsi kepadatan kesalahan umum adalah generalisasi dari fungsi kepadatan distribusi normal. Ada banyak cara untuk menggeneralisasi fungsi kepadatan distribusi normal. Contoh lain, tetapi dengan fungsi kerapatan distribusi normal hanya sebagai nilai pembatas, dan bukan dengan nilai substitusi rentang menengah seperti fungsi kerapatan kesalahan umum, adalah fungsi kerapatan Siswa−t . Menggunakan Student −t fungsi kepadatan, kita akan memiliki pilihan yang agak lebih terbatas dari kurtosis, dan df≥2 adalah parameter bentuk karena saat kedua tidak ada untuk df<2 . Selain itu, df sebenarnya tidak terbatas pada nilai integer positif, tetapi secara umum nyata ≥1 . Siswa −t hanya menjadi normal dalam batas sebagai df→∞ , itulah sebabnya saya tidak memilihnya sebagai contoh. Ini bukan contoh yang baik juga bukan contoh contoh, dan dalam hal ini saya tidak setuju dengan @ Xi'an dan @whuber.
Biarkan saya jelaskan lebih lanjut. Satu dapat memilih dua dari banyak fungsi kepadatan sewenang-wenang dari dua parameter untuk memiliki, sebagai contoh, rata-rata nol dan varian satu. Namun, mereka tidak semua akan memiliki bentuk yang sama. Namun pertanyaannya, berkaitan dengan fungsi kepadatan bentuk SAMA, bukan bentuk yang berbeda. Klaim telah dibuat bahwa fungsi kepadatan yang memiliki bentuk yang sama adalah tugas yang sewenang-wenang karena ini adalah masalah definisi, dan dalam pendapat saya berbeda. Saya tidak setuju bahwa ini sewenang-wenang karena seseorang dapat membuat substitusi untuk mengubah satu fungsi kepadatan menjadi yang lain, atau orang tidak bisa. Dalam kasus pertama, fungsi kerapatan serupa, dan jika dengan substitusi kita dapat menunjukkan bahwa fungsi kerapatan tidak setara, maka fungsi kerapatan tersebut memiliki bentuk yang berbeda.
Jadi, dengan menggunakan contoh Student's- t PDF, pilihannya adalah menganggapnya generalisasi dari PDF normal, dalam hal ini PDF normal memiliki bentuk yang diijinkan untuk PDF Student's - t , atau tidak, dalam hal ini Student - t 's PDF adalah bentuk yang berbeda dari PDF yang normal dan dengan demikian tidak relevan dengan pertanyaan yang diajukan .
Kita bisa memperdebatkan ini dengan banyak cara. Pendapat saya adalah bahwa PDF normal adalah bentuk sub-terpilih dari Student's- t 's PDF, tetapi bahwa PDF normal bukan merupakan sub-seleksi dari gamma PDF meskipun nilai batas dari gamma PDF dapat ditunjukkan untuk menjadi PDF normal, dan, alasan saya untuk ini adalah bahwa dalam kasus normal / Siswa ' - t , dukungannya sama, tetapi dalam kasus normal / gamma dukungannya tidak terbatas versus semi-tak terbatas, yang merupakan ketidakcocokan yang diperlukan .
sumber
Jika Anda menginginkan contoh yang merupakan "keluarga distribusi parameterized bernama resmi, Anda dapat melihat ke dalam distribusi gamma umum, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Keluarga distribusi ini memiliki tiga parameter, sehingga Anda dapat memperbaiki rata-rata dan varians dan masih memiliki kebebasan untuk memvariasikan momen yang lebih tinggi. Dari halaman wiki, aljabar tidak terlihat mengundang, saya lebih suka melakukannya secara numerik. Untuk aplikasi statistik, cari situs ini untuk gamls, yang merupakan perpanjangan dari gam (aditif umum model, itu sendiri merupakan generalisasi dari glm's) yang memiliki parameter untuk "lokasi, skala dan bentuk".
Contoh lain adalah distribusi-t , diperluas menjadi keluarga skala lokasi. Kemudian parameter ketiga adalah derajat kebebasan, yang akan mewaspadai bentuk untuk lokasi dan skala yang tetap.
sumber
Ada distribusi yang tak terhingga dengan nol rata-rata dan varian satu, maka ambil didistribusikan dari salah satu distribusi ini, katakan N ( 0 , 1 ) , dan ϵ 2 dari distribusi lain, katakan t Student dengan 54 derajat kebebasan yang diubah oleh √ϵ1 N( 0 , 1 ) ϵ2 t sehingga variansnya adalah satu, maka
X=μ+σϵ113--√
menikmati properti yang Anda sebutkan. "Jumlah" parameter tidak relevan dengan properti.
Jelas, jika Anda menetapkan aturan lebih lanjut untuk definisi keluarga ini, seperti menyatakan misalnya bahwa ada kepadatan tetap sehingga kepadatan X adalah 1f X Anda mungkin berakhir dengan satu kemungkinan distribusi.
sumber
Saya pikir Anda bertanya apakah dua variabel acak yang berasal dari keluarga skala lokasi yang sama dapat memiliki mean dan varians yang sama, tetapi setidaknya satu momen lebih tinggi berbeda. Jawabannya adalah tidak.
sumber
Karena pertanyaan dapat ditafsirkan dalam berbagai cara, saya akan membagi jawaban ini menjadi dua bagian.
Masalah dengan kasus A dapat dengan mudah dijawab / ditunjukkan oleh banyak keluarga dengan parameter bentuk.
A: Bisakah dua distribusi berbeda dari keluarga distribusi 2 parameter yang sama memiliki mean dan varians yang sama?
Jawabannya adalah ya dan sudah dapat ditunjukkan menggunakan salah satu contoh yang disebutkan secara eksplisit: distribusi Gamma yang dinormalisasi
Keluarga distribusi gamma yang dinormalisasi
B: Bisakah dua distribusi berbeda dari keluarga distribusi skala 2 parameter yang sama memiliki rerata dan varian yang sama?
Saya percaya bahwa jawabannya adalah tidak jika kita hanya mempertimbangkan keluarga halus (mulus: perubahan kecil dalam parameter akan menghasilkan perubahan kecil pada distribusi / fungsi / kurva). Tetapi jawaban itu tidak sepele dan ketika kita akan menggunakan keluarga yang lebih umum (tidak lancar) maka kita dapat mengatakan ya , meskipun keluarga ini hanya ada dalam teori dan tidak memiliki relevansi praktis.
Menghasilkan keluarga skala lokasi dari satu distribusi dengan terjemahan dan penskalaan
Untuk keluarga skala lokasi yang dapat dibuat sedemikian rupa, kami memiliki:
Bisakah untuk semua dua keluarga skala skala lokasi distribusi anggota mereka dihasilkan dari distribusi anggota tunggal dengan terjemahan dan penskalaan?
Untuk dua keluarga skala lokasi parameter tertentu seperti keluarga distribusi normal, tidak terlalu sulit untuk menunjukkan bahwa mereka dapat dihasilkan sesuai dengan proses di atas (penskalaan dan penerjemahan anggota contoh tunggal).
Orang mungkin bertanya-tanya apakah mungkin untuk setiap keluarga parameter skala dua lokasi yang dihasilkan dari satu anggota dengan terjemahan dan penskalaan. Atau pernyataan yang saling bertentangan: "Bisakah keluarga skala lokasi dua parameter berisi dua distribusi anggota yang berbeda dengan mean dan varians yang sama?", Yang untuk itu diperlukan bahwa keluarga tersebut merupakan gabungan dari beberapa subfamili yang masing-masing dihasilkan oleh terjemahan dan scaling.
Kasus 1: Keluarga t-distribusi Siswa yang digeneralisasi, parameter oleh dua variabel
Mari kita gunakan t-distribusi (tiga parameter) umum Siswa:
maka kita miliki
yang dapat dianggap sebagai keluarga parameter dua skala lokasi (meskipun tidak terlalu berguna) yang tidak dapat dihasilkan oleh terjemahan dan penskalaan hanya satu anggota.
Kasus 2: Keluarga skala lokasi yang dihasilkan oleh penskalaan negatif dari satu distribusi dengan kemiringan nol
Keluarga yang lancar
sumber