Dari fungsi kerapatan distribusi, kami dapat mengidentifikasi rata-rata (= 0) untuk distribusi Cauchy seperti grafik di bawah ini. Tapi mengapa kita mengatakan distribusi Cauchy tidak ada artinya?
distributions
mathematical-statistics
mean
pdf
cauchy
Babi terbang
sumber
sumber
Jawaban:
Anda dapat memeriksa secara mekanis bahwa nilai yang diharapkan tidak ada, tetapi ini harusnya intuitif secara fisik, setidaknya jika Anda menerima prinsip Huygens dan Hukum Angka Besar . Kesimpulan dari Hukum Angka Besar gagal untuk distribusi Cauchy, jadi itu tidak bisa berarti. Jika Anda rata-rata variabel acak Cauchy independen, hasilnya tidak konvergen ke sebagai dengan probabilitas . Itu tetap distribusi Cauchy dengan ukuran yang sama. Ini penting dalam optik.0 n → ∞ 1n 0 n→∞ 1
Distribusi Cauchy adalah intensitas cahaya yang dinormalisasi pada garis dari sumber titik. Prinsip Huygens mengatakan bahwa Anda dapat menentukan intensitas dengan mengasumsikan bahwa cahaya dipancarkan kembali dari garis apa pun antara sumber dan target. Jadi, intensitas cahaya pada garis meter jauhnya dapat ditentukan dengan mengasumsikan bahwa cahaya pertama mengenai garis meter jauhnya, dan dipancarkan kembali pada setiap sudut maju. Intensitas cahaya pada garis meter jauhnya dapat dinyatakan sebagai konvolusi lipat distribusi cahaya pada garis meter. Artinya, jumlah distribusi Cauchy independen adalah distribusi Cauchy skala dengan faktor .1 n n 1 n n2 1 n n 1 n n
Jika distribusi Cauchy memiliki rata-rata, maka persentil ke- dari konvolusi lipat dibagi dengan harus konvergen ke oleh Hukum Angka Besar. Sebaliknya ia tetap konstan. Jika Anda menandai persentil ke- pada garis (transparan) meter, meter, dll. Maka titik-titik ini membentuk garis lurus, pada derajat. Mereka tidak membungkuk ke .n n 0 25 1 2 45 025 n n 0 25 1 2 45 0
Ini memberi tahu Anda tentang distribusi Cauchy pada khususnya, tetapi Anda harus mengetahui tes integral karena ada distribusi lain tanpa berarti yang tidak memiliki interpretasi fisik yang jelas.
sumber
Jawaban ditambahkan sebagai tanggapan terhadap komentar @ whuber pada jawaban Michael Chernicks (dan ditulis ulang sepenuhnya untuk menghapus kesalahan yang ditunjukkan oleh whuber.)
Nilai integral untuk nilai yang diharapkan dari variabel acak Cauchy dikatakan tidak terdefinisi karena nilai dapat "dibuat" menjadi apa pun yang disukai seseorang. Integral (ditafsirkan dalam arti integral Riemann) adalah apa yang biasa disebut integral yang tidak tepat dan nilainya harus dihitung sebagai nilai pembatas: atau
Nilai pokok Cauchy diperoleh sebagai batas tunggal: bukannya batas ganda di atas. Nilai pokok integral harapan mudah dilihat menjadi karena limitand memiliki nilai untuk semua . Tapi ini tidak bisa digunakan untuk mengatakan bahwa rata-rata variabel acak Cauchy adalah . Artinya, rata-rata didefinisikan sebagai nilai integral dalam pengertian biasa dan bukan dalam pengertian nilai pokok.
Untuk , pertimbangkan integral yang mendekati nilai batas dari sebagai . Ketika , kita mendapatkan nilai pokok dibahas di atas. Dengan demikian, kami tidak dapat menetapkan makna yang tidak ambigu untuk ekspresiα>0
Jika seseorang menggunakan pendekatan ukuran-teoretis untuk probabilitas dan integral nilai yang diharapkan didefinisikan dalam pengertian integral Lebesgue, maka masalahnya lebih sederhana. hanya ada saat terbatas, sehingga tidak terdefinisi untuk variabel acak Cauchy karena tidak terbatas.∫g ∫|g| E[X] X E[|X|]
sumber
Sementara jawaban di atas adalah penjelasan yang valid mengapa distribusi Cauchy tidak memiliki harapan, saya menemukan fakta bahwa rasio dari dua normal independen adalah Cauchy seperti menerangi: memang, kami punya dan harapan kedua adalah .X1/X2 N(0,1)
sumber
Cauchy tidak memiliki mean karena titik yang Anda pilih (0) bukan berarti. Ini adalah median dan mode . Mean untuk distribusi yang benar-benar kontinu didefinisikan sebagai mana adalah fungsi kerapatan dan integral diambil di atas domain (yaitu to dalam kasus Cauchy). Untuk kepadatan Cauchy, integral ini tidak terbatas (setengah dari ke adalah dan setengah dari hingga adalah ).f f - ∞ ∞ - ∞ 0 - ∞ 0 ∞ ∞∫xf(x)dx f f −∞ ∞ −∞ 0 −∞ 0 ∞ ∞
sumber
Distribusi Cauchy paling baik dianggap sebagai distribusi seragam pada lingkaran satuan, sehingga akan mengejutkan jika rata-rata masuk akal. Misalkan adalah semacam "fungsi rata-rata". Yaitu, misalkan, untuk setiap himpunan terbatas dari lingkaran satuan, adalah titik dari lingkaran satuan. Jelas, harus "tidak alami". Lebih tepatnya tidak bisa sama dengan rotasi. Untuk mendapatkan distribusi Cauchy dalam bentuknya yang lebih biasa, tetapi kurang mengungkapkan, bentuk, proyeksikan lingkaran unit ke sumbu x dari (0,1), dan gunakan proyeksi ini untuk mentransfer distribusi seragam pada lingkaran ke sumbu x.X f ( X ) f ff X f(X) f f
Untuk memahami mengapa mean tidak ada, anggap x sebagai fungsi pada lingkaran unit. Sangat mudah untuk menemukan jumlah tak terpisahkan dari busur terpisah pada lingkaran satuan, sehingga, jika salah satu busur memiliki panjang d, maka x> 1 / 4d pada busur itu. Jadi masing-masing busur terpisah ini memberikan kontribusi lebih dari 1/4 untuk rata-rata, dan kontribusi total dari busur ini tidak terbatas. Kita dapat melakukan hal yang sama lagi, tetapi dengan x <-1 / 4d, dengan total kontribusi dikurangi tanpa batas. Interval ini dapat ditampilkan dengan diagram, tetapi dapatkah seseorang membuat diagram untuk Cross Validated?
sumber
Nilai rata-rata atau yang diharapkan dari beberapa variabel acak adalah integral Lebesgue yang didefinisikan atas beberapa ukuran probabilitas : P E X = ∫ X d PX P
Tidak adanya rata-rata dari variabel acak Cauchy hanya berarti bahwa integral dari Cauchy rv tidak ada. Ini karena ekor dari distribusi Cauchy adalah ekor yang berat (dibandingkan dengan ekor dari distribusi normal). Namun, tidak adanya nilai yang diharapkan tidak melarang keberadaan fungsi lain dari variabel acak Cauchy.
sumber
Berikut ini lebih banyak penjelasan visual. (Bagi kita yang mengalami kesulitan matematika). Ambil generator angka acak yang didistribusikan secara acak dan coba ratakan nilai yang dihasilkan. Ini adalah halaman yang bagus tentang fungsi untuk ini. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Anda akan menemukan bahwa "runcing" dari nilai acak menyebabkannya menjadi lebih besar saat Anda pergi alih-alih lebih kecil . Karena itu tidak ada artinya.
sumber
Hanya untuk menambah jawaban yang sangat baik, saya akan membuat beberapa komentar tentang mengapa tidak konvergensi integral relevan untuk praktik statistik. Seperti yang telah disebutkan orang lain, jika kita membiarkan nilai pokok menjadi "berarti" maka slln tidak lagi valid! Terlepas dari ini, pikirkan implikasi fakta bahwa, dalam praktiknya, semua model adalah perkiraan. Secara khusus, distribusi Cauchy adalah model untuk variabel acak tidak terikat. Dalam praktiknya, variabel acak dibatasi, tetapi batasannya sering tidak jelas dan tidak pasti. Menggunakan model tanpa batas adalah cara untuk meringankannya, itu membuat tidak perlu pengenalan batas tidak pasti (dan sering tidak wajar) ke dalam model. Tetapi agar ini masuk akal, aspek-aspek penting dari masalah tidak boleh terpengaruh. Itu berarti, jika kita ingin memperkenalkan batasan, yang seharusnya tidak mengubah dengan cara yang penting model. Tetapi ketika integralnya tidak konvergen itu tidak terjadi! Model ini tidak stabil, dalam arti bahwa harapan RV akan bergantung pada batas yang sebagian besar sewenang-wenang. (Dalam aplikasi, tidak perlu alasan untuk membuat batas simetris!)
Untuk alasan ini, lebih baik untuk mengatakan integral itu berbeda daripada mengatakan itu "tak terbatas", yang terakhir dekat dengan menyiratkan beberapa nilai yang pasti ketika tidak ada! Diskusi yang lebih menyeluruh ada di sini .
sumber
Aku ingin sedikit pemilih untuk sesaat. Grafik di atas salah. Sumbu x dalam standar deviasi, sesuatu yang tidak ada untuk distribusi Cauchy. Saya pilih-pilih karena saya menggunakan distribusi Cauchy setiap hari dalam hidup saya dalam pekerjaan saya. Ada kasus praktis di mana kebingungan dapat menyebabkan kesalahan empiris. Distribusi-t siswa dengan 1 derajat kebebasan adalah standar Cauchy. Biasanya akan mendaftar berbagai sigma yang diperlukan untuk signifikansi. Sigma ini BUKAN penyimpangan standar, itu kemungkinan kesalahan dan mu adalah modenya.
Jika Anda ingin melakukan gambar di atas dengan benar, baik sumbu x adalah data mentah, atau jika Anda ingin mereka memiliki kesalahan ukuran yang setara, maka Anda akan memberi mereka kemungkinan kesalahan yang sama. Satu kemungkinan kesalahan adalah 0,67 standar deviasi dalam ukuran pada distribusi normal. Dalam kedua kasus itu adalah rentang semi-interkuartil.
Sekarang sebagai jawaban untuk pertanyaan Anda, semua yang ditulis semua orang di atas adalah benar dan itu adalah alasan matematis untuk ini. Namun, saya menduga Anda adalah seorang pelajar dan baru dalam topik ini sehingga solusi matematika kontra-intuitif untuk hal-hal yang jelas secara visual mungkin tidak benar.
Saya memiliki dua sampel dunia nyata yang hampir identik, diambil dari distribusi Cauchy, keduanya memiliki mode yang sama dan kemungkinan kesalahan yang sama. Satu memiliki rata-rata 1,27 dan satu memiliki rata-rata 1,33. Yang dengan rata-rata 1,27 memiliki standar deviasi 400, yang dengan rata-rata 1,33 memiliki standar deviasi 5,15. Kesalahan yang mungkin untuk keduanya adalah .32 dan mode adalah 1. Ini berarti bahwa untuk data simetris, rata-rata tidak berada di 50% pusat. Hanya perlu SATU pengamatan tambahan untuk mendorong mean dan / atau varians luar signifikansi untuk setiap tes. Alasannya adalah bahwa mean dan varians bukan parameter dan mean sampel dan varians sampel itu sendiri adalah angka acak.
Jawaban paling sederhana adalah bahwa parameter distribusi Cauchy tidak termasuk rata-rata dan karenanya tidak ada perbedaan tentang rata-rata.
Sangat mungkin bahwa dalam pedagogi masa lalu Anda pentingnya rata-rata adalah bahwa biasanya statistik yang memadai. Dalam statistik berbasis frekuensi jangka panjang, distribusi Cauchy tidak memiliki statistik yang cukup. Memang benar bahwa median sampel, untuk distribusi Cauchy dengan dukungan atas seluruh real, adalah statistik yang cukup, tetapi itu karena ia mewarisi itu dari menjadi statistik pesanan. Ini semacam kebetulan yang cukup, tidak memiliki cara mudah untuk memikirkannya. Sekarang dalam statistik Bayesian ada statistik yang cukup untuk parameter distribusi Cauchy dan jika Anda menggunakan seragam sebelumnya maka itu juga tidak bias. Saya membahas hal ini karena jika Anda harus menggunakannya setiap hari, Anda telah belajar tentang segala cara untuk melakukan estimasi pada mereka.
Tidak ada statistik pesanan yang valid yang dapat digunakan sebagai penaksir untuk distribusi Cauchy yang terpotong, yang kemungkinan besar akan Anda hadapi di dunia nyata, sehingga tidak ada statistik yang cukup dalam metode berbasis frekuensi untuk sebagian besar tetapi tidak semua aplikasi dunia nyata .
Apa yang saya sarankan adalah menjauh dari mental, secara mental, sebagai sesuatu yang nyata. Ini adalah alat, seperti palu, yang bermanfaat secara luas dan biasanya dapat digunakan. Terkadang alat itu tidak berfungsi.
Catatan matematika tentang distribusi normal dan Cauchy. Ketika data diterima sebagai deret waktu, maka distribusi normal hanya terjadi ketika kesalahan menyatu ke nol saat t menuju tak terhingga. Ketika data diterima sebagai rangkaian waktu, maka distribusi Cauchy terjadi ketika kesalahan menyimpang hingga tak terbatas. Satu karena seri konvergen, yang lain karena seri divergen. Distribusi Cauchy tidak pernah sampai pada titik tertentu pada batas, mereka berayun bolak-balik melintasi titik tetap sehingga lima puluh persen dari waktu mereka berada di satu sisi dan lima puluh persen dari waktu di sisi lain. Tidak ada pengembalian rata-rata.
sumber
Sederhananya, area di bawah kurva mendekati tak terbatas saat Anda memperkecil. Jika Anda mencicipi wilayah terbatas, Anda dapat menemukan mean untuk wilayah itu. Namun, tidak ada artinya untuk ketakberhinggaan.
sumber