Perbedaan antara distribusi normal standar multivariat dan Gaussian copula

17

Saya bertanya-tanya apa perbedaan antara distribusi normal standar multivariat dan Gaussian copula karena ketika saya melihat fungsi kerapatan, keduanya tampak sama bagi saya.

Masalah saya adalah mengapa Gaussian copula diperkenalkan atau apa manfaat yang dihasilkan Gaussian copula atau apa keunggulannya ketika Gaussian copula tidak lain adalah fungsi normal standar multivariat itu sendiri.

Juga apa konsep di balik transformasi integral probabilitas dalam kopula? Maksud saya, kita tahu bahwa kopula adalah fungsi dengan variabel seragam. Kenapa harus seragam? Mengapa tidak menggunakan data aktual seperti distribusi normal multivariat dan menemukan matriks korelasi? (Biasanya kami memplot dua pengembalian aset untuk mempertimbangkan hubungan mereka tetapi ketika copula, kami memplot AS yang merupakan probabilitas.)

Pertanyaan lain. Saya juga ragu apakah matriks korelasi dari MVN bisa non-parametrik atau semi-parametrik seperti kopula (untuk parameter kopula bisa jadi kendall's tau, dll.)

Saya akan sangat berterima kasih atas bantuan Anda karena saya baru di bidang ini. (tapi saya telah membaca banyak makalah dan ini adalah satu-satunya hal yang saya tidak mengerti)

pengguna26979
sumber
Bagaimana Anda "melihat fungsi kerapatan"? Anda mungkin tidak menggunakan metode yang cukup sensitif. Misalnya, kepadatan pasti tidak multivarian normal ketika marginalnya tidak normal! Coba ini menggunakan kata kerja penghubung Gaussian dengan multimodal distribusi, seperti Beta (1/2,1/2) : yang harus melihat jelas non-normal!
whuber
Persamaan (6) adalah bivariat Gaussian copula CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/… sedangkan persamaan pertama dari deskripsi adalah bivariat standar normal CDF roguewave.com/portals/0/products/ imsl-numerical-libraries / ... dan ketika kita membandingkannya bersama-sama, bentuk fungsionalnya sangat mirip. nah mereka persis sama dengan saya.
user26979
Anda benar: itu sebabnya Anda tidak harus bergantung pada referensi Internet acak, terutama yang dengan istilah yang tidak jelas dan pengaturan huruf yang buruk. Konsultasikan dengan Nelson (salah satu sumber untuk tautan pertama Anda, dan dapat dibaca dengan jelas).
Whuber
1
jadi, jika belum lagi yang disebutkan di atas, apa perbedaan pandangan Anda?
user26979

Jawaban:

20

Satu aturan umum tentang makalah teknis - terutama yang ditemukan di Web - adalah bahwa keandalan definisi statistik atau matematika yang ditawarkan di dalamnya bervariasi berbanding terbalik dengan jumlah mata pelajaran non-statistik yang tidak terkait yang disebutkan dalam judul makalah. Judul halaman dalam referensi pertama yang ditawarkan (dalam komentar untuk pertanyaan) adalah "Dari Keuangan ke Kosmologi: The Copula Struktur Skala Besar." Dengan "keuangan" dan "kosmologi" muncul dengan jelas, kita dapat yakin bahwa ini bukan sumber informasi yang baik tentang kopula!

Sebagai gantinya mari kita beralih ke buku teks standar dan sangat mudah diakses, Roger Nelsen Pengantar copulas (Edisi Kedua, 2006), untuk definisi kunci.

... setiap kopula adalah fungsi distribusi gabungan dengan margin yang seragam pada [interval satuan tertutup .[0,1]]

[Di hlm. 23, bawah.]

Untuk beberapa wawasan tentang kopula, beralihlah ke teorema pertama dalam buku ini, Teorema Sklar :

Biarkan H menjadi fungsi distribusi gabungan dengan margin dan G . Lalu ada Copula C sehingga untuk semua x ,FGC dalam [bilangan real yang diperluas], H ( x , y ) = C ( F ( x ) , G ( y ) ) .x,y

H(x,y)=C(F(x),G(y)).

[Dinyatakan pada hlm. 18 dan 21.]

Meskipun Nelsen tidak menyebutnya demikian, ia mendefinisikan kopula Gaussian dalam sebuah contoh:

... jika menunjukkan fungsi distribusi normal standar (univariat) dan N ρ menunjukkan fungsi distribusi normal bivariat standar (dengan koefisien korelasi momen-produk Pearson ρ ), maka ... C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

[di hlm. 23, persamaan 2.3.6]. Dari notasi itu langsung bahwa ini memang merupakan distribusi bersama untuk ( u , v ) ketika ( Φ - 1 ( u ) , Φ - 1 ( v ) ) adalah Normal bivariat. Kita sekarang dapat berbalik dan membangun distribusi bivariat baru yang memiliki distribusi marginal yang diinginkan (kontinu) F dan G di mana C ini adalah kopula, hanya dengan mengganti kejadian-kejadian Φ oleh F danC(u,v)(Φ1(u),Φ1(v))FGCΦF : ambil C khususinidalam karakterisasi kopula di atas.GC

Jadi ya, ini terlihat seperti rumus untuk distribusi normal bivariat, karena itu adalah bivariat normal untuk variabel yang diubah . Karena transformasi ini akan nonlinier setiap kali F dan G belum menjadi CDF Normal (univariat), distribusi yang dihasilkan tidak (dalam kasus ini) bivariat normal.(Φ1(F(x)),Φ1(G(y)))FG


Contoh

Misalkan adalah fungsi distribusi untuk variabel Beta ( 4 , 2 ) XF(4,2)X dan fungsi distribusi untuk variabel Gamma ( 2 ) YG(2)Y . Dengan menggunakan konstruksi sebelumnya kita dapat membentuk distribusi gabungan dengan kata kerja penghubung Gaussian dan marginal F dan G . Untuk menggambarkan distribusi ini, berikut adalah plot sebagian dari kepadatan bivariatnya pada sumbu x dan y :HFGxy

Merencanakan

0x10y

Kurangnya simetri membuatnya jelas non-normal (dan tanpa margin normal), tetapi tetap memiliki copula Gaussian oleh konstruksi. FWIW memiliki formula dan jelek, juga jelas tidak bivariat Normal:

132(20(1x)x3)(eyy)exp(w(x,y))

di mana diberikan oleh erfc - 1 ( 2 (w(x,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx

whuber
sumber
Terima kasih atas hasil editnya, @ Cardinal: Saya malu salah mengeja nama Nelsen, terutama ketika saya sedang melihatnya tepat di bagian depan buku! (Dalam pembelaan saya, saya pertama kali memperhatikannya di bibliografi makalah yang direferensikan OP, di mana ia juga salah eja: pasti ada hubungannya dengan saya. :-)
whuber
Itu hal yang sangat kecil, saya pikir saya hanya akan melanjutkan dan mengedit. Ejaannya tidak biasa (setidaknya dalam bahasa Inggris!), Terutama dibandingkan dengan varian yang lebih umum. :-)
kardinal