Katakan misalnya Anda sedang melakukan model linier, tetapi data kompleks.
Kumpulan data saya rumit, karena dalam semua angka dalam adalah dalam bentuk ( a + b i ) . Apakah ada yang berbeda secara prosedural ketika bekerja dengan data seperti itu?
Saya bertanya karena, Anda akan mendapatkan matriks kovarian yang kompleks, dan menguji statistik yang dinilai kompleks.
Apakah Anda perlu menggunakan transpos konjugat alih-alih transpos ketika melakukan kuadrat terkecil? Apakah kovarians bernilai kompleks itu bermakna?
Jawaban:
Ringkasan
Generalisasi regresi kuadrat-terkecil ke variabel-variabel bernilai kompleks adalah langsung, terutama terdiri dari penggantian transpos matriks dengan konjugat transpos dalam formula matriks biasa. Namun, regresi bernilai kompleks sesuai dengan regresi berganda multivariat yang rumit yang solusinya akan jauh lebih sulit diperoleh dengan menggunakan metode standar (variabel nyata). Dengan demikian, ketika model bernilai kompleks bermakna, menggunakan aritmatika kompleks untuk mendapatkan solusi sangat dianjurkan. Jawaban ini juga mencakup beberapa cara yang disarankan untuk menampilkan data dan menyajikan plot diagnostik kecocokan.
Untuk kesederhanaan, mari kita bahas kasus regresi biasa (univariat), yang dapat ditulis
Saya telah mengambil kebebasan menamai variabel independen dan variabel dependen Z , yang konvensional (lihat, misalnya, Lars Ahlfors, Analisis Kompleks ). Semua yang berikut ini mudah untuk memperluas ke pengaturan regresi berganda.W Z
Interpretasi
Model ini memiliki interpretasi geometris dengan mudah divisualisasikan: perkalian dengan akan rescale w j oleh modulus β 1 dan memutar di sekitar asal oleh argumen dari β 1 . Selanjutnya, menambahkan β 0 menerjemahkan hasilnya dengan jumlah ini. Efek dari ε j adalah "jitter" terjemahan yang sedikit. Dengan demikian, kemunduran yang z j pada w j dengan cara ini merupakan upaya untuk memahami koleksi poin 2D ( z j )β1 wj β1 β1 β0 εj zj wj (zj) seperti yang timbul dari konstelasi poin 2D melalui transformasi tersebut, memungkinkan untuk beberapa kesalahan dalam proses. Ini diilustrasikan di bawah ini dengan gambar berjudul "Fit as a Transformation."(wj)
Perhatikan bahwa pengubahan ukuran dan rotasi bukan sembarang transformasi linear dari bidang: mereka mengesampingkan transformasi miring, misalnya. Dengan demikian model ini tidak sama dengan regresi berganda bivariat dengan empat parameter.
Kotak Terkecil Biasa
Untuk menghubungkan kasing yang kompleks dengan kasing asli, mari menulis
untuk nilai-nilai variabel dependen danzj=xj+iyj
untuk nilai-nilai variabel independen.wj=uj+ivj
Selanjutnya untuk parameter tulis
dan β 1 = γ 1 + i δ 1 .β0=γ0+iδ0 β1=γ1+iδ1
Setiap istilah baru yang diperkenalkan, tentu saja, nyata, dan adalah imajiner sementara j = 1 , 2 , … , n mengindeks data.i2=−1 j=1,2,…,n
OLS temuan ß 0 dan β 1 yang meminimalkan jumlah kuadrat penyimpangan,β^0 β^1
Secara formal ini identik dengan formulasi matriks biasa: bandingkan dengan Satu-satunya perbedaan yang kami temukan adalah bahwa transpose dari matriks desain X ′ digantikan oleh transpose konjugat X ∗ = ˉ X ′ . Akibatnya solusi matriks formal adalah(z−Xβ)′(z−Xβ). X′ X∗=X¯′
Pada saat yang sama, untuk melihat apa yang mungkin dicapai dengan melemparkan ini ke masalah yang benar-benar variabel nyata, kita dapat menuliskan tujuan OLS dalam hal komponen nyata:
Jelas ini mewakili dua regresi nyata yang terkait : salah satunya regresi pada u dan v , yang lain regresi y pada u dan v ; dan kami mensyaratkan bahwa koefisien v untuk x menjadi negatif dari koefisien u untuk y dan koefisien u untuk x sama dengan koefisien v untuk y . Apalagi karena jumlahnyax u v y u v v x u y u x v y kuadrat residu dari dua regresi harus diminimalkan, biasanya tidak akan menjadi kasus yang mana set koefisien memberikan estimasi terbaik untuk atau y saja. Ini dikonfirmasi dalam contoh di bawah ini, yang melakukan dua regresi nyata secara terpisah dan membandingkan solusi mereka dengan regresi kompleks.x y
Analisis ini membuatnya jelas bahwa menulis ulang regresi kompleks dalam hal bagian nyata (1) memperumit rumus, (2) mengaburkan interpretasi geometris sederhana, dan (3) akan membutuhkan regresi berganda multivariat umum (dengan korelasi nontrivial di antara variabel-variabel ) menyelesaikan. Kita bisa melakukan yang lebih baik.
Contoh
Sebagai contoh, saya mengambil kisi-kisi nilai pada titik-titik integral dekat asal dalam bidang kompleks. Ke nilai-nilai yang diubah w β ditambahkan kesalahan iid memiliki distribusi Gaussian bivariat: khususnya, bagian nyata dan imajiner dari kesalahan tidak independen.w wβ
Sulit untuk menarik sebar biasa untuk variabel yang kompleks, karena akan terdiri dari poin dalam empat dimensi. Sebaliknya, kita dapat melihat matriks sebar bagian nyata dan imajiner mereka.(wj,zj)
Abaikan kecocokan untuk saat ini dan lihat di empat baris teratas dan empat kolom kiri: ini menampilkan data. Grid lingkaran terlihat jelas di kiri atas; ini memiliki 81 poin. Plot sebaran komponen w terhadap komponen z menunjukkan korelasi yang jelas. Tiga di antaranya memiliki korelasi negatif; hanya y (bagian imajiner dari z ) dan u (bagian nyata dari w ) yang berkorelasi positif.w 81 w z y z u w
Untuk data ini, nilai sebenarnya dari adalah ( - 20 + 5 i , - 3 / 4 + 3 / 4 √β . Ini merupakan ekspansi dengan3/2dan rotasi berlawanan 120 derajat diikuti oleh terjemahan dari20unit ke kiri dan5unit up. Saya menghitung tiga kecocokan: solusi kuadrat terkecil kompleks dan dua solusi OLS untuk(xj)dan(yj)secara terpisah, untuk perbandingan.(−20+5i,−3/4+3/43–√i) 3/2 20 5 (xj) (yj)
Akan selalu menjadi kasus bahwa intersep hanya-nyata setuju dengan bagian nyata dari intersep kompleks dan intersep hanya imajiner setuju dengan bagian imajiner untuk intersep kompleks. Meskipun demikian, jelas bahwa lereng nyata-saja dan imajiner-saja tidak setuju dengan koefisien lereng kompleks atau dengan satu sama lain, persis seperti yang diperkirakan.
Mari kita lihat lebih dekat hasil dari fit kompleks. Pertama, sebidang residu memberi kita indikasi distribusi Gaussian bivariat. (Distribusi yang mendasari memiliki standar deviasi marjinal dan korelasi 0,8 .) Kemudian, kita dapat memplot besaran residual (diwakili oleh ukuran simbol lingkaran) dan argumen mereka (diwakili oleh warna persis seperti pada plot pertama) terhadap nilai yang dipasang: plot ini akan terlihat seperti distribusi acak ukuran dan warna, yang memang demikian.2 0.8
Akhirnya, kita dapat menggambarkan kecocokan dalam beberapa cara. Kecocokan muncul di baris dan kolom terakhir dari matriks sebar ( qv ) dan mungkin patut dilihat lebih dekat pada titik ini. Di bawah ini di sebelah kiri pas diplot sebagai lingkaran dan panah biru terbuka (mewakili residu) sambungkan ke data, ditampilkan sebagai lingkaran merah pekat. Di sebelah kanan yang ditampilkan sebagai lingkaran hitam terbuka diisi dengan warna yang sesuai dengan argumen mereka; ini dihubungkan oleh panah dengan nilai-nilai yang sesuai dari ( z j ) . Ingat bahwa setiap panah merupakan ekspansi dengan 3 / 2 di sekitar titik asal, rotasi dengan 120(wj) (zj) 3/2 120 derajat, dan terjemahan oleh , ditambah kesalahan bivariat Guassian.(−20,5)
Hasil ini, plot, dan plot diagnostik semuanya menunjukkan bahwa rumus regresi kompleks bekerja dengan benar dan mencapai sesuatu yang berbeda dari regresi linier terpisah dari bagian nyata dan imajiner dari variabel.
Kode
Theβ^
R
kode untuk membuat data, cocok, dan plot muncul di bawah. Perhatikan bahwa solusi yang sebenarnya dari β diperoleh dalam satu baris kode. Pekerjaan tambahan - tetapi tidak terlalu banyak - akan diperlukan untuk mendapatkan keluaran kuadrat biasa: matriks varians-kovarians dari fit, kesalahan standar, nilai-p, dll.sumber
zapsmall
dalamR
). Kalau tidak, itu pertanda ada sesuatu yang secara fundamental salah.Setelah google sesh panjang yang bagus, saya menemukan beberapa informasi yang relevan tentang memahami masalah secara alternatif. Ternyata masalah yang serupa agak umum dalam pemrosesan sinyal statistik. Alih-alih memulai dengan kemungkinan gaussian yang sesuai dengan kuadrat terkecil linier untuk data nyata, seseorang mulai dengan:
http://en.wikipedia.org/wiki/Complex_normal_distribution
Halaman wikipedia ini memberikan rundown yang memuaskan pada objek ini.
Sumber lain yang saya temukan yang mencapai kesimpulan yang sama dengan whuber, tetapi mengeksplorasi penaksir lain seperti kemungkinan maksimum adalah: "Estimasi Model Regresi Linier Tidak Benar", dari Yan et al.
sumber
Sementara @whuber memiliki jawaban yang diilustrasikan dengan indah dan dijelaskan dengan baik, saya pikir itu adalah model yang disederhanakan yang merindukan sebagian kekuatan ruang yang kompleks.
Saya menyarankan agar regresi linier kompleks didefinisikan sebagai berikut:
Ada dua perbedaan utama.
Kembali ke model nyata, solusi kuadrat terkecil keluar meminimalkan kerugian, yang merupakan kemungkinan log-negatif. Untuk distribusi normal, ini parabola:
Berikut adalah gambar kepadatan distribusi normal yang kompleks:
Ini menyulitkan regresi walaupun saya cukup yakin solusinya masih analitis. Saya memecahkannya untuk kasus satu input, dan saya senang menuliskan solusi saya di sini, tetapi saya merasa bahwa whuber mungkin bisa menyelesaikan kasus umum.
sumber
Masalah ini telah muncul lagi di StaticExchange Mathematica dan jawaban saya / komentar panjang ada bahwa jawaban bagus @whuber harus diikuti.
Jawaban saya di sini adalah upaya untuk memperluas jawaban @whuber sedikit dengan membuat struktur kesalahan sedikit lebih eksplisit. Estimator kuadrat terkecil yang diusulkan adalah apa yang akan digunakan jika distribusi kesalahan bivariat memiliki korelasi nol antara komponen nyata dan imajiner. (Tetapi data yang dihasilkan memiliki korelasi kesalahan 0,8.)
Maksud saya dalam semua ini adalah bahwa model yang sesuai harus dibuat sepenuhnya eksplisit dan bahwa program aljabar simbolis dapat membantu meringankan kekacauan itu. (Dan, tentu saja, estimator kemungkinan maksimum mengasumsikan distribusi normal bivariat yang tidak diasumsikan oleh estimator kuadrat terkecil.)
Lampiran: Kode Mathematica lengkap
sumber