Mengapa ahli statistik mendefinisikan matriks acak?

18

Saya belajar matematika satu dekade yang lalu, jadi saya memiliki latar belakang matematika dan statistik, tetapi pertanyaan ini membunuh saya.

Pertanyaan ini masih agak filosofis bagi saya. Mengapa ahli statistik mengembangkan semua jenis teknik untuk bekerja dengan matriks acak? Maksudku, bukankah vektor acak menyelesaikan masalah? Jika tidak, apa arti dari kolom yang berbeda dari matriks acak? Anderson (2003, Wiley) menganggap vektor acak sebagai kasus khusus dari matriks acak dengan hanya satu kolom.

Saya tidak melihat titik memiliki matriks acak (dan saya yakin itu karena saya bodoh). Tapi, bersabarlah. Bayangkan saya memiliki model dengan 20 variabel acak. Jika saya ingin menghitung fungsi probabilitas gabungan, mengapa saya harus menggambarkannya sebagai matriks, bukan vektor?

Apa yang saya lewatkan?

ps: Saya minta maaf atas pertanyaan yang ditandai dengan buruk, tetapi belum ada tag untuk matriks-acak dan saya belum bisa membuatnya!

sunting: matriks diubah menjadi matriks dalam judul

Eduardo
sumber
1
Saya pikir Anda baik-baik saja secara konseptual memikirkannya sebagai vektor acak yang telah disusun ulang sehingga menjadi matriks.
Matthew Gunn
2
Mungkin relevan: en.wikipedia.org/wiki/Random_projection .
dsaxton
9
Anda mungkin juga bertanya mengapa matriks menarik. Sangat wajar untuk melihat secara acak matriks apa pun yang digunakan untuk mewakili fenomena yang diamati atau diukur di dunia nyata. Ini menghasilkan sejumlah kemungkinan jenis dan model untuk matriks acak, mulai dari matriks kedekatan dari grafik acak hingga sampel matriks kovarian dan banyak lagi.
whuber
2
@ Akakal Saya pikir titik OP adalah kapan berguna untuk menganalisis sesuatu sebagai matriks acak. misalnya dalam klasifikasi gambar Anda biasanya mengubah matriks gambar Anda menjadi vektor .. tidak ada matriks 'analisis'. jadi komentar whuber adalah jawaban terbaik sejauh ini: misalnya matriks kovarians harus positif setengah pasti - jika Anda ingin mensimulasikan matriks kovarians acak lebih mudah untuk bekerja dengan spesifikasi matriks daripada vektor.
seanv507
2
Matriks acak hanya merupakan kasus khusus dari tensor acak.
Anony-Mousse -Reinstate Monica

Jawaban:

23

Itu tergantung di bidang mana Anda berada tetapi, salah satu dorongan awal besar untuk studi matriks acak keluar dari fisika atom, dan dipelopori oleh Wigner. Anda dapat menemukan gambaran singkat di sini . Secara khusus, itu adalah nilai eigen (yang merupakan tingkat energi dalam fisika atom) dari matriks acak yang menghasilkan banyak perhatian karena korelasi antara nilai eigen memberikan wawasan tentang spektrum emisi dari proses peluruhan nuklir.

Baru-baru ini, telah terjadi kebangkitan besar di bidang ini, dengan munculnya distribusi Tracy-Widom untuk nilai eigen terbesar dari matriks acak, bersama dengan koneksi yang menakjubkan ke bidang yang tampaknya tidak terkait, seperti teori ubin , fisika statistik, dapat diintegrasikan sistem , fenomena KPZ , kombinatorik acak dan bahkan Hipotesis Riemann . Anda dapat menemukan beberapa contoh lagi di sini .

Untuk contoh yang lebih sederhana, pertanyaan alami untuk ditanyakan tentang matriks vektor baris adalah seperti apa komponen PCA-nya. Anda bisa mendapatkan perkiraan heuristik untuk ini dengan mengasumsikan data berasal dari beberapa distribusi, dan kemudian melihat nilai eigen matriks kovarians, yang akan diprediksi dari universalitas matriks acak : terlepas dari (dengan alasan) distribusi vektor Anda, distribusi terbatas dari nilai eigen akan selalu mendekati sekumpulan kelas yang dikenal. Anda dapat menganggap ini sebagai semacam CLT untuk matriks acak. Lihat makalah ini sebagai contoh.

Alex R.
sumber
Terima kasih atas jawaban anda. Saya menduga itu dapat dikaitkan dengan beberapa teknis matematika. Namun sekarang semuanya masuk akal, fisika selalu ada di sekitar matematika dan sebaliknya juga.
Eduardo
Kertas Wigner adalah pada pertengahan 1950-an, kertas Wishart pada akhir 1920-an. Jadi, sulit untuk mengklaim bahwa Wigner memberikan dorongan besar pertama, menurut saya.
Aksakal
13

Anda tampaknya nyaman dengan aplikasi vektor acak. Misalnya, saya berurusan dengan vektor acak semacam ini setiap hari: suku bunga dari tenor yang berbeda. Federal Reserve Bank memiliki seri H15 , lihat tagihan Treasury 4 minggu, 3 bulan, 6 bulan dan 1 tahun. Anda dapat menganggap 4 tingkat ini sebagai vektor dengan 4 elemen. Itu quire acak juga, lihat nilai historis pada plot di bawah ini.

masukkan deskripsi gambar di sini

Seperti halnya angka acak, kita mungkin bertanya pada diri sendiri: apa kovarian di antara mereka? Sekarang Anda mendapatkan matriks kovarians 4x4. Jika Anda memperkirakannya pada data harian satu bulan, Anda mendapatkan 12 matriks kovarian yang berbeda setiap tahun, jika Anda menginginkannya tidak tumpang tindih. Matriks kovarians sampel seri acak itu sendiri merupakan objek acak, lihat makalah Wishart "PRODUKSI UMUM DISTRIBUSI PRODUK DALAM SAMPEL DARI PENDUDUK MULTIVARIAT NORMAL." di sini . Ada distribusi yang memanggilnya.

Ini adalah salah satu cara untuk mendapatkan matriks acak. Tidak mengherankan bahwa teori matriks acak (RMT) digunakan dalam keuangan, seperti yang Anda lihat sekarang.

Aksakal
sumber
1
Anda menyebutkan memperkirakannya pada "data satu bulan", maksud Anda "nilai data harian satu bulan"?
John
1
@ John, dalam contoh khusus ini, ya, setiap hari. Namun, beberapa seri diukur dalam satu hari, seperti harga ekuitas. Jika Anda memiliki portofolio saham, Anda bisa mendapatkan matriks kovarian harian dalam frekuensi sangat tinggi.
Aksakal
3
+1. Mengutip di sini, tapi saya pikir salah satu cara untuk memotivasi matriks acak adalah bahwa dalam kasus ini, kita sering tertarik pada hubungan antara (bukan hanya dalam) vektor acak. Ini secara alami memotivasi pemikiran tentang matriks, bukan vektor.
Cliff AB
@Aksakal Data yang Anda sebutkan datang dalam frekuensi bulanan dan juga harian. Saya merasa membingungkan sebelum Anda merevisi posting karena tidak masuk akal untuk memperkirakan matriks kovarians menggunakan satu bulan data bulanan.
John
@ John, Anda bisa memperkirakan matriks kovarian pada data bulanan atau mingguan, tumpang tindih atau tidak tumpang tindih dll. Tidak ada cara yang benar untuk melakukan ini.
Aksakal
8

Dalam fisika teoretis, matriks acak memainkan peran penting untuk memahami fitur universal spektrum energi sistem dengan simetri tertentu.

Latar belakang saya dalam fisika teoretis dapat menyebabkan saya menyajikan sudut pandang yang sedikit bias di sini, tetapi saya bahkan melangkah lebih jauh untuk menyarankan bahwa popularitas teori matriks acak (RMT) berasal dari penerapannya yang sukses dalam fisika.

Tanpa terlalu banyak merinci, misalnya spektrum energi dalam mekanika kuantum dapat diperoleh dengan menghitung nilai eigen dari sistem Hamiltonian - yang dapat dinyatakan sebagai matriks hermitian. Seringkali fisikawan tidak tertarik pada sistem tertentu tetapi ingin tahu apa sifat umum dari sistem kuantum yang memiliki sifat kacau, yang menyebabkan nilai-nilai matriks Hamiltonian hermitian untuk mengisi ruang-matriks secara ergodis pada variasi energi atau parameter lainnya ( misalnya kondisi batas). Ini memotivasi memperlakukan kelas sistem fisik sebagai matriks acak dan melihat sifat rata-rata sistem ini. Saya merekomendasikan literatur tentang dugaan Bohigas-Gianonni-Schmidt jika Anda ingin menyelami ini lebih dalam.

Singkatnya, seseorang dapat misalnya menunjukkan bahwa tingkat energi sistem yang memiliki simetri pembalikan waktu berperilaku secara universal berbeda dari tingkat energi sistem yang tidak memiliki simetri pembalikan waktu (yang terjadi misalnya jika Anda menambahkan medan magnet). Sebenarnya perhitungan yang cukup singkat menggunakan matriks acak Gaussian dapat menunjukkan bahwa tingkat energi cenderung berbeda dalam kedua sistem.

Hasil ini dapat diperpanjang dan membantu untuk memahami juga simetri lain, yang memiliki dampak besar pada bidang yang berbeda, seperti juga fisika partikel atau teori transportasi mesoskopik dan kemudian bahkan di pasar keuangan.

Clusterfari
sumber
1
ini sebabnya saya keluar dari fisika :) terlalu banyak "kerusakan otak"
Aksakal
Ahli statistik menyukai Wishart di mana sebelum ahli fisika atom.
kjetil b halvorsen
5

Peta linear adalah peta antar ruang vektor. Misalkan Anda memiliki peta linier dan telah memilih pangkalan untuk domain dan ruang jangkauannya. Kemudian Anda dapat menulis matriks yang mengkodekan peta linier. Jika Anda ingin mempertimbangkan peta linear acak antara dua ruang tersebut, Anda harus membuat teori matriks acak. Proyeksi acak adalah contoh sederhana dari hal semacam itu.

Juga, ada objek bernilai matriks / tensor dalam fisika. The tensor stres kental adalah salah satu seperti (di antara kebun binatang benar). Dalam bahan viskoelastik yang hampir homogen, dapat berguna untuk memodelkan strain (elastis, kental, dkk.) Dan karenanya menekankan secara searah sebagai tensor acak dengan varian kecil. Meskipun ada pengertian "peta linear" terhadap tekanan / tekanan ini, lebih jujur ​​untuk menggambarkan aplikasi matriks acak ini sebagai pengacakan sesuatu yang sudah menjadi matriks.

Eric Towers
sumber
4

Penginderaan tekan sebagai aplikasi dalam pemrosesan gambar bergantung pada matriks acak sebagai pengukuran gabungan dari sinyal 2D. Sifat khusus dari matriks ini, yaitu koherensi , didefinisikan untuk matriks ini dan berperan dalam teori.

Sangat disederhanakan, ternyata meminimalkan norma L1 dari produk tertentu dari matriks Gaussian dan sinyal input jarang memungkinkan Anda untuk memulihkan lebih banyak informasi daripada yang Anda harapkan.

Penelitian awal yang paling menonjol di bidang ini yang saya tahu adalah karya Rice University: http://dsp.rice.edu/research/compressive-sensing/random-matrices

Teori produk matriks sebagai "pengukuran sinyal" berjalan setidaknya sejauh WW2. Seperti yang dikatakan oleh mantan profesor saya kepada saya, secara individual menguji setiap pendaftar pasukan untuk, katakanlah, sifilis, adalah biaya mahal. Mencampurkan sampel-sampel ini dengan cara yang sistematis (dengan mencampurkan bagian-bagian dari setiap sampel darah bersama-sama dan mengujinya) akan mengurangi berapa kali tes perlu dilakukan. Ini bisa dimodelkan sebagai vektor biner acak dikalikan dengan matriks jarang.

bintang yang terang
sumber