Apakah fungsi autokorelasi sepenuhnya menggambarkan proses stokastik?

31

Apakah proses stokastik benar-benar dijelaskan oleh fungsi autokorelasi?

Jika tidak, properti tambahan apa yang diperlukan?

Andreas
sumber

Jawaban:

44

Apa yang dimaksud dengan deskripsi lengkap dari proses stokastik? Secara matematis, proses stokastik adalah kumpulan variabel acak, satu untuk setiap kali instan dalam set indeks , di mana biasanya adalah seluruh garis nyata atau garis nyata positif, dan deskripsi lengkap berarti bahwa untuk setiap bilangan bulat dan waktu , kita tahu distribusi (gabungan) dari yang random variabel , ,{X(t):tT}t TTn1nt1,t2,,tnTnX(t1)X(t2),X(tn). Ini adalah besar jumlah informasi: kita perlu mengetahui CDF dari untuk setiap kali instan , (dua dimensi) CDF bersama dan untuk semua pilihan waktu instants dan , (tiga dimensi) , , dan , dll. dll. dll.X(t)tX(t1)X(t2)t1t2X(t1)X(t2)X(t3)

Jadi secara alami orang mencari deskripsi yang lebih sederhana dan model yang lebih ketat. Satu penyederhanaan terjadi ketika proses tidak berubah pada asal usul waktu. Apa ini artinya itu

  • Semua variabel acak dalam proses memiliki CDF identik: untuk semua .FX(t1)(x)=FX(t2)(x)t1,t2
  • Setiap dua variabel acak dipisahkan oleh beberapa jumlah waktu tertentu memiliki CDF bersama sama lain sepasang variabel acak dipisahkan oleh yang sama jumlah waktu. Misalnya, variabel acak dan dipisahkan oleh \ tau detik, seperti halnya variabel acak X (t_2) dan X (t_2 + \ tau) , dan dengan demikian F_ {X (t_1 ), X (t_1 + \ tau)} (x, y) = F_ {X (t_2), X (t_2 + \ tau)} (x, y)X(t1)X(t1+τ)τX(t2)X(t2+τ)FX(t1),X(t1+τ)(x,y)=FX(t2),X(t2+τ)(x,y)
  • Setiap tiga variabel acak , , spasi dan terpisah memiliki CDF bersama sama dengan , , yang juga berjarak dan terpisah,X(t1)X(t1+τ1)X(t1+τ1+τ2)τ1τ2X(t2)X(t2+τ1)X(t2+τ1+τ2)τ1τ2
  • dan seterusnya untuk semua CDF multidimensi. Lihat, misalnya, jawaban Peter K. untuk perincian kasus multidimensi.

Secara efektif, deskripsi probabilistik dari proses acak tidak tergantung pada apa yang kita pilih untuk menyebut asal pada sumbu waktu: menggeser semua instants waktu dengan jumlah tetap ke memberikan deskripsi probabilistik yang sama dari variabel acak. Properti ini disebut stasioneritas rasa-ketat dan proses acak yang menikmati properti ini disebut proses acak stasioner ketat, atau, lebih sederhana, proses acak stasioner. t1,t2,,tnτt1+τ,t2+τ,,tn+τ

Perhatikan bahwa stasioneritas yang ketat dengan sendirinya tidak memerlukan bentuk CDF tertentu. Misalnya, tidak dikatakan bahwa semua variabel adalah Gaussian.

Kata sifat secara ketat menyarankan bahwa adalah mungkin untuk mendefinisikan bentuk stasioneritas yang lebih longgar. Jika -memesan bersama CDF dari sama dengan -memesan bersama CDF untuk semua pilihan dan , maka proses acak dikatakan sebagai stasioner untuk memesan dan disebut sebagai -memerintahkan proses acak stasioner. Perhatikan bahwa proses acak stasioner stasioner juga stasioner untuk memesan untuk setiap positifNthX(t1),X(t2),,X(tN)NthX(t1+τ),X(t2+τ),,X(tN+τ)t1,t2,,tNτNNthNthnn<N . (Ini karena -order bersama CDF adalah batas -order CDF sebagai dari pendekatan argumen : generalisasi ). Sebuah proses acak ketat stasioner maka adalah proses acak yang stasioner untuk semua perintah .nthNthNnFX(x)=limyFX,Y(x,y)N

Jika proses acak stasioner terhadap (setidaknya) urutan , maka semua memiliki distribusi yang sama dan dengan asumsi rata-rata ada, adalah sama untuk semua . Demikian pula, adalah sama untuk semua , dan disebut sebagai kekuatan proses. Semua proses fisik memiliki kekuatan yang terbatas dan oleh karena itu umum untuk mengasumsikan bahwa dalam hal ini, dan terutama dalam literatur teknik yang lebih tua, proses ini disebut proses orde kedua . Pilihan nama sangat disayangkan karena mengundang kebingungan dengan urutan kedua 1X(t)E[X(t)]=μtE[(X(t))2]tE[(X(t))2]<stasioneritas (lih. jawaban saya ini di stats.SE ), dan jadi di sini kita akan menyebut proses yang terbatas untuk semua ( atau tidak adalah konstan) sebagai proses berdaya-terbatas dan menghindari kebingungan ini. Tapi perhatikan lagi ituE[(X(t))2]tE[(X(t))2]

proses stasioner orde pertama tidak perlu menjadi proses berdaya terbatas.

Pertimbangkan proses acak yang diam untuk memesan . Sekarang, karena distribusi gabungan dan sama dengan fungsi distribusi gabungan dan , dan nilainya hanya tergantung pada . Harapan-harapan ini terbatas untuk proses daya-terbatas dan nilainya disebut fungsi autokorelasi proses: adalah fungsi dari , waktu pemisahan variabel acak dan , dan tidak bergantung pada2X(t1)X(t1+τ)X(t2)X(t2+τ)E[X(t1)X(t1+τ)]=E[X(t2)X(t2+τ)]τRX(τ)=E[X(t)X(t+τ)]τX(t)X(t+τ)tsama sekali. Perhatikan juga bahwa dan fungsi autokorelasi adalah fungsi genap dari argumennya.

E[X(t)X(t+τ)]=E[X(t+τ)X(t)]=E[X(t+τ)X(t+ττ)]=RX(τ),

Proses acak stasioner orde kedua berkekuatan terbatas memiliki sifat-sifat itu

  1. Berarti adalah konstantaE[X(t)]
  2. Fungsi autokorelasi adalah fungsi dari , pemisahan waktu dari variabel acak dan , dan tidak tidak bergantung pada sama sekali.RX(τ)=E[X(t)X(t+τ)]τX(t)X(t+τ)t

Asumsi stasioneritas menyederhanakan deskripsi proses acak sampai batas tertentu tetapi, untuk insinyur dan ahli statistik yang tertarik dalam membangun model dari data eksperimental, memperkirakan semua CDF adalah tugas nontrivial, terutama ketika hanya ada satu segmen dari satu jalur sampel (atau realisasi) di mana pengukuran dapat dilakukan. Dua pengukuran yang relatif mudah dilakukan (karena insinyur sudah memiliki instrumen yang diperlukan di meja kerjanya (atau program dalam MATLAB / Python / Octave / C ++ di perpustakaan perangkat lunaknya) adalah nilai DC dari dan fungsi autokorelasix(t) 1T0Tx(t)dtx(t)Rx(τ)=1T0Tx(t)x(t+τ)dt(atau transformasi Fourier-nya, spektrum kekuatan ). Mengambil pengukuran-pengukuran ini sebagai perkiraan dari rata-rata dan fungsi autokorelasi dari suatu proses berdaya-terbatas mengarah pada model yang sangat berguna yang akan kita bahas selanjutnya.x(t)


Proses acak berdaya terbatas disebut proses wide-sense-stationary (WSS) (juga proses acak stasioner yang lemah yang untungnya juga memiliki inisialisasi yang sama) jika memiliki rata-rata konstan dan fungsi autokorelasi hanya bergantung pada perbedaan waktu (atau ).RX(t1,t2)=E[X(t1)X(t2)]t1t2t2t1

Perhatikan bahwa definisi tersebut tidak mengatakan apa pun tentang CDF dari variabel acak yang terdiri dari proses; ini sepenuhnya merupakan kendala pada momen orde pertama dan urutan kedua dari variabel acak. Tentu saja, proses acak urutan kedua terbatas-daya (atau -tertentu stasioner (untuk ) atau stasioner ketat) adalah proses WSS, tetapi sebaliknya tidak perlu benar.NthN>2

Proses WSS tidak harus stasioner untuk pesanan apa pun.

Pertimbangkan, misalnya, proses acak mana mengambil empat nilai yang kemungkinan sama dan . (Jangan takut: empat jalur sampel yang mungkin dari proses acak ini hanyalah empat bentuk gelombang sinyal dari sinyal QPSK). Perhatikan bahwa masing-masing adalah variabel acak diskrit yang, secara umum, memiliki empat nilai yang kemungkinan sama dan , Sangat mudah untuk melihat bahwa secara umum dan{X(t):X(t)=cos(t+Θ),<t<}Θ0,π/2,π3π/2X(t)cos(t),cos(t+π/2)=sin(t),cos(t+π)=cos(t)cos(t+3π/2)=sin(t)X(t)X(s)memiliki distribusi yang berbeda, sehingga prosesnya bahkan tidak stasioner tingkat pertama. Di sisi lain, untuk setiap sementara Singkatnya, proses memiliki mean nol dan fungsi autokorelasi tergantung hanya pada perbedaan waktu , dan sehingga proses adalah lebar akal stasioner. Tetapi ini bukan stasioner orde pertama dan karenanya juga tidak stasioner terhadap orde yang lebih tinggi.

E[X(t)]=14cos(t)+14(sin(t))+14(cos(t))+14sin(t)=0
t
E[X(t)X(s)]=14[cos(t)cos(s)+(cos(t))(cos(s))+sin(t)sin(s)+(sin(t))(sin(s))]=12[cos(t)cos(s)+sin(t)sin(s)]=12cos(ts).
ts

Bahkan untuk proses WSS yang merupakan proses acak stasioner orde kedua (atau stasioner ketat), sedikit yang dapat dikatakan tentang bentuk spesifik dari distribusi variabel acak. Pendeknya,

Proses WSS tidak selalu stasioner (untuk urutan apa pun), dan fungsi rata-rata dan autokorelasi dari proses WSS tidak cukup untuk memberikan deskripsi statistik lengkap tentang proses tersebut.

Akhirnya, anggaplah bahwa proses stokastik dianggap sebagai proses Gaussian ("membuktikan" ini dengan tingkat kepercayaan yang wajar bukanlah tugas yang sepele). Ini berarti bahwa untuk setiap , adalah variabel acak Gaussian dan untuk semua bilangan bulat positif dan pilihan waktu instan , , , variabel acak , , adalah variabel acak Gaussian bersama . Sekarang fungsi kepadatan Gaussian bersama sepenuhnyatX(t)n2nt1t2,tnNX(t1)X(t2),X(tn)ditentukan oleh mean, varians, dan kovarian dari variabel acak, dan dalam hal ini, mengetahui fungsi rata-rata (tidak perlu konstan seperti yang diperlukan untuk pengertian luas) -stasioneritas) dan fungsi autokorelasi untuk semua (tidak perlu hanya bergantung pada seperti yang diperlukan untuk stasioneritas yang luas) cukup untuk menentukan statistik proses sepenuhnya.μX(t)=E[X(t)]RX(t1,t2)=E[X(t1)X(t2)]t1,t2t1t2

Jika proses Gaussian adalah proses WSS, maka itu juga merupakan proses Gaussian yang stasioner . Untungnya bagi para insinyur dan pemroses sinyal, banyak proses noise fisik dapat dimodelkan dengan baik sebagai proses WSS Gaussian (dan karenanya proses yang sangat diam), sehingga pengamatan eksperimental fungsi autokorelasi dengan mudah menyediakan semua distribusi bersama. Selanjutnya karena proses Gaussian mempertahankan karakter Gaussian mereka saat mereka melewati sistem linear, dan fungsi autokorelasi output terkait dengan fungsi autokorelasi input sebagai

Ry=hh~RX
sehingga statistik keluaran juga dapat dengan mudah ditentukan, proses WSS secara umum dan proses WSS Gaussian khususnya sangat penting dalam aplikasi teknik.

Dilip Sarwate
sumber
Bisakah Anda, tolong, mengomentari "Kebisingan Putih" dalam arti itu? Menurut definisi Autocorrelation at adalah varian dari variabel acak. Apakah itu berarti bahwa AWGN (Additive White Gaussian Noise) memiliki varian yang tak terbatas? Saya bertanya karena biasanya orang menulis , salah? Haruskah ditulis ? Terima kasih. τ=0n(t) N(0,N0/2)n(t) N(0,δ(0)N0/2)
Royi
1
@Drazick Silakan ajukan pertanyaan terpisah.
Dilip Sarwate
1
Ini adalah kursus mini yang fantastis dalam definisi proses stasioner. Saya belum pernah melihat yang seperti ini - ditata begitu metodis dan jelas. Wiki Komunitas?
Abalter
@Dilip Sarwate Maafkan saya atas ketidaktahuan saya. Dalam contoh Mengapa E [X (t)] = 0 untuk semua t? Apakah Anda menganggap ergodisitas? Bagaimana Anda memperoleh fungsi kerapatan probabilitas X (t) dari fungsi kerapatan probabilitas theta untuk menghitung nilai yang diharapkan? E [X (t) X (s)] = E [cos (t + theta) * cos (s + theta)] benar? Langkah mana yang Anda ambil untuk menyederhanakan ungkapan ini dan mendapatkan apa yang Anda tulis? Terima kasih
VMMF
1
@VMMF TIDAK ADA ergodisitas yang digunakan. adalah variabel acak diskrit karena adalah variabel acak diskrit dan mengambil nilai dan dengan probabilitas yang sama . Ergo, . mengambil nilai , , dan dengan probabilitas yang sama . Karenanya,X(t)=cos(t+Θ)Θ±cos(t)±sin(t)14E[X(t)]=0X(t)X(s)cos(t)cos(s)(cos(t))(cos(s))=cos(t)cos(s)sin(t)sin(s)(sin(t))(sin(s))=sin(t)sin(s)14E[X(t)(X(s)]=12(cos(t)cos(s)+sin(t)sin(s))=12cos(ts)
.Oleh