Apa tepatnya yang dilakukan dengan jalan acak?

8

Sejujurnya, saya telah membaca banyak situs web dan jawaban mengenai pertanyaan ini, dan tidak ada yang menjelaskannya dengan kata-kata sederhana yang dapat dimengerti. Yang ingin saya lakukan adalah memahami apa yang dilakukan dengan berjalan secara acak, dan bagaimana hal itu dapat digunakan untuk Analisis Pengayaan Gene Set.

Ada makalah yang diterbitkan di sini http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ namun, saya tidak bisa memahaminya.

Bisakah seseorang tolong jelaskan apa fungsinya dengan kata-kata sederhana?

Pelajar
sumber
2
Itu adalah dua pertanyaan yang sangat berbeda!
Alexis
1
@Alexis Saya menerima revisi Anda, saya harap sekarang jelas!
Learner
1
@Nemo Saya menghapus tag yang tidak terkait dan menambahkan tag time-series . Jangan ragu untuk mengedit perubahan saya atau menambahkan tag tambahan tetapi tag seperti r , signifikansi statistik , atau matematika tampaknya tidak terkait di sini.
Tim

Jawaban:

11

Saya akan mencoba dan menjawab pertanyaan pertama Anda

Jalan acak adalah serangkaian pengukuran di mana nilai pada titik tertentu dalam seri adalah nilai dari titik sebelumnya dalam seri ditambah beberapa kuantitas acak.

Sebagai contoh, misalkan Anda melempar koin yang adil dalam serangkaian lemparan, dan setiap kali koin muncul kepala Anda menambahkan 1 ke nilai sebelumnya dari variabel seri Anda, dan setiap kali koin muncul ekor Anda mengurangi 1 dari nilai sebelumnya variabel serial Anda. Jika nilai awalnya adalah 0, dan jika Anda membalik urutan lemparan koin berikut:

T H T T T H H H T T H T H T H

Jalan acak , berdasarkan nilai-nilai ini seperti dijelaskan di atas adalah:y

0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1

Jadi nilai adalah:y

yt=yt1+2Bernoulli(0.5)1

Distribusi tergantung pada waktu , memberikan beberapa sifat menarik pada sampel pada waktu yang berbeda:yty

  1. The rata dari tidak terdefinisi. yIni mungkin tampak kontra-intuitif, karena Anda mungkin berharap bahwa kepala dan ekor koin seimbang berpusat pada nol. Sejauh ini benar, tetapi nol hanyalah nilai awal sewenang-wenang . yJadi tidak ada yang jahat!

  2. The varians dari . y=tSeiring waktu (jumlah flips) meningkat, varians juga meningkat. Misalnya, pada flip pertama ( ), nilai yang mungkin adalah atau , dan memang variansnya adalah 1. Tetapi pada flip kedua ( ) nilai yang mungkin adalah , atau , dan variansnya sama dengan 2. Untuk jumlah flips yang tidak terbatas (pada , ketika rentang semua nilai yang mungkin dari berubah dari ke ), variansnya adalah infinite.t=111t=2202t=y

Kedua fakta ini memainkan malapetaka dalam mencoba menarik kesimpulan tentang distribusi (bukan untuk diberikan) hanya diberikan sampel ketika menggunakan alat dasar inferensi statistik. (Bagaimana taksiran finite tidak terdefinisi ? Bagaimana bisa finite estimasi ?)yyty0y¯sy2σy2=

Ada banyak jenis jalan acak, dan lebih umum, proses autogregresif (yaitu variabel apa pun yang tergantung pada nilai-nilai sebelumnya). Contoh di sini menggunakan variabel acak Bernouli sederhana (lemparan koin), tetapi orang bisa:

  • tambahkan nilai acak yang didistribusikan secara normal ke nilai berturut-turut dari sebagai gantinya ... atau memang nilai acak yang diambil dari segala jenis distribusi;y
  • membuat nilai pada suatu titik waktu bergantung pada nilai-nilai sebelumnya dari lebih dari satu titik waktu (misalnya );yyyt=yt1+yt2+Something Random
  • pasangkan nilai dengan nilai acak untuk membuat jalan acak dua dimensi;yx
  • membuat beberapa mewah fungsi dari , contoh sederhana adalah , di mana , yang berarti bahwa memori dari setiap momen spesifik dari meluruh dari waktu ke waktu (dengan memori yang bertahan lebih lama semakin dekat adalah ke 1) —per komentar Alecos, ini hanya akan menjadi 'autoregresif' (jalan acak murni akan memiliki );ytyt1yt=αyt1+Something Random|α|<1y |α||α|=1
  • lakukan banyak hal lain untuk membuat jalan acak dan / atau proses autoregresif menjadi lebih kompleks.

Tetapi mereka semua adalah Dickens untuk mencoba dan menganalisis menggunakan metode dasar. Itulah sebabnya kami memiliki kointegrasi regresi dan model koreksi kesalahan dan teknik analisis deret waktu lainnya untuk menangani jenis data ini (yang kadang-kadang kita sebut sebagai 'tidak terintegrasi', 'memori panjang' atau 'unit root' di antara label lain) tergantung pada detailnya).

Asal usul istilah "jalan acak" adalah dari sepasang surat yang sangat singkat ke Nature pada tahun 1905.

Referensi
Pearson, K. (1905). Letters to the Editor: Masalah jalan acak. Alam , 72 (1865): 294.

Pearson, K. (1905). Letters to the Editor: Masalah jalan acak. Alam , 72 (1867): 342.

Alexis
sumber
2
Anda menulis "Jalan acak adalah serangkaian pengukuran di mana nilai pada titik tertentu dalam seri tergantung pada nilai poin sebelumnya dalam seri." Tapi ini menggambarkan proses autoregresif, dan tidak semua proses autoregresif berjalan secara acak. Karena jelas Anda mengetahui pokok bahasannya, saya yakin akan sangat membantu jika Anda merevisi pernyataan ini untuk mengungkap apa karakteristik unik dari jalan-jalan acak.
Alecos Papadopoulos
@AlecosPapadopoulos TY! Tolong bantu saya di sini ... tidak benar-benar akrab dengan subjek. Bagaimana Anda menyarankan saya membedakan jalan acak dari proses autoregresif?
Alexis
Dengan senang hati. Ada banyak literatur tentang random walk (s), subjeknya sangat beragam. Tetapi pada tingkat pertama, yang membedakan jalan acak adalah bahwa semua nilai masa lalu dari setiap langkah berkontribusi dengan nilai penuh mereka ke nilai saat ini dari jumlah mereka (yang merupakan jalan acak). Dalam proses autoregresif, biasanya efek dari masa lalu secara bertahap mati. Anda pada dasarnya membahas hal ini dalam posting Anda. Juga sekarang saya membaca kembali jawaban Anda, mungkin Anda ingin memikirkan kembali penggunaan kata "populasi": setiap memiliki distribusi yang berbeda, jadi dalam arti apa termasuk dalam populasi yang sama? ytyt,yt+1...
Alecos Papadopoulos
1
@Nemo Anda mendapatkan tipe perilaku tertentu (biasanya seiring waktu): masa lalu sepenuhnya menentukan di mana Anda berada - tetapi , jalur evolusi tidak memengaruhi di mana Anda akan berada berikutnya. Bagaimana proses sampai pada posisi saat ini, tidak masalah untuk masa depan.
Alecos Papadopoulos
1
Jalan acak benar-benar tidak "mirip dengan tes Kolmogorov-Smirnov". Derivasi distribusi asimptotik dari statistik uji KS di bawah hipotesis nol menggunakan gagasan yang berkaitan dengan jalan acak. Titik menggambar koneksi itu tampaknya dari pandangan cepat saya untuk memotivasi pengembangan di bagian selanjutnya (tes GSEA). Saya tidak yakin itu pilihan yang bagus; tampaknya membuat Anda kebingungan daripada membantu Anda melihat apa yang sedang terjadi. Saya sarankan Anda mencoba memahami jalan-jalan acak secara terpisah sebelum mencoba memahami hubungan antara jalan-jalan acak dan GSEA.
Glen_b -Reinstate Monica