Sejujurnya, saya telah membaca banyak situs web dan jawaban mengenai pertanyaan ini, dan tidak ada yang menjelaskannya dengan kata-kata sederhana yang dapat dimengerti. Yang ingin saya lakukan adalah memahami apa yang dilakukan dengan berjalan secara acak, dan bagaimana hal itu dapat digunakan untuk Analisis Pengayaan Gene Set.
Ada makalah yang diterbitkan di sini http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ namun, saya tidak bisa memahaminya.
Bisakah seseorang tolong jelaskan apa fungsinya dengan kata-kata sederhana?
time-series
biostatistics
bioinformatics
Pelajar
sumber
sumber
Jawaban:
Saya akan mencoba dan menjawab pertanyaan pertama Anda
Jalan acak adalah serangkaian pengukuran di mana nilai pada titik tertentu dalam seri adalah nilai dari titik sebelumnya dalam seri ditambah beberapa kuantitas acak.
Sebagai contoh, misalkan Anda melempar koin yang adil dalam serangkaian lemparan, dan setiap kali koin muncul kepala Anda menambahkan 1 ke nilai sebelumnya dari variabel seri Anda, dan setiap kali koin muncul ekor Anda mengurangi 1 dari nilai sebelumnya variabel serial Anda. Jika nilai awalnya adalah 0, dan jika Anda membalik urutan lemparan koin berikut:
Jalan acak , berdasarkan nilai-nilai ini seperti dijelaskan di atas adalah:y
Jadi nilai adalah:y
Distribusi tergantung pada waktu , memberikan beberapa sifat menarik pada sampel pada waktu yang berbeda:y t y
The rata dari tidak terdefinisi.y Ini mungkin tampak kontra-intuitif, karena Anda mungkin berharap bahwa kepala dan ekor koin seimbang berpusat pada nol. Sejauh ini benar, tetapi nol hanyalah nilai awal sewenang-wenang . y Jadi tidak ada yang jahat!
The varians dari .y=t Seiring waktu (jumlah flips) meningkat, varians juga meningkat. Misalnya, pada flip pertama ( ), nilai yang mungkin adalah atau , dan memang variansnya adalah 1. Tetapi pada flip kedua ( ) nilai yang mungkin adalah , atau , dan variansnya sama dengan 2. Untuk jumlah flips yang tidak terbatas (pada , ketika rentang semua nilai yang mungkin dari berubah dari ke ), variansnya adalah infinite.t=1 1 −1 t=2 2 0 −2 t=∞ y −∞ ∞
Kedua fakta ini memainkan malapetaka dalam mencoba menarik kesimpulan tentang distribusi (bukan untuk diberikan) hanya diberikan sampel ketika menggunakan alat dasar inferensi statistik. (Bagaimana taksiran finite tidak terdefinisi ? Bagaimana bisa finite estimasi ?)y yt y0 y¯ s2y σ2y=∞
Ada banyak jenis jalan acak, dan lebih umum, proses autogregresif (yaitu variabel apa pun yang tergantung pada nilai-nilai sebelumnya). Contoh di sini menggunakan variabel acak Bernouli sederhana (lemparan koin), tetapi orang bisa:
Tetapi mereka semua adalah Dickens untuk mencoba dan menganalisis menggunakan metode dasar. Itulah sebabnya kami memiliki kointegrasi regresi dan model koreksi kesalahan dan teknik analisis deret waktu lainnya untuk menangani jenis data ini (yang kadang-kadang kita sebut sebagai 'tidak terintegrasi', 'memori panjang' atau 'unit root' di antara label lain) tergantung pada detailnya).
Asal usul istilah "jalan acak" adalah dari sepasang surat yang sangat singkat ke Nature pada tahun 1905.
Referensi
Pearson, K. (1905). Letters to the Editor: Masalah jalan acak. Alam , 72 (1865): 294.
Pearson, K. (1905). Letters to the Editor: Masalah jalan acak. Alam , 72 (1867): 342.
sumber