Misalkan Anda mengamati urutannya:
7, 9, 0, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 0, 6, 6, 4, 5, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 0, 4, 5, 5, 2, 8. ..
Tes statistik apa yang akan Anda terapkan untuk menentukan apakah ini benar-benar acak? FYI ini adalah digit ke- dari . Jadi, apakah digit acak secara statistik? Apakah ini mengatakan sesuatu tentang konstanta ?
random-generation
randomness
Cam.Davidson.Pilon
sumber
sumber
Jawaban:
Lembaga Standar Nasional AS telah mengumpulkan serangkaian tes yang harus dilewati oleh generator nomor acak (pseudo-) agar dianggap memadai, lihat http://csrc.nist.gov/groups/ST/toolkit/rng/stats_tests. html . Ada juga tes yang dikenal sebagai rangkaian uji Diehard , yang agak tumpang tindih dengan tes NIST. Pengembang paket statistik Stata melaporkan hasil Diehard mereka sebagai bagian dari proses sertifikasi mereka. Saya membayangkan Anda dapat mengambil blok digit , katakanlah dalam kelompok 15 digit berturut-turut, agar dapat dibandingkan dengan akurasi tipe ganda , dan jalankan uji baterai ini pada angka yang diperoleh dengan demikian.π
sumber
Menjawab hanya pertanyaan pertama Anda: "Tes apa yang akan Anda terapkan untuk menentukan apakah [urutan] ini benar-benar acak?"
Bagaimana memperlakukannya sebagai rangkaian waktu, dan memeriksa korelasi-otomatis? Berikut adalah beberapa kode R. Pertama beberapa data uji (1000 digit pertama):
Periksa jumlah setiap digit:
Kemudian ubah menjadi seri waktu, dan jalankan uji Box-Pierce:
yang memberitahu saya:
Biasanya Anda ingin nilai p di bawah 0,05 untuk mengatakan ada korelasi otomatis.
Jalankan
acf(d)
untuk melihat korelasi otomatis. Saya belum memasukkan gambar di sini karena ini adalah grafik yang membosankan, meskipun anehnya kelambatan terbesar ada di 11 dan 22. Jalankanacf(d,lag.max=40)
untuk menunjukkan bahwa tidak ada puncak di lag = 33, dan itu hanya kebetulan!PS Kita bisa membandingkan seberapa baik 1000 digit pi itu, dengan melakukan tes yang sama pada bilangan acak nyata.
Ini menghasilkan 1000 digit acak, melakukan tes, dan mengulangi ini 100 kali.
Jadi hasil kami nyaman dalam standar deviasi pertama, dan pi dukun seperti bebek acak. (Saya menggunakan
set.seed(1)
jika Anda ingin mereproduksi angka-angka yang tepat.)sumber
Itu pertanyaan aneh. Angka tidak acak.
Sebagai deret waktu dari basis 10 digit, benar-benar diperbaiki.π
Jika Anda berbicara tentang memilih secara acak indeks untuk deret waktu, dan memilih nomor itu, yakin itu acak. Namun demikian, angka membosankan dan rasional . Dalam kedua kasus, "keacakan" berasal dari memilih sesuatu secara acak, seperti menggambar nama dari topi.0.1212121212…
Jika apa yang Anda bicarakan lebih bernuansa, seperti pada "Jika saya secara berurutan mengungkapkan urutan angka yang acak, dapatkah Anda memberi tahu saya jika itu adalah subset tetap dari ? Dan dari mana asalnya?". Yah pertama-tama, meskipun tidak berulang, urutan acak yang berbeda setidaknya akan menyelaraskan secara lokal untuk menjalankan kecil. Itu hasil teori bilangan, bukan statistik. Segera setelah Anda istirahat, Anda harus memindai ke instance penyelarasan berikutnya. Secara komputasional, itu tidak dapat diluruskan untuk menyejajarkan urutan acak apa pun karena dapat cocok dengan tempat ke- . Heck bahkan jika urutannya sejajar denganπ π π 2222+1 π suatu tempat, tidak berarti itu tidak acak. Misalnya, saya dapat memilih 3 secara acak, bukan berarti itu adalah digit pertama dari .π
sumber