Bayangkan sebuah situasi: Kami memiliki catatan sejarah (20 tahun) dari tiga tambang. Apakah kehadiran perak meningkatkan kemungkinan menemukan emas di tahun depan? Bagaimana cara menguji pertanyaan seperti itu?
Berikut ini contoh data:
mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
"rock","rock","rock","rock","silver","rock","rock",
"rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
"silver","gold","gold","gold","gold","gold","rock",
"silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
"rock","silver","rock","rock","rock","rock","silver",
"gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)
r
time-series
hypothesis-testing
stochastic-processes
Ladislav Naďo
sumber
sumber
Jawaban:
Percobaan terbaik saya: ... penggunaan matriks transisi yang disarankan oleh @AndyW mungkin bukan solusi yang saya cari (berdasarkan komentar @ Tim). Jadi saya sudah mencoba pendekatan yang berbeda. Saya menemukan tautan ini yang berkaitan dengan bagaimana melakukan regresi logistik di mana variabel respon y dan variabel prediktor x keduanya biner .
Menurut contoh saya harus membuat tabel 2 × 2 berdasarkan data saya:
Cara saya mengekstrak nilai:
Dan membangun model:
Apakah ini solusi yang baik? Apakah p-value (0,673) berarti bahwa kehadiran perak tidak meningkatkan kemungkinan menemukan emas?
sumber
yes = c(2, 14), no = c(7, 34)
, yang berarti menempatkan Silver Anda: ya pertama. Jadi, ketika Anda melakukanas.factor(c(0, 1))
0 sesuai dengan perak: ya, yang merupakan level referensi Anda dan dengan demikian intersep Anda. Nilai 0,67 p sesuai dengan benjolan positif kecil yang Anda dapatkan dalam kemungkinan menemukan emas bergerak dari perak: ya ke perak: tidak.