Cara menguji apakah "keadaan sebelumnya" memiliki pengaruh pada "keadaan selanjutnya" di R

10

Bayangkan sebuah situasi: Kami memiliki catatan sejarah (20 tahun) dari tiga tambang. Apakah kehadiran perak meningkatkan kemungkinan menemukan emas di tahun depan? Bagaimana cara menguji pertanyaan seperti itu?


masukkan deskripsi gambar di sini

Berikut ini contoh data:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)

Ladislav Naďo
sumber
1
Anda mungkin tertarik untuk menghitung matriks transisi .
Andy W
Hai @AndyW! Terima kasih atas komentarnya. Saya kenal dengan paket matriks transisi: makkovchain - markovchainFit (). Bolehkah saya menggunakan nilai probabilitas dari matriks transisi sebagai nilai p? Apakah ada cara bagaimana menguji hipotesis: "Ada hubungan" perak-emas "." (p-value = xx)?
Ladislav Naďo
1
Peluang transisi @LadislavNado tidak dapat diartikan sebagai nilai-p (mereka tidak memberi tahu Anda apa pun tentang penolakan terhadap H0), lihat stats.stackexchange.com/questions/31/… untuk mempelajari lebih lanjut tentang nilai-p.
Tim
1
Saya melihat masalah dengan cara Anda mengekstraksi data Anda. Pertimbangkan skenario "perak: tidak" & "emas: ya", Anda juga harus menghitung jumlah "emas" berturut-turut karena memenuhi kriteria logika.
1
Dengan satu sel dikoreksi dari 1 hingga 14, model berubah menjadi: Koefisien: Estimasi Std. Kesalahan nilai z Pr (> | z |) (Intercept) -1.2528 0.8018 -1.562 0.118 as.factor (c (0, 1)) 1 0.3655 0.8624 0.424 0.672

Jawaban:

4

Percobaan terbaik saya: ... penggunaan matriks transisi yang disarankan oleh @AndyW mungkin bukan solusi yang saya cari (berdasarkan komentar @ Tim). Jadi saya sudah mencoba pendekatan yang berbeda. Saya menemukan tautan ini yang berkaitan dengan bagaimana melakukan regresi logistik di mana variabel respon y dan variabel prediktor x keduanya biner .

Menurut contoh saya harus membuat tabel 2 × 2 berdasarkan data saya:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Cara saya mengekstrak nilai: masukkan deskripsi gambar di sini

Dan membangun model:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

Apakah ini solusi yang baik? Apakah p-value (0,673) berarti bahwa kehadiran perak tidak meningkatkan kemungkinan menemukan emas?

Ladislav Naďo
sumber
Bagaimana Anda menghasilkan grafik yang bagus ini? Tikz?
shadowtalker
Hai @ssdecontrol! Grafik dibuat dengan tangan di Inkscape.
Ladislav Naďo
Ya, itu interpretasi yang layak. Juga, jika Anda hanya melihat baris-baris tabel 2x2 Anda, di baris atas (perak: ya) Anda memiliki 9 kasing, 2 di antaranya memiliki emas, jadi kemungkinan perak yang diberikan emas tahun depan adalah 2/9 = 0,222. Di baris bawah (perak: tidak) Anda memiliki 48 kasing, 14 di antaranya memiliki emas tahun depan, jadi tanpa diberi peluang emas adalah 14 / (14 + 34) = 0,292. Mengingat semua itu, sepertinya perak menyakiti peluang Anda untuk menemukan emas, meskipun dari nilai-p Anda tidak "signifikan secara statistik".
Gregor Thomas
Juga perhatikan kode Anda, Anda mulai dengan yes = c(2, 14), no = c(7, 34), yang berarti menempatkan Silver Anda: ya pertama. Jadi, ketika Anda melakukan as.factor(c(0, 1))0 sesuai dengan perak: ya, yang merupakan level referensi Anda dan dengan demikian intersep Anda. Nilai 0,67 p sesuai dengan benjolan positif kecil yang Anda dapatkan dalam kemungkinan menemukan emas bergerak dari perak: ya ke perak: tidak.
Gregor Thomas
Satu komentar terakhir: Anda sedang menggunakan matriks transisi. Matriks 2, 7, 14, 34 Anda adalah matriks transisi.
Gregor Thomas