Saya telah mengikuti data simulasi dari 2500 orang tentang kejadian penyakit langka selama 20 tahun
year number_affected
1 0
2 0
3 1
4 0
5 0
6 0
7 1
8 0
9 1
10 0
11 1
12 0
13 0
14 1
15 1
16 0
17 1
18 0
19 2
20 1
Tes apa yang dapat saya terapkan untuk menunjukkan bahwa penyakit ini menjadi lebih umum?
Sunting: seperti yang disarankan oleh @Wrzlprmft Saya mencoba korelasi sederhana menggunakan metode Spearman dan juga Kendall:
Spearman's rank correlation rho
data: year and number_affected
S = 799.44, p-value = 0.08145
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.3989206
Warning message:
In cor.test.default(year, number_affected, method = "spearman") :
Cannot compute exact p-value with ties
>
Kendall's rank correlation tau
data: year and number_affected
z = 1.752, p-value = 0.07978
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.3296319
Warning message:
In cor.test.default(year, number_affected, method = "kendall") :
Cannot compute exact p-value with ties
Apakah ini cukup baik untuk jenis data ini? Uji Mann Kendall menggunakan metode yang ditunjukkan oleh @AWebb memberikan nilai P [1] 0,04319868. Regresi Poisson yang disarankan oleh @dsaxton memberikan hasil sebagai berikut:
Call:
glm(formula = number_affected ~ year, family = poisson, data = mydf)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3187 -0.8524 -0.6173 0.5248 1.2158
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.79664 0.85725 -2.096 0.0361 *
year 0.09204 0.05946 1.548 0.1217
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 16.636 on 19 degrees of freedom
Residual deviance: 14.038 on 18 degrees of freedom
AIC: 36.652
Number of Fisher Scoring iterations: 5
Komponen tahun di sini tidak signifikan. Apa yang akhirnya bisa saya simpulkan? Juga, dalam semua analisis ini, angka 2500 (jumlah populasi penyebut) belum digunakan. Apakah angka itu tidak membuat perbedaan? Bisakah kita menggunakan regresi linier sederhana (Gaussian) menggunakan kejadian (number_affected / 2500) dibandingkan tahun?
drop1(fit, test="LRT")
untuk melakukan tes rasio kemungkinan, daripada melakukan uji- z asimptotik pada statistik Poisson. (Melakukannya memberi Anda nilai- p 0,107, jadi masih tidak signifikan secara statistik.) Anda tidak perlu memasukkan jumlah populasi dalam regresi jika itu sama untuk setiap tahun. Maka itu hanya memainkan peran faktor penskalaan. Tapi Anda harus memasukkannya (dengan nilai-nilai populasi per tahun), sebagai populasi berisiko mungkin tidak bervariasi selama dua puluh tahun. Tambahkan sajaoffset=log(pop_at_risk)
keglm
panggilan.Jawaban:
Anda dapat menggunakan uji Mann-Kendall non-parametrik . Untuk data sampel ini,
cases
dan hipotesis nol satu sisi bahwa tidak ada tren yang meningkat, Anda dapat menerapkannya sebagai berikutr.Dan tolak pada level 5% untuk tren yang meningkat.
sumber
Anda dapat menyesuaikan model regresi yang sangat sederhana yang hanya terdiri dari komponen intersep dan waktu dan uji "signifikansi" komponen waktu. Misalnya, Anda dapat memodelkan Poisson mana adalah jumlah kejadian pada tahun dan dan memeriksa apakah .Yt∼ (λt) Yt t log(λt)=α+βt β>0
sumber
Cukup periksa apakah jumlah kasus baru Anda (yaitu,
number_affected
) berkorelasi signifikan dengan waktu (yaitu,year
). Karena setiap ketergantungan linear yang mungkin dari laju kejadian setidaknya terdistorsi ke diskresi pengamatan, Anda ingin menggunakan koefisien korelasi berbasis peringkat, misalnya, Kendall's τ atau Spearman's ρ.sumber