Saya mencoba untuk mengukur tingkat inflasi (mis. Seberapa baik poin data yang diamati sesuai dengan yang diharapkan). Salah satu caranya adalah dengan melihat plot QQ. Tetapi saya ingin menghitung beberapa indikator numerik untuk inflasi - berarti seberapa baik yang diamati sesuai dengan distribusi seragam teoretis.
Contoh data:
# random uniform distribution
pvalue <- runif(100, min=0, max=1)
# with inflation expected i.e. not uniform distribution
pvalue1 <- rnorm(100, mean = 0.5, sd=0.1)
probability
distributions
qq-plot
belajar
sumber
sumber
Jawaban:
Ada berbagai cara kami dapat menguji penyimpangan dari distribusi apa pun (seragam dalam kasus Anda):
(1) Tes non-parametrik:
Anda dapat menggunakan Tes Kolmogorov-Smirnov untuk melihat distribusi nilai yang diamati sesuai dengan yang diharapkan.
R memiliki
ks.test
fungsi yang dapat melakukan uji Kolmogorov-Smirnov.(2) Uji Good-of-Fit Chi-square
Dalam hal ini kami mengategorikan data. Kami mencatat frekuensi yang diamati dan diharapkan di setiap sel atau kategori. Untuk kasus kontinu, data mungkin dikategorikan dengan membuat interval buatan (nampan).
(3) Lambda
Jika Anda melakukan studi asosiasi genom-luas (GWAS) Anda mungkin ingin menghitung faktor inflasi genom , juga dikenal sebagai lambda (λ) (juga lihat ). Statistik ini populer di komunitas genetika statistik. Menurut definisi, λ didefinisikan sebagai median dari statistik uji chi-squared yang dihasilkan dibagi dengan median yang diharapkan dari distribusi chi-squared. Median distribusi chi-kuadrat dengan satu derajat kebebasan adalah 0,4549364. Nilai λ dapat dihitung dari skor-z, statistik chi-kuadrat, atau nilai-p, tergantung pada output yang Anda miliki dari analisis asosiasi. Kadang-kadang proporsi nilai-p dari ekor atas dibuang.
Untuk nilai-p Anda dapat melakukan ini dengan:
Jika hasil analisis data Anda mengikuti distribusi chi-kuadrat normal (tidak ada inflasi), nilai λ yang diharapkan adalah 1. Jika nilai λ lebih besar dari 1, maka ini mungkin menjadi bukti untuk beberapa bias sistematis yang perlu diperbaiki dalam analisis Anda .
Lambda juga dapat diperkirakan menggunakan analisis Regresi.
Metode lain untuk menghitung lambda adalah menggunakan 'KS' (mengoptimalkan fit distribusi chi2.1df dengan menggunakan uji Kolmogorov-Smirnov).
sumber