Interpretasi plot QQ

11

Pertimbangkan kode dan hasil berikut:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

masukkan deskripsi gambar di sini

Tampaknya plot QQ untuk log-normal hampir sama dengan plot QQ untuk weibull. Bagaimana kita membedakannya? Juga jika titik-titik tersebut berada di dalam wilayah yang ditentukan oleh dua garis hitam luar, apakah itu menunjukkan bahwa mereka mengikuti distribusi yang ditentukan?

proton
sumber
Saya percaya Anda menggunakan paket mobil , bukan? Jika demikian, Anda harus memasukkan pernyataan library(car)dalam kode Anda untuk memudahkan orang untuk mengikuti. Secara umum, Anda mungkin juga ingin mengatur seed (mis., set.seed(1)) Untuk membuat contoh dapat direproduksi, sehingga siapa pun bisa mendapatkan poin data yang sama persis dengan yang Anda dapatkan, meskipun mungkin tidak sepenting di sini.
gung - Reinstate Monica
2
Ini tidak akan berjalan di komputer saya seperti yang tertulis. Sebagai contoh, qqPlot dari paket mobil menginginkan norma untuk normal dan lnorm untuk log-normal. Apa yang saya lewatkan?
Tom
2
@ Tom, saya keliru tentang paket. Jelas, ini adalah paket qualityTools . Apalagi contohnya diambil dari sini .
gung - Reinstate Monica
Alternatif yang menarik adalah grafik Cullen dan Frey, lihat stats.stackexchange.com/questions/243973/… untuk contoh
kjetil b halvorsen

Jawaban:

12

Ada beberapa hal yang bisa dikatakan di sini:

  1. bentuk CDF untuk log-normal cukup mirip dengan bentuk CDF Weibull untuk membuat mereka lebih sulit dibedakan daripada tingkat kesamaan antara Weibull dan yang lainnya.
  2. garis hitam luar membentuk pita kepercayaan diri . Penggunaan pita kepercayaan dalam inferensi sama dengan bentuk standar lainnya dari inferensi statistik Frequentist. Yaitu, ketika nilai berada dalam pita, kita tidak bisa menolak hipotesis nol bahwa distribusi yang diajukan adalah yang benar. Ini tidak sama dengan mengatakan bahwa kita tahu distribusi yang diajukan adalah yang benar. (Perhatikan bahwa ini adalah contoh yang bagus dari apa yang saya bahas dalam jawaban lain di sini mengenai situasi di mana perspektif Nelayan tentang pengujian hipotesis lebih disukai daripada Neyman-Pearson.)
  3. N
gung - Pasang kembali Monica
sumber
Apakah ada cara untuk memeriksa distribusi untuk ukuran sampel kecil?
proton
sebenarnya nampaknya poin-poinnya terletak pada pita kepercayaan untuk semua distribusi. Jadi kita tidak bisa membedakan distro?
proton
1
n=205%
2
+1 pada ukuran sampel kecil. Menggunakan 300 sampel akan membantu membedakan banyak hal. Proton: Tidak, Anda tidak dapat benar-benar membedakan distribusi dengan sampel kecil. Bagaimana mungkin? Ini seperti mencoba mengidentifikasi wajah dengan 20 piksel.
Wayne
3

Tampaknya plot QQ untuk log-normal hampir sama dengan plot QQ untuk weibull.

Iya.

Bagaimana kita membedakannya?

Pada ukuran sampel itu, Anda kemungkinan tidak bisa.

Juga jika titik-titik tersebut berada di dalam wilayah yang ditentukan oleh dua garis hitam luar, apakah itu menunjukkan bahwa mereka mengikuti distribusi yang ditentukan?

Tidak. Ini hanya menunjukkan bahwa Anda tidak dapat memberi tahu distribusi data berbeda dari distribusi itu. Kurangnya bukti perbedaan, bukan bukti kurangnya perbedaan.

Anda dapat hampir yakin bahwa data tersebut berasal dari distribusi yang bukan dari yang telah Anda pertimbangkan (mengapa justru dari salah satu dari itu?).

Glen_b -Reinstate Monica
sumber
Seperti ungkapan: "Tidak ada bukti perbedaan, bukan bukti kurangnya perbedaan."
jlandercy