Garis Referensi Plot QQ bukan 45 °

10

Saya sedang merencanakan (standar) mengembalikan data dengan qqplot()MATLAB terhadap kuantil teoritis dari distribusi normal. Namun, garis dalam QQ-Plot tidak memiliki sudut 45 ° tetapi diputar sedikit.

Mungkin saya salah paham konsep plot QQ tapi bukankah seharusnya garis 45 °?

Saya menempatkan plot untuk menggambarkan masalah ini.

QQ Plot data pengembalian terstandarisasi

mscnvrsy
sumber
Data pengembalian terstandardisasi dikenal sebagai non-normal, jadi mengapa ia berada pada garis 45 derajat? Pengembalian lebih berat dari biasanya dan itu yang ditampilkan data Anda juga.
Glen_b -Reinstate Monica
Saya sadar akan ketidaknormalan dan bahwa poinnya tidak boleh terletak pada garis itu sendiri. Saya agak bertanya-tanya mengapa garis tidak 45 °.
mscnvrsy
Oh maaf, itu tidak jelas. Saya telah mengirim jawaban.
Glen_b -Reinstate Monica

Jawaban:

18

Haruskah garis 45 derajat? Tergantung!

Plot QQ adalah kurva parametrik yang didefinisikan oleh:

x=F-1(hal)y=G-1(hal)

untuk hal[0,1]. DimanaF-1 dan G-1 adalah fungsi CDF terbalik.

Jika F=G kemudian x(hal)=y(hal) dan itu akan berada di garis 45 derajat.

Kasus lain ...

  • Membiarkan Φ-1(hal) menjadi CDF terbalik normal standar.
  • Membiarkan F-1(hal)=Φ-1(hal)
  • Membiarkan G-1(hal)=σΦ-1(hal)+μ

Itu adalah G adalah CDF terbalik untuk variabel acak yang terdistribusi normal dengan rata-rata μ dan standar deviasi σ sementara Fadalah CDF terbalik untuk variabel normal standar (yaitu rata-rata 0, standar deviasi 1). Lalu kita melihat:

y(hal)=σΦ-1(hal)+μ=σx(hal)+μ

Artinya, alurnya adalah garis y=σx+μ

Apa yang terjadi dalam kasusmu?

Dari dokumentasi Matlab untukqqplot

Ditumpangkan pada plot adalah garis yang menghubungkan kuartil pertama dan ketiga dari masing-masing distribusi (ini adalah kesesuaian linear yang kuat dari statistik urutan kedua sampel). Baris ini diekstrapolasi ke ujung sampel untuk membantu mengevaluasi linearitas data.

Jadi, bahkan jika Anda membakukan data Anda, plot garis merah MATLAB tidak akan menjadi garis 45 derajat jika kuartil 1 dan 3 tidak cocok dengan distribusi normal.

Matthew Gunn
sumber
Terima kasih! Saya pikir garis merah dibangun sehingga Anda dapat melihat penyimpangan dari kuantil normal standar? Ketika saya menggunakan data terstandarisasi, barisnya harus y = x, bukan?
mscnvrsy
@ mscnvrsy Garis merah yang saya pikir di MATLAB dibangun untuk menunjukkan apa yang seharusnya jika data Anda mengikuti distribusi normal.
Matthew Gunn
Apakah ada cara untuk mendapatkan garis 45 ° sebagai garis referensi? Saya pikir ini bisa dicapai dengan standardisasi.
mscnvrsy
@mscnvrsy hmmm .... Saya bingung sekarang dari mana garis merah MATLAB di QQPlot berasal dari: P Gimme a sec ... Saya sedang memeriksa kode sumber ...
Matthew Gunn
Bagi saya itu lebih mirip OLS. Namun sayangnya seseorang tidak dapat mengatur parameter yang relevan di qqplot().
mscnvrsy
2

Cara menentukan garis bervariasi dari satu paket ke paket lainnya, tetapi satu cara yang umum adalah dengan menggabungkan titik kuartil yang lebih rendah (x,y)=(-0,6745,Q1) ke titik kuartil atas (0,6745,Q3).

Melihat bantuan Matlab untuk qqplot, sebenarnya itulah yang dikatakan Matlab.

Distribusi sampel memuncak dan berekor berat dengan cara yang membuat kuartilnya lebih berdekatan daripada untuk normal dengan standar deviasi yang sama, yang membuat kemiringan lebih dekat ke 0,7 daripada ke 1.

Glen_b -Reinstate Monica
sumber