Cara menggambarkan atau memvisualisasikan model regresi linier berganda

21

Saya mencoba menyesuaikan model regresi linier berganda dengan data saya dengan beberapa parameter input, katakanlah 3.

(saya)F(x)=SEBUAHx1+Bx2+Cx3+datau(ii)F(x)=(SEBUAH B C)T(x1 x2 x3)+d

Bagaimana cara saya menjelaskan dan memvisualisasikan model ini? Saya dapat memikirkan opsi-opsi berikut:

  1. Sebutkan persamaan regresi seperti yang dijelaskan dalam (koefisien, konstan) bersama dengan standar deviasi dan kemudian plot kesalahan residual untuk menunjukkan keakuratan model ini. (saya)

  2. Plot berpasangan dari variabel independen dan dependen, seperti ini:

    masukkan deskripsi gambar di sini

  3. Setelah koefisien diketahui, dapatkah titik data yang digunakan untuk mendapatkan persamaan dikondensasikan ke nilai sebenarnya. Yaitu, data pelatihan memiliki nilai baru, dalam bentuk x bukannya x 1 , x 2 , x 3 , ... di mana setiap variabel independen dikalikan dengan koefisien masing-masing. Maka versi yang disederhanakan ini dapat secara visual ditampilkan sebagai regresi sederhana seperti ini:(saya)xx1x2x3...

    masukkan deskripsi gambar di sini

Saya bingung dalam hal ini meskipun melalui materi yang sesuai tentang topik ini. Dapatkah seseorang tolong jelaskan kepada saya bagaimana "menjelaskan" model regresi linier berganda dan bagaimana menunjukkannya secara visual.

keris
sumber
2
Apa tujuan dari dokumen Anda dan siapa audiensnya? Saya akan mulai dari mendapatkan artikel serupa dan mencari beberapa contoh tentang bagaimana mereka dilakukan di bidang Anda sendiri. Saya lebih akrab dengan literatur biomedis dan sebagian besar waktu, kami hanya menggunakan tabel. Ilustrasi lebih sering terlihat ketika penulis mencoba menjelaskan suatu interaksi.
Penguin_Knight
@Enguin_Knight, ini dalam domain ilmu komputer, namun saya pikir ini adalah generik daripada terbatas pada domain tertentu. Harap perbaiki saya jika saya salah.
kris
Hmm ... meskipun pertanyaan. Saya akan mengatakan satu-satunya bagian generik, bagi saya, adalah tidak menunjukkan lebih dari yang seharusnya, dan pastikan komponen yang akan ditekankan benar-benar ditekankan. Bahkan hanya di bidang saya, saya telah melihat ketiga opsi. 1) mentabulasi hasil adalah yang paling umum, diikuti oleh 3), tetapi sebagian besar bentuk merencanakan hasil yang diprediksi, dan kemudian 2). Tetapi untuk 2), saya akan menggunakan apa yang disarankan @gregory_britten: gunakan X yang disesuaikan dan bukan masing-masing individu X.
Penguin_Knight
use plot distribusi .... lihat distribusi nilai yang dipasang yang dihasilkan dari model dan bandingkan dengan distribusi nilai aktual.
owais qureshi
Saya tahu ini dari tahun lalu, tetapi jika Anda mengunjungi lagi di sini, bisakah Anda memposting data? Maka orang akan memiliki sesuatu untuk dikerjakan untuk menunjukkan kemungkinan yang berbeda.
gung - Reinstate Monica

Jawaban:

21

XΔY/Δsd(X). Dengan cara ini, jarak koefisien dari nol peringkat 'kepentingan' relatif mereka dan CI mereka memberikan ketepatan. Saya pikir itu meringkas hubungan dengan lebih baik dan menawarkan lebih banyak informasi daripada koefisien dan nilai p pada skala numerik mereka yang alami dan sering berbeda. Contohnya di bawah ini:

masukkan deskripsi gambar di sini

YXsayaYX1+X2+X3XsayaYavPlots()carlm

masukkan deskripsi gambar di sini

gregory_britten
sumber
Terima kasih @gregory_britten untuk informasi ini. Masalah yang saya miliki memiliki 8 variabel independen. Apakah Anda pikir 'plot variabel tambahan' akan masuk akal untuk sejumlah besar variabel input?
kris
Sejalan dengan ide plot pertama, jika bekerja di R, saya sarankan melihat paket RMS yang membuat semua ini mudah. Yang menyenangkan adalah bahwa seseorang dapat meminta perubahan langkah yang berarti dalam kovarian, sehingga menghindari kebutuhan untuk melakukan standarisasi.
Thomas Speidel
@ suzanne Ya tentu saja. Plot variabel yang ditambahkan memberi Anda perspektif dua dimensi untuk sejumlah variabel. Ini mungkin terutama mengungkapkan dalam dimensi yang lebih tinggi. Orang sering menemukan pola pengungkapan dalam residu yang sama sekali tidak jelas dalam Y. yang diamati
gregory_britten
Saya tidak begitu mengerti notasi X1 | X2 & X3 dalam konteks ini. Saya tahu bagaimana ini digunakan dalam hal probabilitas, tapi saya tidak begitu mengerti apa yang dikatakan di sini
Casebash
1
@Casebash Ini adalah regresi parsial pada X1, mengingat X2 dan X3 ada dalam model
gregory_britten
1

Karena semuanya harus dilakukan dengan menjelaskan kontributor untuk sirosis, sudahkah Anda mencoba melakukan bagan gelembung / lingkaran dan menggunakan warna untuk menunjukkan berbagai regresi dan jari-jari lingkaran untuk menunjukkan dampak relatif terhadap sirosis?

Saya merujuk di sini untuk jenis bagan Google yang terlihat seperti ini:masukkan deskripsi gambar di sini

Dan pada catatan yang tidak terkait, kecuali saya salah membaca plot Anda, saya pikir Anda memiliki beberapa regresi yang berlebihan di sana. Anggur sudah menjadi minuman keras sehingga jika keduanya merupakan regressor yang terpisah, tidak masuk akal untuk mempertahankan keduanya, jika tujuan Anda adalah untuk menjelaskan kejadian sirosis.

rocinante
sumber