Bagaimana cara mengubah koefisien terstandarisasi menjadi koefisien tidak standar?

11

Tujuan saya adalah menggunakan koefisien yang diperoleh dari penelitian sebelumnya pada subjek untuk memprediksi hasil aktual yang diberikan satu set variabel independen. Namun, makalah penelitian hanya mencantumkan koefisien Beta dan nilai-t. Saya ingin tahu apakah mungkin untuk mengubah koefisien terstandarisasi menjadi yang tidak standar.

Apakah akan berguna untuk mengubah variabel independen saya yang tidak standar ke yang standar untuk menghitung nilai prediksi? Bagaimana saya akan kembali ke nilai prediksi yang tidak standar (jika itu mungkin ..)

Menambahkan baris Contoh dari kertas:

Jumlah rute bus (buslines) | 0,275 (Beta) | 5,70 *** (nilai-t)

Saya juga diberikan ini mengenai variabel independen:

Jumlah rute bus (buslines) | 12.56 (rata-rata) | 9.02 (Std) | 1 (min) | 53 (maks)


sumber
Bagaimana koefisien-koefisien telah distandarisasi? Secara umum β memiliki unit yang merupakan unit Y dibagi dengan unit X , apa unit mereka di koran?
gui11aume
1
Saya tidak yakin saya mengerti pertanyaan Anda. Berikut ini adalah baris sampel dari variabel independen setelah analisis regresi dari makalah. Karakteristik pasokan transit: Jumlah rute bus (buslines) | 0,275 (Beta) | 5,70 *** (nilai-t)
Koefisien itu sendiri tidak terstandarisasi seperti yang disebutkan oleh gui11aume. Tetapi t statistik itu koefisien estimasi dibagi dengan estimasi standar deviasi. Dengan t dan derajat kebebasan Anda dapat menghitung nilai p dan estimasi standar deviasi karena Beta = nilai-t x estimasi standar deviasi. Tapi saya tidak yakin apakah ini yang Anda cari atau tidak. Perkiraan beta tidak terstandarisasi. Statistik t adalah bentuk standar dari estimasi beat. Jadi Anda sudah memiliki koefisien standar.
Michael R. Chernick

Jawaban:

14

Kedengarannya seperti kertas menggunakan model regresi berganda dalam bentuk

Y=β0+iβiξi+ε

di mana adalah versi standar dari variabel independen; yaitu ,ξi

ξi=ximisi

dengan mean (seperti 12.56 pada contoh) dan deviasi standar (seperti 9.02 pada contoh) dari nilai variabel ('buslines' dalam contoh). adalah intersep (jika ada). Memasukkan ungkapan ini ke dalam model pas , dengan "betas" -nya ditulis sebagai (0,275 dalam contoh), dan melakukan beberapa aljabar memberikan perkiraans i i th x i β 0 ^ β imisiithxiβ0βi^

Y^=β0^+iβi^ximisi=(β0^(iβimi^si))+i(βi^si)xi.

Ini menunjukkan bahwa koefisien dalam model (terlepas dari suku konstan) diperoleh dengan membagi beta dengan standar deviasi variabel independen dan intersep disesuaikan dengan mengurangi kombinasi linear yang sesuai dari beta.xi

Ini memberi Anda dua cara untuk memprediksi nilai baru dari vektor dari nilai independen:(x1,,xp)

  1. misi (ξ1,,ξp)=((x1m1)/s1,,(xpmp)/sp)

  2. Masukkan ke dalam rumus yang setara secara aljabar yang diperoleh di atas.(x1,,xp)

Jika kertas menggunakan Generalized Linear Model , Anda mungkin perlu mengikuti perhitungan ini dengan menerapkan fungsi "tautan" terbalik ke . Misalnya, dengan regresi logistik akan diperlukan untuk menerapkan fungsi logistik untuk mendapatkan probabilitas yang diprediksi ( adalah peluang log yang diprediksi). 1/(1+exp( - Y )) YY^1/(1+exp(Y^))Y^

whuber
sumber
Sempurna, terima kasih! Mendapat bantuan dari seorang kolega. Satu pertanyaan lagi: Nilai baru saya (Y-hat) sangat rendah. Penulis menggunakan variabel dependen yang ditransformasikan secara logaritma dalam regresi. Apakah itu berarti saya harus mengeluarkan (Y-hat) untuk memperluas kembali ke unit pengukuran yang tidak diubah.
Juga, tidak ada intersep Y yang disertakan dalam makalah, dan pengujian metode exp (Y-hat) tampaknya menunjukkan bahwa harus ada nilai untuk intersep Y yang mewakili beberapa varian yang tidak dijelaskan oleh model, dalam rangka untuk meningkatkan hasil yang diperkirakan ke tingkat yang wajar.
Maka bukan koefisien yang distandardisasi. Itu adalah variabel.
Michael R. Chernick
1
exp(y^)
Jika Anda ingin melakukan apa yang diminta judulnya, lihat di sini: www3.nd.edu/~rwilliam/stats1/x92.pdf jika y juga standar. Lihat juga stats.stackexchange.com/questions/235057/…
Chris
1

B=p×sysx
  • x
  • y
  • s
  • p
  • B
Tombak
sumber
2
Saya tidak yakin apa itu koefisien jalur. Sepertinya mungkin B adalah koefisien regresi yang tidak akan berdimensi. Itu akan berada dalam satuan y per 1 x unit. Namun p = B sx / sy di mana sx adalah estimasi standar deviasi dalam x dibagi dengan estimasi standar deviasi dalam y dan p tidak berdimensi. Ini mewakili perkiraan korelasi antara x dan y. Tombak jika ini yang Anda maksud, harap lakukan perubahan dengan mengedit posting Anda.
Michael R. Chernick