Membandingkan koefisien regresi dari model yang sama di set data yang berbeda

12

Saya mengevaluasi dua (2) refrigeran (gas) yang digunakan dalam sistem pendingin yang sama. Saya memiliki data suhu hisap jenuh ( ), suhu kondensasi ( ), dan arus listrik ( ) untuk evaluasi. Ada dua (2) set data; Refrigeran pertama ( ) & refrigeran kedua ( ). Saya menggunakan model polinomial orde 3 linier, multivarian ( & ), untuk analisis regresi. Saya ingin menentukan berapa banyak / lebih ampere (atau, beberapa metrik yang sama sebagai perbandingan kinerja) rata-rata, sebagai persentase, sedang diambil oleh refrigeran kedua.D Y R 1 R 2 S DSDYR1R2SD

Pikiran pertama saya adalah:

  1. Tentukan model yang akan digunakan:Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3
  2. Turunkan koefisien ( ) dari data dasar ( ).R 1biR1
  3. Dengan menggunakan koefisien tersebut, untuk setiap & dalam data , hitung setiap penarikan amp yang diharapkan ( ) lalu rata-rata.D R 2 YSDR2Y^
  4. Bandingkan rata-rata dengan undian amp rata-rata aktual ( ) dari data . Y2R2Y^Y2R2
  5. percent (%) change=(Y2Y^)/Y^

Namun, karena refrigeran ke-2 memiliki sifat termal yang sedikit berbeda & perubahan kecil dilakukan pada sistem pendingin (penyesuaian TXV & superheat) Saya tidak percaya 'metode perbandingan dasar' ini akurat.

Pikiran saya berikutnya adalah melakukan dua (2) analisis regresi terpisah:

Y1=a0+a1S1+a2D1+a3S1D1+a4S12+a5D12+a6S12D1+a7D12S1+a8D13+a9S13Y2=b0+b1S2+b2D2+b3S2D2+b4S22+b5D22+b6S22D2+b7D22S2+b8D23+b9S23

dan kemudian, untuk temp suction jenuh ( ), bandingkan koefisien ( vs ) seperti: a 1 b 1 % perubahan = b 1 - a 1Sa1b1

% change=b1a1a1

Namun, sekali lagi, koefisien ini harus ditimbang secara berbeda. Oleh karena itu, hasilnya akan miring.

Saya percaya saya bisa menggunakan z-test untuk menentukan seberapa berbobotnya koefisien, tetapi saya tidak yakin saya sepenuhnya memahami arti dari output: . Tapi, itu masih tidak memberi saya metrik kinerja, yang merupakan tujuan keseluruhan.z=(a1b1)/SEa12+SEb12)

gth826a
sumber
1
1. Model polinomial adalah model linear, karena linear dalam koefisien. 2. Saya mencoba memahami pertanyaan Anda. Jika sistem pendingin telah dimodifikasi antara waktu R1 dan R2 digunakan, maka mereka benar-benar bukan 'sistem pendingin yang sama' (baris 1), bukan? 3. Mengapa dalam pendekatan kedua Anda, Anda mulai membandingkan koefisien S? 4. Sudahkah Anda mempertimbangkan untuk memasukkan 'refrigeran' kovariat dengan level R1 dan R2 ke dalam polinomial fit (mungkin dengan interaksi)? Koefisiennya mungkin menjawab pertanyaan.
qoheleth
@ qoheleth 1. Tidak yakin saya mengikuti alur pemikiran Anda ... Koefisiennya selalu linier - ini adalah angka. Kapan koefisiennya tidak linier? 2. Benar, sistem pendingin telah sedikit berubah, tetapi hanya untuk memastikan suhu keluaran yang sama untuk kedua pendingin - "apel ke apel". 3. 'S' adalah satu-satunya variabel yang menarik untuk perbandingan spesifik ini. 4. Saya telah membaca tentang metode variabel kovariat / interaksi, tetapi gagal memahami makna koefisien menggunakan metode seperti itu. Bisakah Anda menguraikan interpretasi output? Terima kasih.
gth826a
1. dari sudut pandang statistik, linearitas dalam hal-hal yang Anda perkirakan adalah yang diperhitungkan, sehingga model polinomial adalah linier. Contoh dari model non-linear adalah fungsi mitscherlich y = alpha (1-exp (beta-lambda * X)), di mana alpha / beta / lambda adalah apa yang kami perkirakan. 3. Apa yang sebenarnya ingin Anda uji? apakah itu koefisien S? atau Y? Jika S, mengapa percobaan pertama Anda sebagai perbandingan di \ hat {Y}?
qoheleth
Y-hat akan menjadi: S & D yang sebenarnya dari kumpulan data ke-2 yang digunakan dengan koefisien yang berasal dari kumpulan data ke-1. Metode ini umum untuk analisis energi 'Performance Contracting' ketika membandingkan konsumsi energi peralatan sebelumnya dengan konsumsi energi setelah retrofit / remodel / renovasi / dll. Persamaannya adalah: konsumsi energi = y-hat = beban dasar + energi / derajat-hari * derajat-hari ... di mana energi / derajat-hari adalah koefisien yang diperoleh dari analisis regresi baseline, dan derajat-hari adalah dari pasca renovasi . "Apa yang akan Anda konsumsi" jika Anda tidak melakukan skenario proyek ini ...
gth826a
1
Jadi sepertinya pada akhirnya Anda ingin membandingkan Y. Saya akan mengatakan lupakan tentang menghitung% perubahan dalam koefisien, di hadapan syarat urutan yang lebih tinggi (S ^ 2, S ^ 3 dll.), Koefisiennya tidak seperti yang Anda pikirkan mereka. Fokus pada Y. Pertanyaan yang masih belum jelas bagi saya adalah, apakah Anda mengatakan S & D dalam R2 memiliki arti yang berbeda dengan S & D di R1? Jika tidak, maka Anda cukup memasukkan satu model ke dataset gabungan, dengan kovariat ekstra (variabel X) yang disebut refrigeran (r1 atau r2), dan lihat koefisiennya untuk membuat kesimpulan, dengan asumsi model Anda memadai.
qoheleth

Jawaban:

2

PV=nRTY=aDbScln(Y)=ln(a)+bln(D)+cln(S)Yl=al+bDl+cSll

Untuk memverifikasi jenis model apa yang akan digunakan coba satu dan periksa apakah residu adalah homoscedastic. Jika tidak maka Anda memiliki model yang bias , maka lakukan hal lain seperti memodelkan logaritma, seperti di atas, satu atau lebih kebalikan dari data x atau y, akar kuadrat, kuadrat, eksponensial dan sebagainya hingga residu menjadi homoseksual. Jika model tidak dapat menghasilkan residu homoscedastik maka gunakan regresi linier berganda, dengan sensor jika diperlukan.

Bagaimana biasanya data didistribusikan pada sumbu y tidak diperlukan, tetapi, pencilan dapat dan sering melakukan distorsi hasil parameter regresi secara nyata. Jika homoseksualitas tidak dapat ditemukan maka kuadrat terkecil tidak boleh digunakan dan beberapa jenis regresi lainnya perlu dilakukan, misalnya regresi tertimbang, regresi Theil, kuadrat terkecil dalam x, Deming regression dan sebagainya. Juga, kesalahan tidak harus dihubungkan secara seri.

z=(a1b1)/SEa12+SEb12)x,yH=+A2+O2zN

C2=A2+B22ABcos(θ),θ=(A,B)σTρA,BσT2=σA2+σB22σAσBρA,B

Carl
sumber
"Untuk memverifikasi jenis model apa yang akan digunakan coba satu dan periksa apakah residu adalah homoscedastic", ya tentu ... kecuali Anda tidak membuat asumsi ini sama sekali, dan bahkan jika itu valid - itu sama sekali tidak memastikan bahwa Anda memiliki model "baik".
Repmat
Jika seseorang menggunakan OLS dan residunya heteroscedastic, maka pastinya ia memiliki model yang bias. Homoscedasticity adalah persyaratan OLS, ditunjukkan di sini . Untuk memiliki model yang baik memerlukan kondisi lain, seperti menghindari bias variabel yang dihilangkan , tetapi memiliki kesalahan seri tidak berkorelasi , dan linieritas model versus variabel dependen.
Carl
Anda dapat memiliki model (perkiraan) yang tidak bias dan / atau konsisten di mana residunya heteroskedlastik. Itu hanya akan menyiratkan bahwa prosedur inferensi yang biasa tidak berfungsi
Repmat
Heteroscedasticity meratakan lereng, bahkan jika pencilan mengoreksi ini, hukumannya akan menjadi interval kepercayaan yang besar dan model yang buruk. Tidak akan menggunakan model seperti itu, tetapi, ya, orang dapat membuat model yang buruk. Literatur medis penuh dengan mereka.
Carl
Bagian pertama dari komentar Anda benar-benar salah. Saya bahkan tidak yakin apa artinya.
Repmat