Saat ini saya sedang berupaya untuk mengubah dua nilai tes fosfor yang berbeda menjadi satu sama lain.
Latar Belakang
Ada banyak (ekstraksi) metode untuk mengukur fosfor tersedia tanaman di tanah. Negara yang berbeda menerapkan metode yang berbeda, maka untuk membandingkan kesuburan P di seluruh negara, perlu untuk menghitung nilai uji-P x berdasarkan nilai uji-P y dan sebaliknya. Oleh karena itu respons dan kovariat dapat dipertukarkan.
Jumlah P dalam ekstraktan 1 = P_CAL dalam [mg / 100g tanah]
Jumlah P dalam ekstraktan 2 = P_DL dalam [mg / 100g tanah]
Untuk membentuk "persamaan transformasi" seperti itu, kandungan P dari 136 sampel tanah dianalisis dengan ekstrak CAL dan DL. Parameter tambahan seperti pH tanah, total karbon organik, nitrogen total, lempung dan karbonat juga diukur. Tujuannya adalah untuk mendapatkan model regresi sederhana. Pada langkah kedua juga beberapa model.
Untuk memberikan gambaran umum dari data, saya perlihatkan kepada Anda dua sebar plot dengan garis regresi linear sederhana (OLS).
Pertanyaan:
Untuk pemahaman saya, regresi deming cocok jika respone (y) dan variabel penjelas (x) keduanya memiliki (mengukur) kesalahan dan dapat dipertukarkan. Regresi Deming mengasumsikan bahwa rasio varian diketahui. Karena saya tidak memiliki rincian tentang keakuratan pengukuran ekstraksi P, apakah ada cara lain untuk menentukan rasio varians? Perbedaan mana yang dimaksudkan di sini? Saya menganggap itu TIDAK dihitung var(DL_P)/var(CAL_P)
?
T1: Bagaimana cara menentukan varians rasio untuk deming regression?
Kasus khusus dari regresi yang menurun adalah regresi ortogonal. Ini mengasumsikan varians ratio = 1.
T2: Apakah ada cara untuk mendiagnosis jika asumsi δ = 1 "kira-kira" benar atau jika asumsi (salah) mengandung kesalahan prediksi yang tinggi?
Jika saya berasumsi δ = 1 regresi ortogonal menghasilkan keluaran (bulat) berikut
library(MethComp)
deming <- Deming(y=P_CAL, x=P_DL, vr=1)
Intercept: 0,75; Kemiringan: 0,71; sigma P_DL: 3.17; sigma P_CAL: 3.17
Memplot garis regresi deming dalam plot di atas, menunjukkan bahwa regresi deming sangat dekat dengan a) regresi CAL-P = f (DL-P), tetapi sangat berbeda dari b) DL-P = f (CAL-P) persamaan.
Q3: apakah benar, bahwa dalam regresi ortogonal CAL-P = f (DL-P) dan DL-P = f (CAL-P) diekspresikan dengan persamaan yang sama? Jika tidak, bagaimana cara mendapatkan persamaan yang benar untuk keduanya? Apa yang saya lewatkan di sini?
Karena sifat dari kedua solusi ekstraksi, nilai DL-P cenderung sekitar 25% lebih tinggi dari nilai CAL-P, maka CAL-P = f (DL-P) harus memiliki kemiringan yang lebih tinggi daripada DL-P = f (CAL -P). Namun, ini tidak dinyatakan dalam deming regresi ketika hanya ada satu kemiringan. Yang membuat saya dengan Pertanyaan terakhir saya.
T4: Apakah regresi deming merupakan pendekatan yang valid untuk tujuan saya?
sumber
Jawaban:
Untuk mengatasi sebagian kekhawatiran Anda di sini: Deming regression tampaknya menawarkan kecocokan yang buruk di panel B, tetapi ini karena plot tersebut salah. Cara cepat untuk menilai apakah ini telah dilakukan dengan benar adalah dengan melihat nilai X & Y di sepanjang garis regresi Deming. Untuk setiap nilai DL-P di panel A, itu harus memiliki nilai CAL-P yang sesuai yang identik di kedua panel (TIDAK berlaku untuk OLS, dan perbedaan mendasar di antara mereka). Tetapi dalam plot ini, di mana DL-P = 20, CAL-P di panel A adalah ~ 15 dan di panel B ~ 27.
Kesalahan tampaknya adalah bahwa garis regresi Deming telah ditarik dengan hanya menukar istilah CAL-P dan DL-P dalam persamaan. Persamaan untuk panel A adalah:
Penyusunan ulang, ini menyiratkan bahwa persamaan untuk panel B harus:
Dan tidak:
sumber