Model yang mendasari PLS adalah bahwa matriks X dan n vektor y terkait dengan X = T P ′ + E , y = T q ′ + f , di mana T adalah matriks laten n × k , dan E , f adalah istilah kebisingan (misalnya X , y terpusat).
PLS menghasilkan perkiraan , dan 'jalan pintas' vektor koefisien regresi, ß sehingga y ~ X β . Saya ingin mencari distribusi β bawah beberapa asumsi penyederhanaan, yang mungkin harus meliputi berikut ini:
- Modelnya benar, yaitu untuk T , P , q yang tidak diketahui ;
- Jumlah faktor laten, , diketahui, dan digunakan dalam algoritma PLS;
- Istilah kesalahan aktual adalah nol rata-rata normal dengan varian yang diketahui;
Pertanyaan ini agak tidak terdefinisi karena ada sejumlah varian dari algoritma 'the' PLS, tetapi saya akan menerima hasil untuk salah satu dari mereka. Saya juga akan menerima petunjuk tentang cara untuk memperkirakan distribusi β melalui misalnya bootstrap, tapi mungkin itu adalah pertanyaan terpisah.