Saya mencoba memahami bagaimana cara terbaik saya memodelkan variabel di mana seiring waktu saya mendapatkan prediktor yang semakin rinci. Misalnya, pertimbangkan untuk memodelkan tingkat pemulihan pada pinjaman yang gagal bayar. Misalkan kita memiliki dataset dengan data 20 tahun, dan dalam 15 tahun pertama kita hanya tahu apakah pinjaman tersebut dijamin atau tidak, tetapi tidak ada karakteristik karateristik itu. Namun, selama lima tahun terakhir, kami dapat membagi agunan ke dalam berbagai kategori yang diharapkan menjadi prediktor yang baik untuk tingkat pemulihan.
Dengan pengaturan ini, saya ingin mencocokkan suatu model dengan data, menentukan ukuran-ukuran seperti signifikansi statistik dari para prediktor, dan kemudian meramalkannya dengan model tersebut.
Kerangka kerja data apa yang tidak cocok dengan hal ini? Apakah ada pertimbangan khusus yang terkait dengan fakta bahwa variabel penjelas yang lebih rinci hanya tersedia setelah titik waktu tertentu, yang bertentangan dengan tersebar di seluruh sampel historis?
sumber