Saya memiliki dataset studi kasus proyek untuk tipe baru metode penelitian untuk badan-badan Pemerintah untuk mendukung kegiatan pengambilan keputusan. Tugas saya adalah mengembangkan metode estimasi berdasarkan pengalaman masa lalu untuk proyek masa depan untuk keperluan estimasi.
Dataset saya dibatasi hingga 50 kasus. Saya memiliki 30+ (calon) prediktor yang direkam dan satu variabel respons (yaitu jam yang diambil untuk menyelesaikan proyek).
Tidak semua prediktor signifikan, menggunakan teknik seleksi langkah-bijaksana. Saya berharap jumlah variabel prediksi cenderung berada dalam kisaran variabel 5-10. Meskipun saya berjuang untuk mendapatkan set prediktor menggunakan appraoches standar dalam alat-alat seperti PASW (SPSS).
Saya menyadari semua materi berbicara tentang aturan praktis untuk ukuran sampel dan variabel prediktor untuk rasio kasus. Dilema saya adalah butuh waktu hampir 10 tahun untuk mengumpulkan 50 kasus apa adanya, jadi ini akan sebaik mungkin.
Pertanyaan saya adalah apa yang harus saya lakukan untuk mendapatkan hasil maksimal dari set sampel kecil ini?
Apakah ada referensi bagus untuk berurusan dengan set smaple kecil? Perubahan signifikansi p-value? Perubahan pendekatan seleksi bertahap? Penggunaan transformasi seperti pemusatan atau log?
Setiap saran sangat dihargai.
sumber
glmnet
glmnet
glm