Saya menghadapi pertanyaan wawancara untuk pekerjaan di mana pewawancara bertanya kepada saya kira sangat rendah (antara 5 hingga 10%) untuk model elastisitas harga. Bagaimana Anda memecahkan pertanyaan ini?
Saya tidak bisa memikirkan hal lain selain fakta bahwa saya akan melakukan diagnosa regresi untuk melihat apa yang salah atau jika ada metode non linear yang harus diterapkan. Entah bagaimana saya pikir pewawancara tidak puas dengan jawaban saya. Apakah ada hal lain yang dilakukan dalam skenario seperti itu agar sesuai dengan model dan menggunakannya untuk prediksi tingkat produksi meskipun memiliki rendah ?
Sunting : Pada tahap selanjutnya mereka memberi saya data untuk memodelkan masalah selama wawancara dan saya mencoba menambahkan variabel tertinggal, dampak harga pesaing, Dummiesis musiman untuk melihat apakah ada bedanya. pergi ke 17,6 persen dan kinerjanya pada sampel ketidaksepakatan buruk. Secara pribadi saya pikir itu tidak etis untuk menempatkan model seperti itu untuk prediksi di lingkungan hidup karena akan memberikan hasil yang salah dan mengakibatkan kerugian klien (bayangkan menggunakan rekomendasi harga dari model seperti itu pada pendapatan perusahaan Anda!). Apakah ada hal lain yang dilakukan dalam skenario seperti itu yang terlalu jelas sehingga semua orang perlu tahu? Sesuatu yang tidak saya sadari, yang saya tergoda untuk mengatakan 'peluru perak'?
Juga, mari kita bayangkan setelah menambahkan variabel eksogen meningkat lebih jauh 2% lalu apa yang bisa dilakukan dalam skenario ini? Haruskah kita membuang proyek pemodelan atau masih ada harapan untuk mengembangkan model kualitas tingkat produksi yang ditunjukkan oleh kinerja pada sampel penahan?
Sunting2 : Saya telah memposting pertanyaan ini di forum economics.stackexchange.com untuk memahami masalah ini dari perspektif ekonomi
sumber
Jawaban:
Bagaimana jika kita melihat masalah dari perspektif ini. Elastisitas harga adalah hubungan antara permintaan dan harga suatu produk.
Ketika r-square dalam situasi ini rendah, maka kita mungkin bisa menyiratkan bahwa hubungan antara harga dan permintaan untuk produk tertentu itu tidak kuat.
Dari sudut pandang penetapan harga, ini bisa berarti Anda telah menemukan produk yang dapat Anda hargai secara sewenang-wenang tanpa dampak besar pada permintaan ATAU bahwa permintaan cukup tidak menentu meskipun harga berbeda.
Jika Anda melihat barang Veblen , itu adalah contoh di mana elastisitas terbalik. Seiring kenaikan harga, permintaan meningkat.
Jika di sisi lain, r-square rendah, itu bisa berarti kategori produk yang harganya relatif tidak penting ketika datang ke permintaan. Dari atas kepala saya, obat kanker bisa menjadi sesuatu yang bisa melekat pada properti ini. Di mana pentingnya obat melebihi harga yang ia perintahkan dan tidak bisa menunjukkan perubahan dalam permintaan.
Dan sebagai kesimpulan, saya berasumsi maksud pewawancara mungkin untuk menilai jika Anda tahu apa implikasi dari r-square rendah artinya daripada mencari tahu bagaimana membangun model yang lebih baik dengan r-square yang lebih tinggi.
sumber
Saya tidak yakin apa yang diinginkan pewawancara tetapi ketika berhadapan dengan model yang berkinerja buruk ini adalah hal-hal yang saya pertimbangkan dan jawaban yang saya ingin dengar sebagai pewawancara (telah mewawancarai beberapa tahun sekarang).
Mendapatkan lebih banyak data : Ini mungkin tidak selalu membantu tetapi ada beberapa hal yang dapat membantu Anda mengevaluasi efek solusi ini:
Rekayasa fitur yang lebih baik : Jika Anda memiliki cukup data dan Anda tahu tentang deep-learning maka mungkin yang ini tidak relevan. Jika Anda tidak memenuhi kriteria yang disebutkan, fokuskan upaya Anda pada kriteria ini. Dalam model perilaku-pengguna, ada banyak hubungan bahwa intuisi manusia lebih memahami daripada model yang dilatih mesin.
Seperti dalam kasus Anda di mana Anda merekayasa beberapa fitur lebih banyak dan meningkatkan kinerja model dengan sangat baik. Langkah ini rentan terhadap kesalahan karena biasanya melibatkan kode berbasis logika (If Elses / rumus matematika).
Pemilihan model yang lebih baik : Seperti yang Anda sarankan, mungkin model non-linear akan bekerja lebih baik. Apakah data Anda homogen? Apakah Anda memiliki alasan untuk meyakini bahwa fitur lintas akan menjelaskan elastisitas harga dengan lebih baik? (musiman * harga pesaing).
Penyetelan parameter hiper: parameter hiper model penelusuran grid (+ hasil validasi silang) adalah praktik yang baik, tetapi sejauh pengalaman saya, jarang terjadi peningkatan kinerja secara signifikan (tentunya tidak dari 5% hingga 90%).
Ada banyak hal yang bisa dilakukan, tetapi poin-poin ini cukup umum.
sumber
Di atas apa yang disarankan oleh @ Fanat dan @ Fan, saya ingin menambahkan bahwa beberapa inspeksi visual mungkin membantu.
sumber