Jadi saya mencoba untuk lebih memahami bagan Lift dan Penguatan sebagaimana berlaku untuk model turnover karyawan saya (yaitu digunakan CHAID dalam SPSS Modeler). Untuk data saya, ini berarti memprediksi jumlah orang yang secara sukarela meninggalkan perusahaan.
Saya telah meninjau referensi di bawah ini dan memiliki dasar-dasar mengenai interpretasi: apa yang diplot pada sumbu x dan y dan kurva ideal yang Anda cari. Saya bahkan berlatih membangun keuntungan saya sendiri dan mengangkat grafik di Excel.
Tetapi semua contoh yang saya lihat sejauh ini adalah untuk kampanye surat langsung. Sekarang saya ingin tahu apa artinya ini untuk data saya. Apakah ini hanya berarti, dalam kasus bagan keuntungan bahwa jika saya mengambil sampel 10% teratas dari data saya, saya dapat mengharapkan 40% persyaratan vs pengambilan sampel 60% teratas dari data saya mendapatkan 80% persyaratan? (asumsikan 40% dan 60% adalah nilainya). Jika demikian maka signifikansi apa yang harus saya ambil dari itu karena saya benar-benar tidak mendapatkannya dalam konteks model turnover saya?
Referensi:
angkat-ukur-dalam-penambangan data
http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html
sumber
Jawaban:
Terkadang membantu menggambarkan tujuan dari analisis semacam itu dan apa yang dapat dilakukan perusahaan tanpa analisis tersebut. Misalkan perusahaan memiliki data turnover yang ingin melakukan sesuatu terhadap (kemungkinan) tingkat turnover yang tinggi. Saya bisa membayangkan dua tindakan yang mungkin
Jadi mengapa ini penting?
Grafik pengangkatan terutama penting untuk usecase kedua. Bayangkan apa yang dapat dilakukan perusahaan ketika mereka memutuskan untuk menginvestasikan uang berbicara kepada karyawan 1 banding 1 tetapi tidak memiliki model? Satu-satunya pilihan adalah berbicara dengan semua orang atau semua orang dalam sampel acak dengan ukuran tetap. Berbicara kepada semua orang, meskipun ada untungnya mengidentifikasi semua penumpang potensial, itu terlalu mahal. Tetapi ketika hanya sampel acak yang dipilih untuk diajak bicara, hanya sebagian kecil dari semua calon potensial yang diidentifikasi sementara itu masih menghabiskan banyak uang. Dalam kedua kasus tersebut, rasio biaya per cuti-pencegahan cukup tinggi.
Tetapi ketika ada model yang baik, perusahaan dapat memutuskan untuk berbicara hanya dengan mereka yang memiliki probabilitas tertinggi untuk pergi (mereka yang memiliki skor tertinggi sesuai dengan model), sehingga lebih banyak dari para penyintas yang potensial diidentifikasi, sehingga mengoptimalkan biaya per -Tindakan-pencegahan .
Lihat lagi dua tabel pertama di sini: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Katakanlah "pelanggan" = "karyawan" dan "responden positif" = "calon karyawan" (lihat data di bawah).
Jika perusahaan memutuskan hanya dapat mengeluarkan cukup uang untuk berbicara kepada 10.000 karyawan, perusahaan akan mengidentifikasi
yang berarti
Sumbu x dalam kedua kasus menunjukkan persentase karyawan yang dihubungi, dalam contoh khusus ini 10%.
Lampiran
Data yang digunakan untuk membuat pertanyaan ini independen dari tautan busuk.
Tingkat keseluruhan
Keefektifan model ketika karyawan dihubungi dalam potongan 10.000
sumber