Apa yang dikemukakan Lift and Gain Charts dalam konteks model turnover karyawan

Jadi saya mencoba untuk lebih memahami bagan Lift dan Penguatan sebagaimana berlaku untuk model turnover karyawan saya (yaitu digunakan CHAID dalam SPSS Modeler). Untuk data saya, ini berarti memprediksi jumlah orang yang secara sukarela meninggalkan perusahaan.

Saya telah meninjau referensi di bawah ini dan memiliki dasar-dasar mengenai interpretasi: apa yang diplot pada sumbu x dan y dan kurva ideal yang Anda cari. Saya bahkan berlatih membangun keuntungan saya sendiri dan mengangkat grafik di Excel.

Tetapi semua contoh yang saya lihat sejauh ini adalah untuk kampanye surat langsung. Sekarang saya ingin tahu apa artinya ini untuk data saya. Apakah ini hanya berarti, dalam kasus bagan keuntungan bahwa jika saya mengambil sampel 10% teratas dari data saya, saya dapat mengharapkan 40% persyaratan vs pengambilan sampel 60% teratas dari data saya mendapatkan 80% persyaratan? (asumsikan 40% dan 60% adalah nilainya). Jika demikian maka signifikansi apa yang harus saya ambil dari itu karena saya benar-benar tidak mendapatkannya dalam konteks model turnover saya?

Referensi:

angkat-ukur-dalam-penambangan data

what-is-a-lift-chart

http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html

modeling predictive-models daniellopez46
sumber

Mengapa Anda menggunakan CHAID? Sejauh yang saya pahami, ini adalah metode klasifikasi pohon tua yang meng-pre-date CART dan tidak memiliki banyak sifat statistik yang baik dari CART.

Michael R. Chernick

(+1) untuk menunjukkan upaya penelitian

steffen

@ Michael: Saya setuju, ini metode yang lebih tua. Tetapi saya berada dalam posisi di mana saya mengambil bagian-bagian dari apa yang digunakan analis sebelumnya sejak dia meninggalkan perusahaan. Untuk saat ini saya hanya mengambil dari tempat dia tinggalkan. Akhirnya saya ingin bercabang menggunakan metode lain dan bahkan ansambel. @ steffen - terima kasih.

daniellopez46

Terkadang membantu menggambarkan tujuan dari analisis semacam itu dan apa yang dapat dilakukan perusahaan tanpa analisis tersebut. Misalkan perusahaan memiliki data turnover yang ingin melakukan sesuatu terhadap (kemungkinan) tingkat turnover yang tinggi. Saya bisa membayangkan dua tindakan yang mungkin

Cari tahu apa yang mendorong orang untuk pergi dan memperbaikinya (tidak cukup perawatan kesehatan? Tidak ada tim?) Pada umumnya
Temukan karyawan yang mempertimbangkan untuk pergi dan berbicara dengan mereka, mencari tahu apa yang mendorong mereka untuk memperbaiki masalah khusus untuk mereka.

Jadi mengapa ini penting?

Grafik pengangkatan terutama penting untuk usecase kedua. Bayangkan apa yang dapat dilakukan perusahaan ketika mereka memutuskan untuk menginvestasikan uang berbicara kepada karyawan 1 banding 1 tetapi tidak memiliki model? Satu-satunya pilihan adalah berbicara dengan semua orang atau semua orang dalam sampel acak dengan ukuran tetap. Berbicara kepada semua orang, meskipun ada untungnya mengidentifikasi semua penumpang potensial, itu terlalu mahal. Tetapi ketika hanya sampel acak yang dipilih untuk diajak bicara, hanya sebagian kecil dari semua calon potensial yang diidentifikasi sementara itu masih menghabiskan banyak uang. Dalam kedua kasus tersebut, rasio biaya per cuti-pencegahan cukup tinggi.

Tetapi ketika ada model yang baik, perusahaan dapat memutuskan untuk berbicara hanya dengan mereka yang memiliki probabilitas tertinggi untuk pergi (mereka yang memiliki skor tertinggi sesuai dengan model), sehingga lebih banyak dari para penyintas yang potensial diidentifikasi, sehingga mengoptimalkan biaya per -Tindakan-pencegahan .

Lihat lagi dua tabel pertama di sini: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Katakanlah "pelanggan" = "karyawan" dan "responden positif" = "calon karyawan" (lihat data di bawah).

Jika perusahaan memutuskan hanya dapat mengeluarkan cukup uang untuk berbicara kepada 10.000 karyawan, perusahaan akan mengidentifikasi

$\frac{20000}{100000}*10000=2000$ para penyintas diidentifikasi tanpa model
$\frac{6000}{10000}*10000=6000$ departers diidentifikasi dengan model (hanya memilih 10.000 teratas sesuai dengan skor model)

yang berarti

peningkatan faktor $\frac{6000}{2000}=3$ yang digambarkan sebagai titik (10%, 3) di bagan lift .
bahwa 6000 dari 20.000 total penumpang telah diidentifikasi, yaitu 30%, yang digambarkan sebagai (10%, 30%) dalam grafik kenaikan . Baseline di sini hanya 10%, karena dengan mengambil sampel acak hanya 10.000 karyawan $\frac{10000 * (20000/100000)}{20000}=\frac{10000}{100000}=0.1$ dari semua calon pemberangkatan diidentifikasi.

Sumbu x dalam kedua kasus menunjukkan persentase karyawan yang dihubungi, dalam contoh khusus ini 10%.

Lampiran

Data yang digunakan untuk membuat pertanyaan ini independen dari tautan busuk.

Tingkat keseluruhan

Total Karyawan Dihubungi Petugas Identifikasi
100000 20000

Keefektifan model ketika karyawan dihubungi dalam potongan 10.000

Total Karyawan Dihubungi Petugas Identifikasi
10000 6000
20000 10000
30000 13000
40000 15800
50000 17000
60000 18000
70000 18800
80000 19400
90000 19800
100000 20000

steffen
sumber

bahasa inggris bukan bahasa ibu saya dan saya tidak suka menggunakan "leavers". Apa istilah yang benar di sini?

steffen

Steffen, "lulusan" dapat dimengerti tetapi "keberangkatan" mungkin lebih konvensional. Penggunaan "tertangkap", bagaimanapun, adalah sedikit menggelegar, karena kata ini memiliki konotasi seseorang yang ditangkap karena penyimpangan: seorang penjahat "ditangkap" tetapi subjek penelitian "diidentifikasi".

whuber

Steffen, istilah umum yang digunakan ketika menggambarkan pemodelan churn dalam manajemen hubungan pelanggan / analitik pemasaran adalah "Attriter". Ini berkaitan dengan gagasan gesekan. Saya akan curiga istilah itu sesuai di dunia analitik sumber daya manusia, tetapi tidak bisa mengatakannya dengan pasti.

B_Miner

@ Wouber, ya itu istilah khusus. Seseorang juga mengacu pada gesekan "keras" dan "lunak". Yang pertama biasanya menjadi pilihan proaktif oleh pelanggan dan yang terakhir menjadi kurang pilihan bahwa perusahaan dapat mempengaruhi / mengintervensi untuk memperbaiki. Sebagai contoh, beberapa pelanggan adalah attriter lunak karena mereka pindah, atau mati atau dihapus oleh perusahaan karena tidak dibayar. Dalam beberapa pemodelan churn menggunakan analisis survival (biasanya waktu diskrit), risiko yang bersaing digunakan untuk membedakan penyebab gesekan ini.

B_Miner

Kadang-kadang gesekan lunak juga digunakan untuk menggambarkan hubungan yang secara teknis tetap "aktif" tetapi pelanggan tidak lagi bertunangan (misalnya masih memiliki akun kartu kredit tetapi belum menagih apa pun dalam periode tertentu).

B_Miner

Apa yang dikemukakan Lift and Gain Charts dalam konteks model turnover karyawan

Jawaban: