Misalkan populasi, dari mana kami menganggap Anda mengambil sampel secara acak, berisi proporsi dari promotor, dari pasif, dan dari para pencela, dengan . Untuk memodelkan NPS, bayangkan mengisi topi besar dengan sejumlah besar tiket (satu untuk setiap anggota populasi Anda) berlabel untuk promotor, untuk pasif, dan untuk pencela, dalam proporsi yang diberikan, dan kemudian menggambar dari mereka secara acak. The sampel NPS adalah nilai rata-rata pada tiket yang ditarik. The benar NPS dihitung sebagai nilai rata-rata dari semua tiket di topi: itu adalahp 0 p - 1 p 1 + p 0 + p - 1 = 1 + 1 0 - 1 np1p0p−1p1+p0+p−1=1+10- 1nnilai yang diharapkan (atau harapan ) topi.
Penaksir NPS yang benar adalah sampel NPS. Sampel NPS juga memiliki harapan. Ini dapat dianggap sebagai rata-rata dari semua sampel NPS yang mungkin. Harapan ini terjadi sama dengan NPS yang sebenarnya. The standard error dari NPS sampel adalah ukuran dari berapa banyak NPS sampel biasanya bervariasi antara satu sampel acak dan lain. Untungnya, kami tidak harus menghitung semua sampel yang mungkin untuk menemukan SE: itu dapat ditemukan lebih sederhana dengan menghitung standar deviasi tiket di topi dan membaginya dengan . (Penyesuaian kecil dapat dilakukan ketika sampel adalah proporsi populasi yang cukup besar, tetapi itu kemungkinan tidak diperlukan di sini.)n--√
Sebagai contoh, pertimbangkan populasi promotor, pasif, dan pencela. NPS yang sebenarnya adalahp 0 = 1 / 3 p - 1 = 1 / 6hal1= 1 / 2hal0= 1 / 3hal- 1= 1 / 6
NPS = 1 × 1 / 2 + 0 × 1 / 3 + - 1 × 1 / 6 = 1 / 3.
The varians karena itu
Var (NPS)= ( 1 - NPS )2× p1+ ( 0 - NPS )2× p0+ ( - 1 - NPS )2× p- 1= ( 1 - 1 / 3 )2× 1 / 2 + ( 0 - 1 / 3 )2× 1 / 3 + ( - 1 - 1 / 3 )2× 1 / 6= 5 / 9.
The standar deviasi adalah akar kuadrat dari ini, hampir sama dengan0,75.
Dalam sampel, katakanlah, , karena itu Anda akan mengharapkan untuk mengamati NPS sekitar % dengan kesalahan standar sekitar %.1 / 3 = 33 0,75 / √3241 / 3 = 334.10,75 / 324---√=4.1
Anda sebenarnya tidak tahu standar deviasi tiket di topi, jadi Anda memperkirakannya dengan menggunakan standar deviasi sampel Anda. Ketika dibagi dengan akar kuadrat dari ukuran sampel, itu memperkirakan kesalahan standar NPS: estimasi ini adalah margin of error (MoE).
Asalkan Anda mengamati sejumlah besar setiap jenis pelanggan (biasanya, sekitar 5 atau lebih dari masing-masing pelanggan akan melakukannya), distribusi sampel NPS akan mendekati Normal. Ini menyiratkan bahwa Anda dapat menafsirkan MoE dengan cara yang biasa. Khususnya, sekitar 2/3 dari waktu sampel NPS akan terletak dalam satu MoE dari NPS yang sebenarnya dan sekitar 19/20 dari waktu (95%) sampel NPS akan berada dalam dua MoE dari NPS yang sebenarnya. Dalam contoh, jika margin kesalahan benar-benar 4,1%, kita akan memiliki kepercayaan 95% bahwa hasil survei (sampel NPS) berada dalam 8,2% dari populasi NPS.
Setiap survei akan memiliki margin kesalahan sendiri. Untuk membandingkan dua hasil tersebut, Anda perlu memperhitungkan kemungkinan kesalahan masing-masing. Ketika ukuran survei hampir sama, kesalahan standar perbedaan mereka dapat ditemukan oleh teorema Pythagoras: ambil akar kuadrat dari jumlah kuadrat mereka. Misalnya, jika satu tahun MoE adalah 4,1% dan tahun lain MoE adalah 3,5%, maka kira-kira angka margin kesalahan sekitar = 5,4% untuk perbedaan dalam dua hasil. Dalam hal ini, Anda dapat menyimpulkan dengan keyakinan 95% bahwa NPS populasi berubah dari satu survei ke yang lain asalkan perbedaan dalam dua hasil survei adalah 10,8% atau lebih besar.3.52+ 4.12---------√
Ketika membandingkan banyak hasil survei dari waktu ke waktu, metode yang lebih canggih dapat membantu, karena Anda harus mengatasi banyak margin kesalahan yang terpisah. Ketika margin kesalahan semuanya sangat mirip, aturan praktis adalah untuk menganggap perubahan tiga atau lebih MoE sebagai "signifikan." Dalam contoh ini, jika MoE berada di sekitar 4%, maka perubahan sekitar 12% atau lebih besar selama periode beberapa survei harus mendapatkan perhatian Anda dan perubahan yang lebih kecil secara sah dapat diberhentikan karena kesalahan survei. Apapun, analisis dan aturan praktis yang disediakan di sini biasanya memberikan awal yang baik ketika berpikir tentang apa perbedaan di antara survei.
Perhatikan bahwa Anda tidak dapat menghitung margin kesalahan dari NPS yang diamati saja: itu tergantung pada jumlah yang diamati dari masing-masing tiga jenis responden. Sebagai contoh, jika hampir semua orang adalah "pasif," NPS survei akan mendekati dengan margin kesalahan kecil. Jika populasi terpolarisasi sama antara promotor dan pencela, NPS survei masih akan mendekati tetapi akan memiliki margin kesalahan terbesar (sama dengan dalam sampel orang).0 1 / √001 / n--√n
Anda juga bisa menggunakan estimator varians untuk variabel kontinu. Sebenarnya, saya lebih suka itu daripada penaksir varians untuk variabel diskrit acak, karena ada koreksi yang terkenal untuk menghitung varians sampel: https://en.wikipedia.org/wiki/Unprice_estimation_of_standard_deviation Seperti yang telah dicatat, solusi Whubers didasarkan pada formula populasi. Namun, karena Anda menjalankan survei, saya cukup yakin Anda telah mengambil sampel, jadi saya akan merekomendasikan menggunakan estimator yang tidak bias (membagi jumlah kuadrat dengan n-1, tidak hanya dengan n). Tentu saja, untuk ukuran sampel besar, perbedaan antara penaksir yang bias dan tidak bias sebenarnya tidak ada.
Saya juga merekomendasikan untuk menggunakan prosedur uji-t, jika Anda memiliki ukuran sampel sedang, daripada menggunakan pendekatan skor-z: https://en.wikipedia.org/wiki/Student 's_t-test
@whuber: karena orang lain juga bertanya: bagaimana cara menghitung taksiran sampel tak bias untuk varians / sd untuk pendekatan variabel diskrit acak Anda? Saya sudah mencoba menemukannya sendiri, tetapi tidak berhasil. Terima kasih.
sumber
Anda dapat berpotensi menggunakan bootstrap untuk menyederhanakan perhitungan Anda. Dalam R kodenya adalah:
sumber