Saya membaca artikel ini tentang kasus Palantir di mana Deparment of Labor menuduh mereka melakukan diskriminasi terhadap orang Asia. Adakah yang tahu dari mana mereka mendapatkan estimasi probabilitas ini?
Saya tidak mendapatkan 1/741 dalam item (a).
(a) Untuk posisi QA Engineer, dari lebih dari 730 pelamar yang memenuhi syarat - sekitar 77% di antaranya adalah orang Asia - Palantir mempekerjakan enam pelamar non-Asia dan hanya satu pelamar Asia. Dampak buruk yang dihitung oleh OFCCP melebihi tiga standar deviasi. Kemungkinan hasil ini terjadi berdasarkan kebetulan adalah sekitar satu dari 741.
(B) Untuk posisi Software Engineer, dari lebih dari 1.160 pelamar yang memenuhi syarat - sekitar 85% di antaranya adalah orang Asia - Palantir mempekerjakan 14 pelamar non-Asia dan hanya 11 pelamar Asia. Dampak buruk yang dihitung oleh OFCCP melebihi lima standar deviasi. Kemungkinan hasil ini terjadi secara kebetulan adalah sekitar satu dalam 3,4 juta.
(c) Untuk posisi Intern Engineer QA, dari lebih dari 130 pelamar yang memenuhi syarat - sekitar 73% di antaranya adalah orang Asia - Palantir mempekerjakan 17 pelamar bukan-Asia dan hanya empat pelamar Asia. Dampak buruk yang dihitung oleh OFCCP melebihi enam standar deviasi. Kemungkinan hasil ini terjadi berdasarkan kebetulan adalah sekitar satu dalam satu miliar.
sumber
Jawaban:
Saya akan merekayasa balik ini dari pengalaman dengan kasus-kasus diskriminasi. Saya pasti bisa menentukan dari mana nilai "satu dalam 741," dll , berasal. Namun, begitu banyak informasi yang hilang dalam terjemahan sehingga sisa rekonstruksi saya bergantung pada bagaimana orang melakukan statistik dalam pengaturan ruang sidang. Saya hanya bisa menebak beberapa detail.
Sejak undang-undang anti-diskriminasi disahkan pada 1960-an (Judul VI), pengadilan di Amerika Serikat telah belajar untuk melihat nilai-p dan membandingkannya dengan ambang batas dan 0,01 . Mereka juga telah belajar untuk melihat efek standar, biasanya disebut sebagai "standar deviasi," dan membandingkannya dengan ambang batas "dua hingga tiga standar deviasi." Untuk membuat kasus prima facie untuk gugatan diskriminasi, penggugat biasanya mencoba perhitungan statistik yang menunjukkan "dampak berbeda" yang melebihi ambang batas ini. Jika perhitungan seperti itu tidak dapat didukung, kasing biasanya tidak bisa maju.0.05 0.01
Pakar statistik untuk penggugat sering berupaya untuk mengutarakan hasil mereka dalam istilah yang sudah lazim ini. Beberapa ahli melakukan tes statistik di mana hipotesis nol menyatakan "tidak ada dampak buruk," dengan asumsi keputusan kerja adalah murni acak dan tidak diatur oleh karakteristik karyawan lainnya. (Apakah itu alternatif satu-ekor atau dua-ekor mungkin tergantung pada ahli dan keadaannya.) Mereka kemudian mengubah nilai-p tes ini menjadi sejumlah "standar deviasi" dengan merujuknya ke distribusi Normal standar- - bahkan ketika standar Normal tidak relevan dengan tes asli. Dengan cara bundaran ini mereka berharap untuk mengomunikasikan kesimpulan mereka dengan jelas kepada hakim.
Tes yang disukai untuk data yang dapat diringkas dalam tabel kontingensi adalah Uji Exact Fisher. Terjadinya "Tepat" dalam namanya sangat menyenangkan bagi penggugat, karena berkonotasi penentuan statistik yang telah dibuat tanpa kesalahan (apa pun itu!).
Jadi, inilah perhitungan saya (rekonstruksi spekulatif) dari Departemen Tenaga Kerja.
Mereka menjalankan Fisher's Exact Test, atau semacamnya (seperti tes dengan nilai-p yang ditentukan melalui pengacakan). Tes ini mengasumsikan distribusi hypergeometric seperti yang dijelaskan dalam jawaban Matthew Gunn. (Untuk sejumlah kecil orang yang terlibat dalam keluhan ini, distribusi hipergeometrik tidak diperkirakan dengan baik oleh distribusi Normal.)χ2
Mereka mengonversi nilai p-nya ke skor Z normal ("jumlah standar deviasi").
Mereka membulatkan skor Z ke bilangan bulat terdekat: "melebihi tiga standar deviasi," "melebihi lima standar deviasi," dan "melebihi enam standar deviasi." (Karena beberapa dari Z-skor mengitari up penyimpangan lebih standar, saya tidak bisa membenarkan "melebihi", semua bisa saya lakukan adalah mengutipnya.)
Dalam keluhan, skor Z integral ini dikonversi kembali ke nilai-p! Sekali lagi standar distribusi normal digunakan.
Nilai-p ini digambarkan (bisa dibilang dengan cara yang menyesatkan) sebagai "kemungkinan bahwa hasil ini terjadi sesuai dengan kebetulan."
Berikut adalah beberapa
R
kode yang digunakan untuk melakukan perhitungan ini.sumber
Cara menghitung interval dengan benar menggunakan distribusi hypergeometric:
Untuk pengujian satu sisi, di MATLAB, Anda dapat memanggil
pval = hygecdf(k, N, K, n);
atau dalam halpval = hygecdf(1, 730, 562, 7)
ini sekitar 0,0007839.Mean dan standar deviasi diberikan oleh:
Mencari rumus yang mungkin digunakan OFCCP, situs ini yang saya lihat mungkin dapat membantu: http://www.hr-software.net/EmploymentStatistics/DisparateImpact.htm
Ringkasan beberapa perhitungan:
sumber