Dalam Berpikir, Cepat dan Lambat , Daniel Kahneman mengajukan pertanyaan hipotetis berikut:
(P. 186) Julie saat ini adalah senior di universitas negeri. Dia lancar membaca ketika berusia empat tahun. Apa nilai poin rata-rata (IPK) -nya?
Niatnya adalah untuk menggambarkan bagaimana kita sering gagal memperhitungkan regresi dengan rata-rata ketika membuat prediksi tentang statistik tertentu. Dalam diskusi selanjutnya, ia menyarankan:
(P. 190) Ingatlah bahwa korelasi antara dua ukuran — dalam kasus ini, usia membaca dan IPK — sama dengan proporsi faktor bersama di antara faktor-faktor penentu mereka. Apa tebakan terbaik Anda tentang proporsi itu? Tebakan paling optimis saya adalah sekitar 30%. Dengan asumsi estimasi ini, kita memiliki semua yang kita butuhkan untuk menghasilkan prediksi yang tidak bias. Berikut adalah petunjuk cara menuju ke sana dalam empat langkah sederhana:
- Mulai dengan estimasi IPK rata-rata.
- Tentukan IPK yang cocok dengan kesan Anda tentang bukti.
- Perkirakan korelasi antara kecepatan membaca dan IPK.
- Jika korelasinya adalah 0,30, pindahkan 30% jarak dari rata-rata ke IPK yang cocok.
Interpretasi saya atas nasihatnya adalah sebagai berikut:
- Gunakan "Dia membaca dengan lancar ketika dia berusia empat tahun" untuk menetapkan skor standar untuk kecepatan membaca Julie.
- Tentukan IPK yang memiliki skor standar yang sesuai. (IPK rasional untuk memprediksi akan sesuai dengan skor standar ini jika korelasi antara IPK dan kecepatan baca sempurna.)
- Perkirakan berapa persentase variasi dalam IPK dapat dijelaskan oleh variasi dalam kecepatan membaca. (Saya menganggap dia mengacu pada koefisien determinasi dengan "korelasi" dalam konteks ini?)
- Karena hanya 30% dari skor standar kecepatan membaca Julie dapat dijelaskan oleh faktor-faktor yang juga dapat menjelaskan skor standar IPK-nya, kami hanya dibenarkan dalam memprediksi bahwa skor standar IPK Julie akan menjadi 30% dari apa yang seharusnya. dalam hal korelasi sempurna.
Apakah interpretasi saya tentang prosedur Kahneman benar? Jika demikian, adakah pembenaran matematis yang lebih formal tentang prosedurnya, terutama langkah 4? Secara umum, apa hubungan antara korelasi antara dua variabel dan perubahan / perbedaan dalam skor standar mereka?