Secara informal, distribusi probabilitas menentukan frekuensi relatif dari hasil variabel acak - nilai yang diharapkan dapat dianggap sebagai rata-rata tertimbang dari hasil tersebut (dibobot oleh frekuensi relatif). Demikian pula, nilai yang diharapkan dapat dianggap sebagai rata-rata aritmatika dari sekumpulan angka yang dihasilkan dalam proporsi yang tepat dengan kemungkinan terjadinya (dalam kasus variabel acak kontinu ini tidak sepenuhnya benar karena nilai-nilai spesifik memiliki probabilitas ).0
Koneksi antara nilai yang diharapkan dan rata-rata aritmatika paling jelas dengan variabel acak diskrit, di mana nilai yang diharapkan
E( X) = ∑Sx P.( X= x )
di mana adalah ruang sampel. Sebagai contoh, misalkan Anda memiliki variabel acak diskrit sehingga:XSX
X=⎧⎩⎨123with probability 1/8with probability 3/8with probability 1/2
Artinya, fungsi massa probabilitas adalah , , dan . Dengan menggunakan rumus di atas, nilai yang diharapkan adalahP ( X = 2 ) = 3 / 8 P ( X = 3 ) = 1 / 2P(X=1)=1/8P(X=2)=3/8P(X=3)=1/2
E(X)=1⋅(1/8)+2⋅(3/8)+3⋅(1/2)=2.375
Sekarang perhatikan angka yang dihasilkan dengan frekuensi tepat sebanding dengan fungsi massa probabilitas - misalnya, himpunan angka - dua s, enam s dan delapan s. Sekarang ambil rata-rata aritmatika dari angka-angka ini:{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123
1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375
dan Anda bisa melihatnya persis sama dengan nilai yang diharapkan.
Harapannya adalah nilai rata-rata atau rata-rata dari variabel acak bukan distribusi probabilitas. Karena itu untuk variabel acak diskrit, rata-rata tertimbang dari nilai-nilai yang diambil variabel acak di mana bobotnya sesuai dengan frekuensi relatif terjadinya nilai-nilai individual tersebut. Untuk variabel acak yang benar-benar kontinu, itu adalah integral dari nilai x dikalikan dengan kepadatan probabilitas. Data yang diamati dapat dilihat sebagai nilai-nilai kumpulan variabel acak independen yang didistribusikan secara identik. Sampel mean (atau ekspektasi sampel) didefinisikan sebagai ekspektasi data sehubungan dengan distribusi empiris untuk data yang diamati. Ini membuatnya hanya rata-rata aritmatika data.
sumber
Mari kita perhatikan definisi:
Mean didefinisikan sebagai jumlah kumpulan angka yang dibagi dengan jumlah angka dalam koleksi. Perhitungannya adalah "untuk i dalam 1 ke n, (jumlah x sub i) dibagi dengan n."
Nilai yang diharapkan (EV) adalah nilai rata-rata jangka panjang dari pengulangan eksperimen yang diwakilinya. Perhitungannya adalah "untuk i in 1 to n, jumlah kejadian x sub i kali probabilitasnya (dan jumlah semua p sub i harus = 1)."
Dalam kasus die fair, mudah untuk melihat bahwa mean dan EV adalah sama. Berarti - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3.5 dan EV adalah:
prob xp * x
0.167 1 0.17
0,167 2 0,33
0,167 3 0,50
0.167 4 0.67
0.167 5 0.83
0.167 6 1.00
EV = jumlah (p * x) = 3,50
Tetapi bagaimana jika mati itu tidak "adil." Cara mudah untuk membuat dadu yang tidak adil adalah dengan membuat lubang di sudut di persimpangan 4, 5, dan 6 wajah. Lebih jauh sekarang mari kita katakan bahwa kemungkinan menggulirkan 4, 5, atau 6 pada dadu bengkok kami yang baru dan lebih baik sekarang .2 dan kemungkinan menggulung 1, 2, atau 3 sekarang .133. Itu adalah mati yang sama dengan 6 wajah, satu angka di setiap wajah dan rata-rata untuk mati ini masih 3,5. Namun, setelah bergulir ini mati berkali-kali, EV kami sekarang 3,8 karena probabilitas untuk acara tidak lagi sama untuk semua acara.
prob xp * x
0.133 1 0.13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0,200 5 1,00
0,200 6 1,20
EV = jumlah (p * x) = 3,80
Sekali lagi, mari kita berhati-hati dan kembali ke definisi sebelum menyimpulkan bahwa satu hal akan selalu "sama" dengan yang lain. Lihatlah bagaimana dadu normal diatur dan bor lubang di 7 sudut lainnya dan lihat bagaimana perubahan EV - bersenang-senang.
Bob_T
sumber
Satu-satunya perbedaan antara "rata-rata" dan "nilai yang diharapkan" adalah bahwa rata-rata terutama digunakan untuk distribusi frekuensi dan harapan digunakan untuk distribusi probabilitas. Dalam distribusi frekuensi, ruang sampel terdiri dari variabel dan frekuensi kemunculannya. Dalam distribusi probabilitas, ruang sampel terdiri dari variabel acak dan probabilitasnya. Sekarang kita tahu bahwa probabilitas total semua variabel dalam ruang sampel harus = 1. Di sinilah letak perbedaan mendasar. Istilah penyebut untuk harapan selalu = 1. (mis. Penjumlahan f (xi) = 1) Namun tidak ada pembatasan penjumlahan frekuensi (yang pada dasarnya adalah jumlah entri).
sumber