Adakah yang bisa mengklarifikasi konsep "jumlah variabel acak"

21

Di kelas probabilitas saya, istilah "jumlah variabel acak" terus digunakan. Namun, saya terjebak pada apa artinya itu?

Apakah kita berbicara tentang jumlah sekelompok realisasi dari variabel acak? Jika demikian, bukankah itu menambahkan hingga satu nomor? Bagaimana sejumlah realisasi variabel acak membawa kita ke suatu distribusi, atau fungsi cdf / pdf / dalam bentuk apa pun? Dan jika itu bukan realisasi variabel acak, lalu apa sebenarnya yang ditambahkan?

Gosset
sumber
1
Dengan 'realisasi variabel acak', saya berasumsi maksud Anda adalah nilai-nilai aktual yang diamati. Apa yang dijumlahkan dalam 'jumlah variabel acak' adalah variabel acak sebelum mereka diamati. Bayangkan menghitung berat 5 orang berikutnya untuk naik lift. Anda tidak tahu bobotnya (belum) dan mereka masing-masing adalah variabel acak. Tetapi Anda mungkin ingin mengetahui sesuatu tentang distribusi jumlah bobotnya.
PeterR
@ PeterR Ini adalah apa yang saya tidak mengerti. Bagaimana masuk akal untuk berbicara tentang menambahkan sesuatu yang belum memiliki nilai? Apakah ini jenis penjumlahan metaforis?
Gosset
1
Saya pikir masalah Anda adalah Anda tidak mengerti apa itu variabel acak. Jika Anda mendapatkan konsep ini maka jumlah akan datang dengan mudah juga.
Aksakal
@Aksakal Bukankah fakta bahwa saya sudah memposting bukti pertanyaan itu? Mungkin jika Anda tahu itu, Anda bisa mengklarifikasi konsepnya?
Gosset
Jawaban yang bagus telah diberikan. Contoh lain yang baik adalah jumlah dari dua dadu, . Hasilnya jelas acak (Anda tidak tahu sebelumnya berapa jumlah kedua dadu itu). Kita tahu bahwa X , Y U n i f ( 1 , 6 ) dan independen. Ternyata X + Y memiliki distribusi segitiga. X+YX,YUnif(1,6)X+Y
bdeonovic

Jawaban:

39

Model fisik, intuitif dari variabel acak adalah menuliskan nama setiap anggota populasi pada satu atau lebih slip kertas - "tiket" - dan memasukkan tiket tersebut ke dalam kotak. Proses mencampur isi kotak dengan seksama, diikuti dengan membabi buta mengeluarkan satu tiket - persis seperti dalam lotre - model acak. Probabilitas yang tidak seragam dimodelkan dengan memasukkan jumlah variabel tiket dalam kotak: lebih banyak tiket untuk anggota yang lebih mungkin, lebih sedikit untuk yang kurang mungkin.

Sebuah variabel acak adalah angka yang terkait dengan setiap anggota populasi. (Oleh karena itu, untuk konsistensi, setiap tiket untuk anggota tertentu harus memiliki nomor yang sama tertulis di atasnya.) Beberapa variabel acak dimodelkan dengan memesan ruang di tiket untuk lebih dari satu nomor. Kami biasanya memberikan nama-nama ruang seperti Y , dan Z . The sum of variabel acak adalah jumlah yang biasa: memesan tempat baru pada setiap tiket untuk jumlah, membacakan nilai-nilai X , Y , dll pada setiap tiket, dan menulis jumlah mereka di ruang yang baru. Ini adalah cara yang konsisten dalam menulis angka pada tiket, jadi ini adalah variabel acak lainnya.X, Y,ZX, Y,

Angka

Angka ini menggambarkan sebuah kotak yang mewakili populasi dan tiga variabel acak X , Y , dan X + Y . Ini berisi enam tiket: tiga untuk α (biru) memberikan probabilitas 3 / 6 , dua untuk β (kuning) memberikan probabilitas dari 2 / 6 , dan satu untuk γ (hijau) memberikan probabilitas 1 / 6Ω={α,β,γ}XYX+Yα3/6β2/6γ1/6. Untuk menampilkan apa yang tertulis di tiket, mereka diperlihatkan sebelum dicampur.

Keindahan dari pendekatan ini adalah bahwa semua bagian paradoks dari pertanyaan itu ternyata benar:

  • jumlah variabel acak memang satu, angka pasti (untuk setiap anggota populasi),

  • namun juga mengarah ke distribusi (diberikan oleh frekuensi dengan mana jumlah muncul di dalam kotak), dan

  • masih efektif memodelkan proses acak (karena tiket masih diambil secara membabi buta dari kotak).

Dengan cara ini, penjumlahan dapat secara simultan memiliki nilai yang pasti (diberikan oleh aturan penambahan sebagaimana diterapkan pada nomor di masing-masing tiket) sementara realisasinya - yang akan menjadi tiket yang diambil dari kotak - tidak memiliki nilai sampai itu dilakukan.

Model fisik tiket menggambar dari kotak ini diadopsi dalam literatur teoretis dan dibuat ketat dengan definisi ruang sampel (populasi), aljabar sigma (dengan ukuran probabilitas yang terkait), dan variabel acak sebagai fungsi terukur yang didefinisikan pada ruang sampel .

Akun variabel acak ini dijabarkan, dengan contoh-contoh realistis, di "Apa yang dimaksud dengan variabel acak?" .

whuber
sumber
3
+1 pos teladan. Saya harap Anda tidak keberatan dengan pertanyaan yang tidak sopan, tetapi apa ilustrasi yang dilakukan?
Glen_b -Reinstate Monica
4
@Glen_b PowerPoint :-). Gambar kotak berasal dari mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . Tiketnya adalah grafik PowerPoint. (Tidak ada yang kurang sopan tentang pertanyaan seperti itu!) Saya mengelompokkan seluruh kumpulan, menempelkannya ke Paint, dan menggunakannya untuk menyimpannya sebagai file .png.
whuber
Saya kehilangan sesuatu tetapi sepertinya Anda hanya menulis beberapa label numerik pada setiap anggota populasi. Semua alfa memiliki X = 1, Y = 2 dan karenanya X + Y = 3 .. X, Y dan X + Y memiliki distribusi yang persis sama, digeser oleh nilai di sini nilai di sana, karena lebels yang berbeda
MiloMinderbinder
1
@whuber - seharusnya memiliki frekuensi tertulis. Tidak berpengalaman dalam jargon matematika untuk mengatakan 'ukuran probabilitas yang mendasari'. bagaimanapun Anda mendapatkan maksud saya. Saya mulai melihat bagaimana saya bisa bermain-main dengan angka di tiket untuk memberikan distribusi probabilitas yang diinginkan. Pada tingkat sepintas pendekatan ini hanya tampak seperti permainan kata dengan 'label' yang berbeda dan karenanya tidak melihatnya dengan jelas. ini akan menjadi kali ke 50 Anda telah membantu saya di situs ini. terima kasih
MiloMinderbinder
1
@Milo Sama-sama. Saya melihat sekarang bahwa Anda bereaksi terhadap contoh dalam jawaban ini daripada contoh yang saya berikan dalam komentar sebelumnya. Contoh jawaban memang memiliki tiga tiket berbeda dengan frekuensi relatif 1: 2: 3, dan hanya itulah yang dimaksud "ukuran probabilitas" dalam kasus ini. Namun, ini bukan sekadar jargon: ada kebutuhan besar akan konsep yang mendasarinya. Lihat, antara lain, stats.stackexchange.com/questions/199280 untuk beberapa akun yang bagus.
whuber
4

tidak ada rahasia di balik frasa ini, sesederhana yang Anda pikirkan: jika X dan Y adalah dua variabel acak, jumlah mereka adalah X + Y dan jumlah ini juga merupakan variabel acak. Jika X_1, X_2, X_3, ..., X_n dan merupakan n variabel acak, jumlahnya adalah X_1 + X_2 + X_3 + ... + X_n dan jumlah ini juga merupakan variabel acak (dan realisasi jumlah ini adalah satu angka, yaitu jumlah dari n realisasi).

Mengapa Anda berbicara banyak tentang jumlah variabel acak di kelas? Salah satu alasannya adalah teorema limit pusat (luar biasa): jika kita menjumlahkan banyak variabel acak independen, maka kita dapat "memprediksi" distribusi jumlah ini (hampir) secara independen dari distribusi variabel tunggal dalam penjumlahan! Jumlahnya cenderung menjadi distribusi normal dan ini adalah kemungkinan alasan mengapa kita mengamati distribusi normal begitu sering di dunia nyata.

Jolvi
sumber
3

rv adalah hubungan antara terjadinya suatu peristiwa dan bilangan real. Katakanlah, jika hujan nilai X adalah 1, jika tidak maka 0. Anda dapat memiliki rv Y sama dengan 10 saat dingin, dan 100 saat panas. Jadi, jika hujan dan dingin maka X = 1, Y = 10, dan X + Y = 11.

Nilai X + Y adalah 10 (tidak hujan dingin); 11 (hujan, dingin), 100 (tidak hujan, panas) dan 110 (hujan, panas). Jika Anda mengetahui probabilitas acara kami, maka Anda akan mendapatkan PMF dari rv X + Y baru ini.

Aksakal
sumber
1

X,YX+YΩ1×Ω2X,YΩ={HeSebuahd,TSebuahsayal}X(HeSebuahd)=Y(HeSebuahd)=1,X(TSebuahsayal)=Y(TSebuahsayal)=0(X+Y)X,Yσ-X,Y

Daniel Li
sumber