Saya tahu sangat sedikit tentang Probabilitas dan Statistik, dan saya ingin belajar. Saya melihat kata "distribusi" digunakan di semua tempat dalam konteks yang berbeda.
Sebagai contoh, variabel acak diskrit memiliki "distribusi probabilitas." Saya tahu ini apa. Variabel acak kontinu memiliki fungsi kerapatan probabilitas, maka untuk , integral dari ke dari fungsi kerapatan probabilitas adalah fungsi distribusi kumulatif yang dievaluasi pada .
Dan rupanya hanya "fungsi distribusi" identik dengan "fungsi distribusi kumulatif," setidaknya ketika berbicara tentang variabel acak kontinu (pertanyaan: apakah mereka selalu bersinonim?).
Lalu ada banyak distribusi terkenal. distribusi χ 2 distribusi, dll. Tapi apa sebenarnya distribusi Γ ? Apakah ini fungsi distribusi kumulatif dari variabel Γ acak? Atau fungsi kepadatan probabilitas dari variabel Γ acak?
Tetapi kemudian distribusi frekuensi dari kumpulan data yang terbatas nampaknya berupa histogram.
Singkat cerita: dalam Probabilitas dan Statistik, apa definisi dari kata "distribusi"?
Saya tahu definisi distribusi dalam Matematika (elemen ruang ganda dari koleksi fungsi tes yang dilengkapi dengan topologi batas induktif), tetapi tidak Probabilitas dan Statistik.
sumber
Jawaban:
Berikut ini adalah untuk variabel acak bernilai. Ekstensi ke ruang lain lurus ke depan jika Anda tertarik. Saya berpendapat bahwa definisi yang sedikit lebih umum berikut ini lebih intuitif daripada secara terpisah mempertimbangkan fungsi distribusi kepadatan, massa dan kumulatif.R−
Saya menyertakan beberapa istilah matematika / probabilistik dalam teks untuk membuatnya benar. Jika seseorang tidak terbiasa dengan istilah-istilah itu, intuisi sama-sama dipahami dengan hanya memikirkan "set Borel" sebagai "setiap himpunan bagian dari yang dapat saya pikirkan", dan dari variabel acak, hasil numerik dari beberapa eksperimen dengan eksperimen. probabilitas terkait.R
Misalkan menjadi ruang probabilitas dan X ( ω ) merupakan variabel acak bernilai - R pada ruang ini.(Ω,F,P) X(ω) R−
Fungsi set , di mana A adalah himpunan Borel, disebut distribusi X .Q(A):=P(ω∈Ω:X(ω)∈A) A X
Dalam kata-kata, distribusi memberitahu Anda (secara longgar), untuk setiap bagian dari , probabilitas bahwa X mengambil nilai dalam set itu. Orang dapat membuktikan bahwa Q sepenuhnya ditentukan oleh fungsi F ( x ) : = P ( X ≤ x ) dan sebaliknya. Untuk melakukan itu - dan saya melewatkan detailnya di sini - buat ukuran pada set Borel yang menetapkan probabilitas F ( x ) untuk semua set ( - ∞ , x ) dan berargumen bahwa ukuran hingga ini setuju dengan Q pada sebuahR X Q F(x):=P(X≤x) F(x) (−∞,x) Q sistem yang menghasilkan Borelπ− σ− algebra.
If it so happens thatQ(A) can be written as Q(A)=∫Af(x)dx then f is a density function for Q and you can see, although this density is not uniquely determined (consider changes on sets of Lebesgue measure zero), it makes sense to also speak of f as the distribution of X . Usually, however, we call it the probability density function of X .
A final note on the case where there is no mention of a random variable, but only a distribution. One may prove that given a distribution function (or a mass, density or cumulative distribution function), there exists a probability space with a random variable that has this distribution. Thus, there is essentially no difference in speaking about a distribution, or about a random variable having that distribution. It's just a matter of one's focus.
sumber
Let(Ω,F,P) be a probability space, let (X,B) be a measurable space, and let X:Ω→X be a measurable function, which means that X−1(B)={ω:X(ω)∈B}∈F for every B∈B . The distribution of X is the probability measure μX over (X,B) defined by μX(B)=P(X∈B) . When X=R and B is the Borel sigma-field, we refer to the function X as a random "variable".
sumber
The question and answers so far seem to have focused on theoretical distributions. Empirical distributions provide a more intuitive understanding of distributions.
An ostensive definition for an observed distribution is the frequency of occurrences for each observed value of a variable.
In inferential statistics we then try to fit theoretical distributions to the observed distributions, because we would like to work with the assumptions of the theoretical distributions. You can reach a similar definition for theoretical distributions by replacing "observed" with "observerable" or to be more precise: "expected".
sumber