Apa yang dimaksud dengan distribusi kategorikal?

11

Apakah jenis distribusi yang terpisah ini (EX: Binomial, bernoulli, Multinomial) atau distribusi apa pun dapat diwakili dengan cara ini. Dapatkah seseorang menguraikan dengan contoh sederhana

subha
sumber

Jawaban:

11

Distribusi kategoris adalah generalisasi dari distribusi Bernoulli untuk tetap nomor hasil.2k

Sama halnya, ini adalah kasus khusus dari distribusi multinomial di mana jumlah "pilihan" ditetapkan pada satu.n

Oleh karena itu, ia memiliki pdf:

saya=1khalsayaxsaya(dimana 0halsaya dan sayahalsaya=1)
atas dukungan mana
xsaya{0,1}
nsaya=1kxsaya=1.

Singkatnya, Bernoulli memiliki , binomial memiliki , multinomial memiliki , dan kategorikal memiliki .k=2,n=1k=2,n1k2,n1k2,n=1

Neil G
sumber
Apakah itu perlu, xi = 0,1. Tidak mungkin lebih dari itu.
subha
@ Subha: Pemahaman saya tentang distribusi kategorikal membuatnya seperti itu. Untuk multinomial dan binomial, tentu saja bisa.
Neil G
5

Variabel kategorikal memiliki himpunan terbatas nilai diskrit. Contohnya termasuk jenis kelamin (pria / wanita), negara, planet, dll. Bandingkan dengan variabel kontinu, yang dapat mengambil nilai berbeda dalam jumlah tak terbatas. Contohnya termasuk berat, bujur, jarak, dll.

Perhatikan bahwa informasi serupa kadang-kadang dapat diekspresikan dalam cara yang kategoris dan berkesinambungan; misalnya, planet = earthdapat dinyatakan sebagai distance to sun = 1 astronomical unit ≈ 150 million kilometers. Namun, sebenarnya tidak ada cara untuk mengekspresikan 200 juta kilometer dari matahari dalam hal planet, karena tidak ada planet di sana (Mars berjarak 228 juta km dari matahari). Sama untuk 201 juta km, 202, dll. Yang bisa Anda katakan tentang jarak ini dalam hal planet adalah planet = none; Anda tidak bisa mengatakan planet = 4/3×earthatau .88×Mars, karena tidak ada cara yang berarti untuk mengalikan planet atau variabel kategori lainnya. Dalam hal planet-planet, jarak-jarak ini tidak bisa dibedakan, tetapi tentu saja mereka masuk akal sebagai jarak yang berbeda dari matahari ketika diekspresikan seperti itu - sebagai variabel kontinu.

Seseorang juga dapat mengekspresikan variabel kontinu dengan presisi sewenang-wenang (misalnya, satu unit astronomi adalah 149.597.871 km, tidak persis 150 juta km). Sebaliknya, tidak ada cara untuk mengekspresikan planet = earthlebih tepat; Bumi itu persis bumi, tidak lebih dan tidak kurang. Lebih jauh, tidak masuk akal untuk mengatakan bahwa planet lain "lebih" atau "kurang" dari Bumi jika planetmerupakan variabel nominal. Itu bisa dikodekan sebagai variabel terurut (ordinal) - planet-planet dipesan dalam hal jarak ke matahari, volume, jumlah bulan, dll. Angka-angka ini semua kontinu dalam istilah mereka sendiri (atau setidaknya jumlah, yang terpisah tetapi tidak kategorikal), tetapi tidak dalam hal planet. Misalnya, jika planet dipesan berdasarkan jarak dari matahari atau dengan jumlah bulan mars > earth > venus,. Jika planet dipesan berdasarkan volume,earth > venus > mars. Tidak perlu memesan variabel kategori, dan mungkin beberapa tidak dapat dipesan, tetapi menambahkan pesanan tidak membuatnya kurang kategorikal.

Seperti yang dikatakan Wikipedia, distribusi kategorikal adalah generalisasi dari distribusi Bernoulli ke lebih dari dua nilai yang mungkin (distribusi Bernoulli sangat biner). Distribusi Bernoulli juga merupakan kasus khusus dari distribusi binomial, tapi saya tidak akan menyebut kategori distribusi binomial (diskrit, tetapi variabel hitungan, jadi jarak antar nilai didefinisikan). Distribusi multinomial dapat digabung dengan distribusi kategorikal, tetapi Wikipedia memperingatkan hal ini .

Nick Stauner
sumber