Apa maksud Theta?

16

Saya seorang pemula untuk statistik dan menemukan ini .

Dalam statistik, θ, huruf Yunani kecil 'theta', adalah nama biasa untuk (vektor) parameter (s) dari beberapa distribusi probabilitas umum. Masalah umum adalah menemukan nilai theta. Perhatikan bahwa tidak ada artinya dalam penamaan parameter dengan cara ini. Kita mungkin menyebutnya hal lain. Bahkan, banyak distribusi memiliki parameter yang biasanya diberi nama lain. Sebagai contoh, itu adalah penggunaan umum untuk nama mean dan deviasi dari distribusi normal μ (baca: 'mu') dan deviasi σ ('sigma'), masing-masing.

Tetapi saya masih tidak tahu apa artinya itu dalam bahasa Inggris biasa?

Kamilski81
sumber
10
hanyalah simbol matematika dan memiliki arti berbeda dalam konteks yang berbeda. Terkadang θ digunakan untuk merujuk pada parameter yang akan diestimasikan tetapi tidak ada jawaban nyata untuk pertanyaan "Apa itu θ ?". Itu seperti bertanya "Apa huruf A?". Tautan Anda bahkan mengisyaratkan hal ini ketika mengatakan"Perhatikan bahwa tidak ada makna dalam penamaan parameter dengan cara ini. Kami mungkin juga menyebutnya apa pun." . θθθ
Makro
Ini hanya cara untuk memberi nama parameter statistik (yang menentukan distribusi kuantitas yang terkait dengan 'parameter' ini) dengan huruf khusus (selain huruf bahasa Inggris).
Stat-R
4
Sebagian besar dari kita akan menganggap kutipan ini sebagai bahasa Inggris yang sangat sederhana, tetapi untuk membuat kemajuan, kita harus menerima bahwa pertanyaannya bukan tentang bagaimana membaca bahasa Inggris. Lalu, bagaimana dengan itu? Saya serahkan bahwa itu meminta kami untuk menjelaskan istilah-istilah teknis dalam kutipan: yang kita kenal dengan baik sehingga kita tidak lagi melihat betapa anehnya hal itu bagi orang yang belum tahu secara statistik. Ini panggilan bagi kita untuk membahas arti distribusi dan parameter (dari distribusi yang; bukan dari kurva pas atau model deterministik lainnya).
whuber

Jawaban:

31

Ini bukan konvensi, tetapi cukup sering singkatan dari set parameter distribusi.θ

Itu untuk bahasa Inggris biasa, mari kita tunjukkan contohnya.

Contoh 1. Anda ingin mempelajari lemparan paku payung kuno (yang memiliki alas bundar besar). Anda berasumsi bahwa probabilitas jatuh itu adalah nilai yang tidak diketahui yang Anda panggil . Anda dapat memanggil variabel acak X dan mengatakan bahwa X = 1 saat paku payung jatuh ke bawah dan X = 0 saat jatuh ke atas. Anda akan menulis modelnyaθXX=1X=0

P(X=1)=θP(X=0)=1θ,

dan Anda akan tertarik untuk memperkirakan (di sini, proabilitas bahwa paku payung jatuh ke bawah).θ

Contoh 2. Anda ingin mempelajari disintegrasi atom radioaktif. Berdasarkan literatur, Anda tahu bahwa jumlah radioaktivitas berkurang secara eksponensial, sehingga Anda memutuskan untuk memodelkan waktu untuk disintegrasi dengan distribusi eksponensial. Jika adalah waktu untuk disintegrasi, modelnya adalaht

f(t)=θeθt.

Berikut adalah kepadatan probabilitas, yang berarti bahwa probabilitas bahwa hancur atom dalam interval waktu ( t , t + d t ) adalah f ( t ) d t . Sekali lagi, Anda akan tertarik untuk memperkirakan θ (di sini, laju disintegrasi).f(t)(t,t+dt)f(t)dtθ

Contoh 3. Anda ingin mempelajari ketelitian alat penimbangan. Berdasarkan literatur, Anda tahu bahwa pengukurannya Gaussian sehingga Anda memutuskan untuk memodelkan berat objek 1 kg standar sebagai

f(x)=1σ2πexp{(xμ2σ)2}.

Di sini adalah ukuran yang diberikan oleh skala, f ( x ) adalah kepadatan probabilitas, dan parameternya adalah μ dan σ , jadi θ = ( μ , σ ) . Paramter μ adalah target berat (skala bias jika μ 1 ), dan σ adalah standar deviasi ukuran setiap kali Anda menimbang objek. Sekali lagi, Anda akan tertarik untuk memperkirakan θ (di sini, bias dan ketidaktepatan skala).xf(x)μσθ=(μ,σ)μμ1σθ

gui11aume
sumber
1
+1 FWIW, saya baru-baru ini memposting contoh yang berfungsi di sepanjang baris yang sama di stats.stackexchange.com/a/34894 . Meskipun akan menyesatkan untuk menafsirkannya sebagai "bahasa Inggris biasa" - tidak malu menggunakan istilah teknis - saya berupaya menjelaskan sejelas dan sesingkat mungkin apa yang sedang terjadi, asumsi apa yang dibuat, dan bagaimana seseorang bekerja dengan keluarga distribusi yang diparameterisasi untuk menghasilkan estimasi berdasarkan data. Bagi sebagian orang, ini mungkin merupakan tambahan informatif untuk jawaban Anda di sini.
whuber
1
Jawaban bagus! Saya bingung ketika Anda menyatakan skala bias jika mu! = 1, meskipun. Bahkan, setelah "normalisasi", distribusi normal standar menjadi x ~ N (0, 1). Atau, dalam bahasa Inggris, mu = 0 dan varians = 1. Lihat misalnya, en.wikipedia.org/wiki/…
Mike Williamson
Maksud saya instrumen tersebut memiliki bias jika menunjukkan sesuatu yang lebih dari 1 kg ketika mengukur objek 1 kg. Mungkin kata "skala" membingungkan. Di sini hanya menunjuk instrumen.
gui11aume
3

Apa yang tergantung pada model apa yang Anda kerjakan. Misalnya, dalam regresi kuadrat terkecil biasa, Anda memodelkan variabel dependen (biasanya disebut Y) sebagai kombinasi linear dari satu atau lebih variabel independen (biasanya disebut X), mendapatkan sesuatu sepertiθ

Yi=b0+b1x1+b2x2+...+bpxp

βsθβsθ

Peter Flom - Pasang kembali Monica
sumber
3
θθ
1
@ Macro Saya pikir, dalam konteks ini, jelas bahwa ini adalah maknanya θyang diinginkan Kamilski. Tentu, simbol apa pun bisa merujuk pada apa saja. Tetapi dalam paragraf ini, Makro berarti Anda, dan bukan mata kuliah Ekonomi atau bagian dari SAS atau yang lainnya.
Peter Flom - Reinstate Monica
1
ok well I don't think that analogy is really apt but I will take it as an attempt at hyperbole. In any case, I'm really referring to something very basic which is that mathematical novices often mistake notation as something inherently meaningful and as something other than what it is - simply a label. My point was that this answer (I think unintentionally) does nothing to dispel that idea. As you know, θ can refer to other things a statistician may encounter. For example, angles are often denoted by θ.
Macro
4
This explanation, although it is clear and technically correct, does not explicitly involve any distributions whatsoever, and thus appears not to be relevant to the quotation in the question.
whuber
1

In plain English:

Statistical distribution is a mathematical function f that tells you what is the probability of different values of your random variable X that has the distribution f, i.e. f(x) outputs a probability of x. There are different such a functions, but for now let consider f as some kind of "general" function.

However, for f to be universal, that is, one that is possible to apply to different data (that share similar properties), it needs parameters that change its shape so that it fits different data. A simple example of such a parameter is μ in normal distribution that tells where is the center (mean) of this distribution and so it can describe random variables with different mean values. Normal distribution has another parameter σ and other distributions also have at least one such a parameters. The parameters are often called θ, where for normal distribution θ is a shorthand for both μ and σ (i.e. is a vector of the two values).

Why is θ important? Statistical distributions are used to approximate the empirical distributions of data. Say you have dataset of ages of a group of people and on average they are 50 years old and you want to approximate the distribution of their ages using a normal distribution. If normal distribution didn't allow for different values of μ (e.g. had a fixed value of this parameter, say μ=0), then it would be useless for this data. However, since μ is not fixed, normal distribution could use different values of μ, with μ=50 being one of them. This is a simple example, but there are more complicated cases where the values of θ parameters are not so clear and so you have to use statistical tools for estimating (finding the most appropriate) θ values.

So you could say that statistics is about finding the best θ values given the data (Bayesians would say: given the data and priors).

Tim
sumber