Mengapa divergensi KL adalah non-negatif?

Mengapa divergensi KL non-negatif?

Dari perspektif teori informasi, saya memiliki pemahaman yang intuitif:

Katakanlah ada dua ansambel $A$ dan $B$ yang terdiri dari himpunan elemen yang sama dengan label $x$ . $p(x)$ dan $q(x)$ adalah distribusi probabilitas yang berbeda atas masing-masing ensemble $A$ dan $B$

Dari perspektif teori informasi, adalah sedikitnya jumlah bit yang diperlukan untuk merekam elemen untuk ensemble . Sehingga harapan dapat diartikan sebagai setidaknya berapa banyak bit yang kita butuhkan untuk merekam elemen di rata-rata. $\log_{2}(P(x))$ $x$ $A$

\sum_{x \in e n s e m b l e} - p (x) \ln (p (x))

$\sum_{x \in ensemble}-p(x)\ln(p(x))$

A

$A$

Karena rumus ini menempatkan batas bawah pada bit yang kita butuhkan rata-rata, sehingga untuk ansambel yang berbeda yang menghasilkan distribusi probabilitas berbeda , batasan yang diberikannya untuk setiap elemen pasti tidak akan menggigit yang diberikan oleh , yang berarti mengambil ekspektasi, $B$ $q(x)$ $x$ $p(x)$

\sum_{x \in e n s e m b l e} - p (x) \ln (q (x))

$\sum_{x\in ensemble}-p(x)\ln(q(x))$ Rata-rata lama ini pasti akan lebih besar dari yang pertama satu, yang mengarah ke

Saya tidak menaruh

sini karena

dan

berbeda.

\sum_{x \in e n s e m b l e} p (x) \frac{\ln (p (x))}{\ln (q (x))} > 0

$\sum_{x\in ensemble }p(x)\frac{\ln(p(x))}{\ln(q(x))} > 0$

\geq

$\ge$

p (x)

$p(x)$

q (x)

$q(x)$

Ini adalah pemahaman intuitif saya, apakah ada cara yang murni matematis untuk membuktikan perbedaan KL adalah non-negatif? Masalahnya dapat dinyatakan sebagai:

Diberikan dan keduanya positif atas garis nyata, dan , . Buktikan $p(x)$ $q(x)$ $\int_{-\infty}^{+\infty}p(x)dx = 1$ $\int_{-\infty}^{+\infty}q(x)dx = 1$ adalah non-negatif.

\int_{- \infty}^{+ \infty} p (x) \ln \frac{p (x)}{q (x)}

$\int_{-\infty}^{+\infty}p(x)\ln\frac{p(x)}{q(x)}$

Bagaimana ini bisa dibuktikan? Atau dapatkah ini dibuktikan tanpa syarat tambahan?

information-theory kullback-leibler meTchaikovsky
sumber

Jika Anda memahami bukti ketidaksamaan Fano, mudah untuk mendapatkan nonnegativitas dari entropi relatif.

Lerner Zhang

Jawaban:

Bukti 1:

$\ln a \leq a-1$ $a \gt 0$

$-D_{KL}(p||q) \leq 0$ $D_{KL}(p||q) \geq 0$

\begin{aligned} - D (hal | | q) & = - \sum_{x} hal (x) dalam \frac{hal (x)}{q (x)} \\ = \sum_{x} hal (x) dalam \frac{q (x)}{hal (x)} \\ \overset{(Sebuah)}{\leq} \sum_{x} hal (x) (\frac{q (x)}{hal (x)} - 1) \\ = \sum_{x} q (x) - \sum_{x} hal (x) \\ = 1 - 1 \\ = 0 \end{aligned}

$\begin{align} -D(p||q)&=-\sum_x p(x)\ln \frac{p(x)}{q(x)}\\ &= \sum_x p(x)\ln \frac{q(x)}{p(x)}\\ &\stackrel{\text{(a)}}{\leq} \sum_x p(x)\left(\frac{q(x)}{p(x)}-1\right)\\ &=\sum_x q(x) - \sum_x p(x)\\ &= 1 - 1\\ &= 0 \end{align}$

Untuk ketidaksetaraan (a) kami menggunakan $\ln$ ketimpangan dijelaskan di awal.

Alternatively you can start with Gibbs' inequality which states:

- \sum_{x} p (x) \log_{2} p (x) \leq - \sum_{x} p (x) \log_{2} q (x)

$-\sum_x p(x) \log_2 p(x) \leq -\sum_x p(x)\log_2 q(x)$

Then if we bring the left term to the right we get:

\sum_{x} p (x) \log_{2} p (x) - \sum_{x} p (x) \log_{2} q (x) \geq 0 \sum_{x} p (x) \log_{2} \frac{p (x)}{q (x)} \geq 0

$\sum_x p(x) \log_2 p(x) - \sum_x p(x)\log_2 q(x)\geq 0 \\ \sum_x p(x)\log_2 \frac{p(x)}{q(x)}\geq 0$

The reason I am not including this as a separate proof is because if you were to ask me to prove Gibbs' inequality, I would have to start from the non-negativity of KL divergence and do the same proof from the top.

Proof 2: We use the Log sum inequality:

\sum_{i = 1}^{n} a_{i} \log_{2} \frac{a_{i}}{b_{i}} \geq (\sum_{i = 1}^{n} a_{i}) \log_{2} \frac{\sum_{i = 1}^{n} a_{i}}{\sum_{i = 1}^{n} b_{i}}

$\sum_{i=1}^{n} a_i \log_2 \frac{a_i}{b_i} \geq \left(\sum_{i=1}^{n} a_i\right)\log_2\frac{\sum_{i=1}^{n} a_i}{\sum_{i=1}^{n} b_i}$

Then we can show that $D_{KL}(p||q) \geq 0$ :

\begin{aligned} D (p | | q) & = \sum_{x} p (x) \log_{2} \frac{p (x)}{q (x)} \\ \overset{(b)}{\geq} (\sum_{x} p (x)) \log_{2} \frac{\sum_{x} p (x)}{\sum_{x} q (x)} \\ = 1 \cdot \log_{2} \frac{1}{1} \\ = 0 \end{aligned}

$\begin{align} D(p||q)&=\sum_x p(x)\log_2 \frac{p(x)}{q(x)}\\ &\stackrel{\text{(b)}}{\geq} \left(\sum_x p(x)\right)\log_2\frac{\sum_x p(x)}{\sum_x q(x)}\\ &=1 \cdot \log_2 \frac{1}{1}\\ &=0 \end{align}$

where we have used the Log sum inequality at (b).

Proof 3:

(Taken from the book "Elements of Information Theory" by Thomas M. Cover and Joy A. Thomas)

\begin{aligned} - D (p | | q) & = - \sum_{x} p (x) \log_{2} \frac{p (x)}{q (x)} \\ = \sum_{x} p (x) \log_{2} \frac{q (x)}{p (x)} \\ \overset{(c)}{\leq} \log_{2} \sum_{x} p (x) \frac{q (x)}{p (x)} \\ = \log_{2} 1 \\ = 0 \end{aligned}

$\begin{align} -D(p||q)&=-\sum_x p(x)\log_2 \frac{p(x)}{q(x)}\\ &= \sum_x p(x)\log_2 \frac{q(x)}{p(x)}\\ &\stackrel{\text{(c)}}{\leq} \log_2 \sum_x p(x)\frac{q(x)}{p(x)}\\ &=\log_2 1\\ &=0 \end{align}$

where at (c) we have used Jensen's inequality and the fact that $\log$ is a concave function.

Andreas G.
sumber