Klarifikasi dalam geometri informasi

10

Pertanyaan ini berkaitan dengan makalah Diferensial Geometri Keluarga Kurva Eksponensial-Lengkung dan Kehilangan Informasi oleh Amari.

Teksnya sebagai berikut.

Biarkan menjadi manifold dimensi dari distribusi probabilitas dengan sistem koordinat , di mana diasumsikan ...n θ = ( θ 1 , , θ n ) p θ ( x ) > 0Sn={pθ}nθ=(θ1,,θn)pθ(x)>0

Kami dapat menganggap setiap titik dari membawa fungsi dari ...S n log p θ ( x ) xθSnlogpθ(x)x

Biarkan menjadi ruang singgung di , yang, secara kasar, diidentifikasi dengan versi linear dari lingkungan kecil di . Biarkan menjadi dasar alami dari terkait dengan sistem terkoordinasi ... S n θ θ S n e i ( θ ) , i = 1 , , n T θTθSnθθSnei(θ),i=1,,nTθ

Karena setiap titik dari membawa fungsi dari , adalah wajar untuk menganggap di sebagai mewakili fungsiS n log p θ ( x ) x e i ( θ ) θ e i ( θ ) = θSnlogpθ(x)xei(θ)θ

ei(θ)=θilogpθ(x).

Saya tidak mengerti pernyataan terakhir. Ini muncul di bagian 2 dari makalah yang disebutkan di atas. Bagaimana dasar ruang tangen diberikan oleh persamaan di atas? Akan sangat membantu jika seseorang di komunitas ini yang akrab dengan materi semacam ini dapat membantu saya memahami hal ini. Terima kasih.


Pembaruan 1:

Walaupun saya setuju bahwa (dari @aginensky) jika bebas linear maka juga linier independen, bagaimana ini adalah anggota ruang singgung di tempat pertama tidak terlalu jelas. Jadi bagaimana dapat dianggap sebagai dasar untuk ruang tangen. Bantuan apa pun dihargai.θipθθilogpθθilogpθ

Pembaruan 2:

@aginensky: Dalam bukunya Amari mengatakan yang berikut:

Mari kita perhatikan kasus di mana , himpunan semua probabilitas probabilitas positif (ketat) pada , di mana kami menganggap sebagai bagian dari . Sebenarnya, adalah subset terbuka dari ruang affine .Sn=P(X)X={x0,,xn}P(X)RX={X|X:XR}P(X){X|xX(x)=1}

Maka ruang tangen dari di setiap titik secara alami dapat diidentifikasi dengan subruang linear . Untuk dasar alami dari sistem coordiante , kami memiliki .Tp(Sn)SnA0={X|xX(x)=0}θiθ=(θ1,,θn)(θi)θ=θipθ

Selanjutnya, mari kita ambil embedding , dan identifikasikan dengan subset dari . Vektor singgung kemudian diwakili oleh hasil operasi ke , yang kami tunjukkan dengan . Secara khusus kami memiliki . Jelas bahwa dan plogpSnlogSn:={logp|pSn}RXXTp(Sn)XplogpX(e)(θi)θ(e)=θilogpθX(e)=X(x)/p(x)

Tp(e)(Sn)={X(e)|XTp(Sn)}={ARX|xA(x)p(x)=0}.

Pertanyaan saya: Jika keduanya dan adalah dasar untuk ruang singgung maka apakah ini tidak akan bertentangan dengan fakta bahwa dan berbeda dan ?θi(θi)(e)TpTp(e)θi(e)Tp(e)

Saya kira tampaknya ada hubungan antara ( ) dan . Jika Anda dapat mengklarifikasi ini, itu akan sangat membantu. Anda bisa memberikannya sebagai jawaban.Sn,Tp(logSn,Tp(e))

Ashok
sumber
Secara pribadi, saya mengerti kebingungan Anda. Tampaknya tidak wajar menggunakan koordinat " " untuk ruang singgung. Pertanyaan Anda bersifat lokal, jadi kami dapat menggunakan sebagai koordinat lokal. Koordinat biasa untuk ruang tangen adalah . Mengingat kondisi yang wajar pada kelancaran, turunan tidak hilang, dll., Maka dengan aturan rantai, seseorang mengambil basis standar ruang tangen dan mengalikannya dengan fungsi, yang secara umum, masih akan menjadi dasar . ei(θ)=θilogpθ(x)θiθipθ
meh
Saya mencoba mengedit komentar saya untuk kejelasan dan tidak diizinkan. Beri tahu saya jika Anda ingin detail lebih lanjut.
meh
Terima kasih @aginensky: Maksud Anda, karena , ini juga merupakan dasar untuk ruang tangen, kan? θilogpθ(x)=1/pθ(x)θipθ(x)
Ashok
Pernyataan terakhir adalah versi (rusak) dari satu definisi ruang singgung. Sebenarnya, ruang singgung pada titik manifold terdiferensiasi adalah (ruang vektor) ganda untuk ruang derivasi kuman fungsi terdiferensiasi di lingkungan titik itu. Dasar untuk dual adalah dan, menurut definisi , adalah basis gandanya. Referensi standar pada materi ini adalah Volume 1 dari Diferensial Geometri Michael Spivak , amazon.com/… . {dθi}{θi}
whuber
@ Ashok - ya. Saya akan mempertimbangkan apa yang saya tulis didasarkan pada versi singkat dari satu definisi ruang singgung. Tentu saja karena ruang cotangent adalah dua kali lipat dari ruang tangen, orang dapat juga berpendapat bahwa adalah basis ganda sejati. Bagaimanapun juga selama tidak hilang, saya pikir Anda baik-baik saja. dθpθ
meh

Jawaban:

2

Komentar saya sangat panjang, saya menempatkannya sebagai jawaban.

Saya pikir pertanyaannya lebih filosofis daripada matematika pada saat ini. Yaitu, apa yang Anda maksud dengan spasi, dan dalam hal ini, bermacam-macam? Definisi tipikal dari bermacam-macam tidak melibatkan penyisipan ke dalam ruang afin. Ini adalah pendekatan 'modern' (150 tahun?). Sebagai contoh, bagi Gauss, manifold adalah manifold dengan embedding spesifik ke dalam ruang affine tertentu ( ). Jika seseorang memiliki manifold dengan penyisipan dalam , maka ruang tangen (pada titik mana pun dari manifold) adalah isomorfik ke subruang spesifik dari ruang tangen menjadi pada titik itu. Perhatikan bahwa ruang singgung ke pada titik mana pun diidentifikasi dengan 'sama' . RnRnRnRnRn

Saya pikir intinya adalah bahwa dalam artikel Amari, ruang yang dia sebut sebagai dilengkapi dengan beberapa 'alami' penanaman dalam ruang affine dengan koordinat mana dapat dipertimbangkan sebagai koordinat pada ruang singgung dari . Saya mungkin menambahkan bahwa itu hanya jelas jika fungsi 'umum' dalam beberapa hal - untuk degenerasi , ini akan gagal. Misalnya jika fungsi tidak melibatkan semua variabel . Poin utamanya adalah bahwa penyisipan manifold ini dalam , memunculkan identifikasi spesifik ruang bersinggungan denganθ i p θ S n p p θ iSnθipθSnppθiRnpθ. Poin berikutnya adalah karena properti , ia dapat memetakan manifoldnya menggunakan fungsi log ke ruang affine lain di mana ruang tangen memiliki identifikasi yang berbeda dalam hal koordinat baru (log dan turunannya). Dia kemudian mengatakan bahwa karena sifat-sifat situasinya, dua manifold adalah isomorfik dan peta menginduksi isomorfisme pada ruang bersinggungan. Itu mengarah pada identifikasi (yaitu, isomorfisme) dari dua ruang singgung. p

Gagasan kuncinya adalah bahwa dua ruang singgung bukan set yang sama, tetapi isomorfis (yang pada dasarnya adalah bahasa Yunani untuk 'sama') setelah identifikasi yang benar. Sebagai contoh, apakah grup dari semua permutasi dari grup 'sama' dengan grup dari semua permutasi dari ? Sebagai eksperimen pemikiran sederhana, pertimbangkan , pemetaan real positif ke , semua real di bawah log peta. Pilih bilangan real favorit Anda dan pertimbangkan apa peta itu pada ruang singgung. Apakah saya akhirnya memahami pertanyaan Anda? Peringatan ada dalam urutan, yaitu bahwa geometri diferensial bukanlah bidang keahlian utama saya. Saya pikir saya sudah benar, tetapi jangan ragu untuk mengkritik atau masih mempertanyakan jawaban ini.{ a , b , c } R + R > 0{1,2,3}{a,b,c}R+R>0

meh
sumber
Arti Anda tentang "isomorfik" tidak sepenuhnya jelas, tetapi tampaknya hanya sangat lemah; yaitu, yang diberikan oleh pushforward dari peta yang dapat dibedakan yang dapat dibalik, yang hanya merupakan beberapa transformasi linear yang dapat dibalik. Gagasan kunci untuk melakukan geometri adalah mendapatkan metrik Riemanninan yang bermakna dan berguna yang didefinisikan pada manifold. Arti "isomorfisme" yang relevan adalah isometri : yaitu, peta antara ruang singgung harus menjaga jarak. f
whuber
@whuber. Memang, komentar saya hanya pada geometri diferensial dari situasi dan ruang singgung. Saya sama sekali tidak jelas tentang kondisi apa pada akan diperlukan untuk membuat peta menjadi isometry. Tetapi ketika saya memahami pertanyaan itu, itu benar-benar mendapatkan apa perbedaan antara identifikasi ('sama') dan isomorfisme. p
meh
@whuber: Metrik Riemannian yang relevan di sini diberikan oleh , di mana . Apakah ini menyarankan juga dapat dianggap sebagai vektor singgung? g i , j = x i p θ ( x ) j log p θ ( x ) j log p θG=[gi,j]gi,j=xipθ(x) jlogpθ(x)jlogpθ
Ashok