Bagaimana persamaan cosinus berubah setelah transformasi linear?

9

Apakah ada hubungan matematis antara:

cosinus kesamaan $\operatorname{sim}(A, B)$ dari dua vektor $A$ dan $B$ , dan
kesamaan $\operatorname{sim}(MA, MB)$ dari $A$ dan $B$ , diskalakan secara tidak seragam melalui matriks diberikan $M$ ? Di sini $M$ adalah matriks diagonal yang diberikan dengan elemen yang tidak sama pada diagonal.

Saya mencoba membahas perhitungan, tetapi tidak dapat mencapai tautan sederhana / menarik (ekspresi). Saya ingin tahu apakah ada satu.

Misalnya sudut tidak dipertahankan dalam penskalaan non-seragam, tetapi apa hubungan antara sudut asli dan yang setelah penskalaan non-seragam? Apa yang bisa dikatakan tentang hubungan antara satu set vektor S1 dan satu lagi vektor S2 - di mana S2 diperoleh dengan penskalaan S1 yang tidak seragam?

linear-algebra cosine-similarity turdus-merula
sumber

@whuber, terima kasih! Ya, M adalah matriks yang diberikan (matriks penskalaan - dengan demikian merupakan matriks diagonal, tidak ada batasan lain). Dalam arti tertentu, saya ingin tahu apa yang terjadi (dalam hal kesamaan cosinus untuk setiap pasangan vektor) dengan ruang vektor yang mengalami penskalaan non-linear.

turdus-merula

2

Mungkin perlu dicatat bahwa jika semua faktor skala adalah non-negatif (seperti yang diasumsikan secara alami), maka semua matriks positif pasti simetris dapat dianggap sebagai matriks "penskalaan". Hubungan yang Anda cari digunakan secara luas, antara lain , dalam studi dan deskripsi distorsi dalam proyeksi peta. Di sana, bunga berpusat pada sudut maksimum dan minimum pada permukaan bumi yang akan dikaitkan dengan dua arah tegak lurus pada peta. Ada hubungan langsung antara sudut-sudut ini dan rasio dari dua faktor skala.

Whuber

8

Karena sangat umum, dan perubahan dalam persamaan cosinus tergantung pada dan dan hubungannya dengan , tidak ada rumus pasti yang mungkin. Namun, ada batas praktis yang bisa dihitung untuk seberapa banyak kesamaan cosinus dapat berubah . Mereka dapat ditemukan dengan mengekstraksi sudut antara dan mengingat bahwa persamaan cosinus antara dan adalah nilai yang ditentukan, katakanlah (di mana adalah sudut antara dan $M$ $A$ $B$ $M$ $MA$ $MB$ $A$ $B$ $\cos(2\phi)$ $2\phi$ $A$ ). Jawabannya memberitahu kita berapa banyak setiap sudut mungkin bisa ditekuk oleh transformasi . $B$ $2\phi$ $M$

Perhitungannya mengancam akan berantakan. Beberapa pilihan notasi yang cerdas, bersama dengan beberapa penyederhanaan awal, mengurangi upaya. Ternyata solusi dalam dua dimensi mengungkapkan semua yang perlu kita ketahui. Ini adalah masalah yang bisa ditelusuri, tergantung hanya pada satu variabel nyata , yang mudah diselesaikan dengan menggunakan teknik Kalkulus. Argumen geometris sederhana memperluas solusi ini ke sejumlah dimensi . $\theta$ $n$

Pendahuluan matematika

Menurut definisi, kosinus sudut antara dua vektor dan diperoleh dengan menormalkannya dengan satuan panjang dan mengambil produknya. Jadi, $A$ $B$

A ' B ( A ' A ) ( B ' B ) - - - - - - - - - - \sqrt = cos (2 ϕ)

$\frac{A^\prime B}{\sqrt{(A^\prime A)\, (B^\prime B)}} = \cos(2\phi)$

dan, menulis , kosinus sudut antara gambar dan bawah transformasi adalah $\Sigma = M^\prime M$ $A$ $B$ $M$

( M A ) ' ( M B ) ( ( M A ) ' ( M A ) ) ( ( M B ) ' ( M B ) ) - - - - - - - - - - - - - - - - - - - - - - - \sqrt = A ' Σ B ( A ' Σ A ) ( B ' Σ B ) - - - - - - - - - - - - \sqrt . (1)

$\frac{(MA)^\prime (MB)}{\sqrt{((MA)^\prime (MA))\, ((MB)^\prime (MB))}} = \frac{A^\prime \Sigma B}{\sqrt{(A^\prime \Sigma A) (B^\prime \Sigma B)}}.\tag{1}$

Perhatikan bahwa hanya penting dalam analisis, $\Sigma$ bukan itu sendiri. Oleh karena itu kita dapat memanfaatkan Dekomposisi Nilai Singular (SVD) dari untuk menyederhanakan masalah. Ingatlah bahwa ini menyatakan sebagai produk (dari kanan ke kiri) dari matriks ortogonal , matriks diagonal , dan matriks ortogonal lain : $M$ $M$ $M$ $V^\prime$ $D$ $U$

M = U D V' .

$M = U\,D\,V^\prime.$

Dengan kata lain, ada dasar vektor istimewa (kolom ) yang bertindak dengan rescaling setiap secara terpisah oleh masuknya diagonal (yang saya akan memanggil ) dan setelah itu menerapkan rotasi (atau anti-rotasi) ke hasilnya. Rotasi akhir itu tidak akan mengubah panjang atau sudut apa pun dan karenanya tidak akan memengaruhi . Anda dapat melihat ini secara formal dengan perhitungan $e_1, \ldots, e_n$ $V$ $M$ $e_i$ $i^\text{th}$ $D$ $d_i$ $U$ $\Sigma$

Σ = M' M = (U D V')' (U D V') = V D (U' U) D V' = V D 2 V' .

$\Sigma = M^\prime M = (U D V^\prime)^\prime (U D V^\prime) = V D (U^\prime U) D V^\prime = V D^2 V^\prime.$

Akibatnya, untuk mempelajari kita dapat dengan bebas mengganti dengan matriks lain yang menghasilkan nilai yang sama dalam . Dengan memesan sehingga berkurang dalam ukuran (dan dengan asumsi tidak identik nol), pilihan adalah $\Sigma$ $M$ $(1)$ $e_i$ $d_i$ $M$ $M$

M = 1 d 1 D V' .

$M = \frac{1}{{d_1}} D V^\prime.$

Elemen diagonal adalah $(1/{d_1})D$

1 = d 1 / d 1 \geq λ 2 = d 2 / d 1 \geq λ 3 = d 3 / d 1 \geq \dots \geq λ n = d n / d 1 \geq 0.

$1 = d_1/d_1 \ge \lambda_2 = d_2/{d_1} \ge \lambda_3 = d_3/{d_1} \ge \cdots \ge \lambda_n = d_n/{d_1} \ge 0.$

Secara khusus, efek (apakah dalam bentuk aslinya atau diubah) pada semua sudut sepenuhnya ditentukan oleh fakta bahwa $M$

M e i = λ i e i .

$M e_i = \lambda_i e_i.$

Analisis kasus khusus

Misalkan . Karena mengubah panjang vektor tidak mengubah sudut di antara mereka, kita dapat mengasumsikan dan adalah vektor satuan. Dalam pesawat semua vektor tersebut dapat ditunjuk oleh sudut mereka membuat dengan , memungkinkan kita untuk menulis $n=2$ $A$ $B$ $e_1$

A = cos (θ - ϕ) e 1 + sin (θ - ϕ) e 2 .

$A = \cos(\theta-\phi)e_1 + \sin(\theta-\phi)e_2.$

Karena itu

B = cos (θ + ϕ) e 1 + sin (θ + ϕ) e 2 .

$B = \cos(\theta+\phi)e_1 + \sin(\theta+\phi)e_2.$

(Lihat gambar di bawah.)

Menerapkan sederhana: ia memperbaiki koordinat pertama dan dan mengalikan koordinat kedua mereka dengan . Oleh karena itu sudut dari ke adalah $M$ $A$ $B$ $\lambda_2$ $MA$ $MB$

f (θ) = arctan (λ 2 tan (θ + ϕ)) - arctan (λ 2 tan (θ - ϕ)) .

$f(\theta) = \arctan(\lambda_2 \tan(\theta+\phi)) - \arctan(\lambda_2 \tan(\theta-\phi)).$

Karena adalah fungsi kontinu, perbedaan sudut ini adalah fungsi kontinu . Bahkan, itu bisa dibedakan. Ini memungkinkan kita untuk menemukan sudut ekstrem dengan memeriksa nol turunan . Derivatif itu mudah untuk dihitung: itu adalah rasio fungsi trigonometri. Nol hanya dapat muncul di antara nol dari pembilangnya, jadi jangan repot-repot menghitung penyebutnya. Kami memperoleh $M$ $\theta$ $f^\prime(\theta)$

f' (θ) = λ 2 ( 1 - λ 2 ) ( λ 2 + 1 ) sin ( 2 θ ) sin ( 2 ϕ ) * .

$f^\prime(\theta) = \frac{\lambda_2(1-\lambda_2)(\lambda_2+1)\sin(2\theta)\sin(2\phi)}{*}.$

Kasus-kasus khusus , , dan mudah dipahami: mereka sesuai dengan situasi di mana adalah dari peringkat yang dikurangi (dan dengan demikian menekan semua vektor ke dalam sebuah garis); di mana adalah kelipatan dari matriks identitas; dan di mana dan adalah paralel (di mana sudut di antara mereka tidak dapat berubah, terlepas dari ). Kasus dihalangi oleh kondisi . $\lambda_2=0$ $\lambda_2=1$ $\phi=0$ $M$ $M$ $A$ $B$ $\theta$ $\lambda_2=-1$ $\lambda_2 \ge 0$

Terlepas dari kasus-kasus khusus ini, nol hanya terjadi di mana : yaitu, atau . Ini berarti bahwa garis ditentukan oleh membagi dua sudut . Kita sekarang tahu bahwa nilai-nilai ekstrim dari sudut antara dan harus berbaring di antara nilai-nilai , jadi mari kita menghitung mereka: $\sin(2\theta)=0$ $\theta=0$ $\theta=\pi/2$ $e_1$ $AB$ $MA$ $MB$ $f(\theta)$

f (0) f (π / 2) = arctan (λ 2 tan (ϕ)) - arctan (λ 2 tan (- ϕ)) = 2 arctan (λ 2 tan (ϕ)); = arctan (λ 2 tan (π / 2 + ϕ)) - arctan (λ 2 tan (π / 2 - ϕ)) = 2 arctan (λ 2 cot (- ϕ)) .

$\eqalign{ f(0) &= \arctan(\lambda_2 \tan(\phi)) - \arctan(\lambda_2 \tan(-\phi)) = 2\arctan(\lambda_2\tan(\phi)); \\ f(\pi/2) &= \arctan(\lambda_2 \tan(\pi/2+\phi)) - \arctan(\lambda_2 \tan(\pi/2-\phi)) = 2\arctan(\lambda_2\cot(-\phi)). }$

Cosinus yang sesuai adalah

cos (f (0)) = 1 - λ 2 2 tan ( ϕ ) 2 1 + λ 2 2 tan ( ϕ ) 2 (2)

$\cos(f(0)) = \frac{1 - \lambda_2^2 \tan(\phi)^2}{1 + \lambda_2^2 \tan(\phi)^2}\tag{2}$

dan

cos (f (π / 2)) = 1 - λ 2 2 cot ( ϕ ) 2 1 + λ 2 2 cot ( ϕ ) 2 = tan ( ϕ ) 2 - λ 2 2 tan ( ϕ ) 2 + λ 2 2 . (3)

$\cos(f(\pi/2)) = \frac{1 - \lambda_2^2 \cot(\phi)^2}{1 + \lambda_2^2 \cot(\phi)^2} = \frac{\tan(\phi)^2 - \lambda_2^2 }{\tan(\phi)^2 + \lambda_2^2}.\tag{3}$

Seringkali cukup untuk memahami bagaimana mendistorsi sudut kanan. Dalam hal ini, , mengarah ke , yang dapat Anda tancapkan ke formula sebelumnya. $M$ $2\phi=\pi/2$ $\tan(\phi) = \cot(\phi) = 1$

Perhatikan bahwa semakin kecil , semakin ekstrim sudut ini menjadi dan semakin besar distorsi. $\lambda_2$

Gambar ini menunjukkan empat konfigurasi vektor dan dipisahkan oleh sudut $A$ $B$ $2\phi = \pi/3$ . Lingkaran unit dan gambar elipsnya di bawah diarsir untuk referensi (dengan aksi secara seragam di-skala ulang untuk membuat ). Sosok judul menunjukkan nilai , titik tengah dan . Yang paling dekat dengan dan dapat datang ketika ditransformasikan oleh adalah konfigurasi seperti di sebelah kiri dengan $M$ $M$ $\lambda_1=1$ $\theta$ $A$ $B$ $A$ $B$ $M$ . Jarak terjauh mereka adalah konfigurasi seperti di kanan dengan . Dua kemungkinan menengah ditampilkan. $\theta=0$ $\theta=\pi/2$

Solusi untuk semua dimensi

Kita telah melihat bagaimana bertindak dengan memperluas setiap dimensi dengan faktor . Ini akan mendistorsi unit sphere $M$ $i$ $\lambda_i$ ke dalam ellipsoid. The menentukan sumbu utamanya. The adalah jarak dari asal, sepanjang sumbu ini, untuk ellipsoid. Akibatnya yang terkecil, , adalahjarak terpendek(ke segala arah) dari asal ke ellipsoid dan yang terbesar, , adalahjarak terjauh(ke segala arah) dari asal ke ellipsoid. $\{A\,|\, A^\prime A = 1\}$ $e_i$ $\lambda_i$ $\lambda_n$ $\lambda_1$

Dalam dimensi yang lebih tinggi, $n\gt 2$ , dan adalah bagian dari subruang dua dimensi. memetakan lingkaran satuan di ruang bagian ini ke persimpangan ellipsoid dengan pesawat yang berisi dan . Persimpangan ini, menjadi distorsi linear dari sebuah lingkaran, adalah elips. Jelas jarak terjauh ke elips ini tidak lebih dari dan jarak terpendek tidak kurang dari . $A$ $B$ $M$ $MA$ $MB$ $\lambda_1=1$ $\lambda_n$

Seperti yang kami amati pada akhir bagian sebelumnya, kemungkinan paling ekstrem adalah ketika dan terletak di bidang yang berisi dua dari mana rasio yang sesuai sekecil mungkin. Ini akan terjadi di bidang . Kami sudah punya solusi untuk kasus itu. $A$ $B$ $e_i$ $\lambda_i$ $e_1, e_n$

Kesimpulan

Ekstrem kesamaan cosinus dapat dicapai dengan menerapkan ke dua vektor yang memiliki cosinus similarity diberikan oleh dan $M$ $\cos(2\phi)$ $(2)$ $(3)$ . Mereka diperoleh dengan menempatkan dan pada sudut yang sama dengan arah di mana secara maksimal memperpanjang vektor apa pun (seperti arah ) dan memisahkannya ke arah di mana memanjang vektor secara minimal (seperti arah). $A$ $B$ $\Sigma=M^\prime M$ $e_1$ $\Sigma$ $e_n$

Ekstrim ini dapat dihitung dalam hal SVD dari . $M$

whuber
sumber

Ini jawaban yang fantastis! Terima kasih banyak atas diskusi terperinci ini! Saya percaya bahwa Anda memiliki kesalahan tanda dalam eqn (3) di mana Anda seharusnya hanya memiliki tanda minus keseluruhan.

LFH

Saya tertarik pada kasus di mana sudut

mendekati nol dan saya ingin mendapatkan ketimpangan antara

dan

. Apakah benar bahwa berdasarkan perhitungan Anda, saya hanya perlu untuk menemukan yang paling ekstrim (yang terkecil)

dan dalam hal ini, ketimpangan asimtotik diberikan oleh

2ϕ $2\phi$

f $f$

λn $\lambda_n$

sebagai

? 2λnϕ≤f≤2λ−1nϕ $2\lambda_n\phi\leq f\leq 2\lambda_n^{-1}\phi$

ϕ→0 $\phi\to0$

LFH

6

Anda mungkin tertarik pada:

(M A, M B) = A T (M T M) B,

$(MA,MB)=A^T(M^TM)B,$

Anda dapat mendiagonalisasi (atau seperti yang Anda sebut, PCA), yang memberitahu Anda bahwa kesamaan dalam transformasi $M^TM=U\Sigma U^T$ $A,B$ $M$ berperilaku dengan memproyeksikan ke komponen utama Anda, dan kemudian menghitung kesamaan di ruang baru ini. Untuk menyempurnakan ini sedikit lebih banyak, biarkan komponen utama menjadi dengan nilai eigen . Kemudian $A,B$ $u_i$ $\lambda_i$

U B = \sum i (u i, b i) u i, U A = \sum i (u i, a i) u i,

$UB=\sum_i(u_i,b_i)u_i, \ UA=\sum_i(u_i,a_i)u_i,$

yang memberi Anda:

(M A, M B) = \sum i = 1 n (u i, a i) (u i, b i) λ i .

$(MA,MB)=\sum_{i=1}^n (u_i,a_i)(u_i,b_i)\lambda_i.$

Perhatikan bahwa ada penskalaan yang terjadi di sini: stretching / shrinking. Ketika adalah vektor satuan dan jika setiap , maka sesuai dengan rotasi, dan Anda mendapatkan: , yang setara dengan mengatakan bahwa produk dalam tidak berubah dalam rotasi. Secara umum, sudut tetap sama ketika adalah transformasi konformal, yang dalam hal ini mengharuskan $\lambda_i$ $A,B$ $\lambda_i=1$ $M$ $\mbox{sim}(MA,MB)=\mbox{sim}(A,B)$ $M$ $M$ dibalik dan dekomposisi kutub memenuhi dengan , yaitu . $M$ $M=OP$ $P=aI$ $M^TM=a^2I$

Alex R.
sumber

1

Pernyataan awal Anda tentang masalah mengabaikan normalisasi vektor

,

, dan

diperlukan untuk menghitung persamaan cosinus. Tampaknya tidak ada analisis selanjutnya yang membahas normalisasi ini. Perhatikan, khususnya, bahwa persamaan cosinus dipertahankan bahkan ketika semua nilai eigen sama dengan beberapa nilai (positif) yang berbeda dari

. Itu menunjukkan, bahkan dalam kasus sederhana ini, banyak hal yang dapat dikatakan. A $A$

B $B$

MA $MA$

MB $MB$

1 $1$

Whuber

@whuber: kesamaan cosinus dipertahankan persis ketika

adalah transformasi konformal, yang dalam hal ini setara dengan mengharuskan

untuk dapat dibalik dan

, kelipatan dari identitas. Kata lain, dekomposisi kutub

memenuhi

, di mana

. Kau benar tentang normalisasi tapi, tampaknya konyol untuk berbicara tentang cosine similarity dengan vektor non-normalisasi

. M $M$

M $M$

MTM=a2I $M^TM=a^2I$

M $M$

M=OP $M=OP$

P=aI $P=aI$

$A,B$

Alex R.

2

Sama sekali tidak konyol! Karena "kesamaan" ini diberikan oleh cosinus sudut antara vektor, masuk akal untuk dua vektor bukan nol. Yang saya maksud dengan "lebih dapat dikatakan" adalah bahwa batas efektif pada sudut antara gambar

dan

dapat diperoleh dalam hal sudut antara

dan

dan nilai eigen dari

. $A$

$B$

$A$

$B$

$M$

whuber

Bagaimana persamaan cosinus berubah setelah transformasi linear?

Jawaban:

Pendahuluan matematika

Analisis kasus khusus

Solusi untuk semua dimensi

Kesimpulan