Bagaimana persamaan cosinus berubah setelah transformasi linear?

9

Apakah ada hubungan matematis antara:

  • cosinus kesamaan sim ( A , B )sim(A,B) dari dua vektor AA dan BB , dan
  • sim kesamaan siminus ( M A , M B )sim(MA,MB) dari AA dan BB , diskalakan secara tidak seragam melalui matriks M yang diberikan M? Di sini MM adalah matriks diagonal yang diberikan dengan elemen yang tidak sama pada diagonal.

Saya mencoba membahas perhitungan, tetapi tidak dapat mencapai tautan sederhana / menarik (ekspresi). Saya ingin tahu apakah ada satu.


Misalnya sudut tidak dipertahankan dalam penskalaan non-seragam, tetapi apa hubungan antara sudut asli dan yang setelah penskalaan non-seragam? Apa yang bisa dikatakan tentang hubungan antara satu set vektor S1 dan satu lagi vektor S2 - di mana S2 diperoleh dengan penskalaan S1 yang tidak seragam?

turdus-merula
sumber
@whuber, terima kasih! Ya, M adalah matriks yang diberikan (matriks penskalaan - dengan demikian merupakan matriks diagonal, tidak ada batasan lain). Dalam arti tertentu, saya ingin tahu apa yang terjadi (dalam hal kesamaan cosinus untuk setiap pasangan vektor) dengan ruang vektor yang mengalami penskalaan non-linear.
turdus-merula
2
Mungkin perlu dicatat bahwa jika semua faktor skala adalah non-negatif (seperti yang diasumsikan secara alami), maka semua matriks positif pasti simetris dapat dianggap sebagai matriks "penskalaan". Hubungan yang Anda cari digunakan secara luas, antara lain , dalam studi dan deskripsi distorsi dalam proyeksi peta. Di sana, bunga berpusat pada sudut maksimum dan minimum pada permukaan bumi yang akan dikaitkan dengan dua arah tegak lurus pada peta. Ada hubungan langsung antara sudut-sudut ini dan rasio dari dua faktor skala.
Whuber

Jawaban:

8

Karena M sangat umum, dan perubahan dalam persamaan cosinus tergantung pada A dan B tertentu dan hubungannya dengan M , tidak ada rumus pasti yang mungkin. Namun, ada batas praktis yang bisa dihitung untuk seberapa banyak kesamaan cosinus dapat berubah . Mereka dapat ditemukan dengan mengekstraksi sudut antara M A dan M B mengingat bahwa persamaan cosinus antara A dan B adalah nilai yang ditentukan, katakanlah cos ( 2 ϕ ) (di mana 2 ϕ adalah sudut antara A danMABMMAMBABcos(2ϕ)2ϕAB ). Jawabannya memberitahu kita berapa banyak setiap sudut 2 φ mungkin bisa ditekuk oleh transformasi M .B2ϕM

Perhitungannya mengancam akan berantakan. Beberapa pilihan notasi yang cerdas, bersama dengan beberapa penyederhanaan awal, mengurangi upaya. Ternyata solusi dalam dua dimensi mengungkapkan semua yang perlu kita ketahui. Ini adalah masalah yang bisa ditelusuri, tergantung hanya pada satu variabel nyata θ , yang mudah diselesaikan dengan menggunakan teknik Kalkulus. Argumen geometris sederhana memperluas solusi ini ke sejumlah dimensi n .θn

Pendahuluan matematika

Menurut definisi, kosinus sudut antara dua vektor A dan B diperoleh dengan menormalkannya dengan satuan panjang dan mengambil produknya. Jadi,AB

A B( A A )( B B ) =cos(2ϕ)

AB(AA)(BB)=cos(2ϕ)

dan, menulis Σ = M M , kosinus sudut antara gambar A dan B di bawah transformasi M adalahΣ=MMABM

( M A ) ( M B )( ( M A ) ' ( M A ) )( ( M B ) ( M B ) ) =AΣB( A Σ A ) ( B Σ B ) .

(MA)(MB)((MA)(MA))((MB)(MB))=AΣB(AΣA)(BΣB).(1)

Perhatikan bahwa hanya Σ yang penting dalam analisis,Σ bukan M itu sendiri. Oleh karena itu kita dapat memanfaatkan Dekomposisi Nilai Singular (SVD) dari M untuk menyederhanakan masalah. Ingatlah bahwa ini menyatakan M sebagai produk (dari kanan ke kiri) dari matriks ortogonal V , matriks diagonal D , dan matriks ortogonal lain U :MMMVDU

M = UDV .

M=UDV.

Dengan kata lain, ada dasar vektor istimewa e 1 , ... , e n (kolom V ) yang M bertindak dengan rescaling setiap e i secara terpisah oleh i th masuknya diagonal D (yang saya akan memanggil d i ) dan setelah itu menerapkan rotasi (atau anti-rotasi) U ke hasilnya. Rotasi akhir itu tidak akan mengubah panjang atau sudut apa pun dan karenanya tidak akan memengaruhi Σ . Anda dapat melihat ini secara formal dengan perhitungane1,,enVMeiithDdiUΣ

Σ = M M = ( U D V ) ( U D V ) = V D ( U U ) D V = V D 2 V .

Σ=MM=(UDV)(UDV)=VD(UU)DV=VD2V.

Akibatnya, untuk mempelajari Σ kita dapat dengan bebas mengganti M dengan matriks lain yang menghasilkan nilai yang sama dalam ( 1 ) . Dengan memesan e i sehingga d i berkurang dalam ukuran (dan dengan asumsi M tidak identik nol), pilihan M yang bagus adalahΣM(1)eidiMM

M = 1d 1 DV.

M=1d1DV.

Elemen diagonal ( 1 / d 1 ) D adalah(1/d1)D

1 = d 1 / d 1λ 2 = d 2 / d 1λ 3 = d 3 / d 1λ n = d n / d 10.

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

Secara khusus, efek M (apakah dalam bentuk aslinya atau diubah) pada semua sudut sepenuhnya ditentukan oleh fakta bahwaM

M e i = λ i e i .

Mei=λiei.

Analisis kasus khusus

Misalkan n = 2 . Karena mengubah panjang vektor tidak mengubah sudut di antara mereka, kita dapat mengasumsikan A dan B adalah vektor satuan. Dalam pesawat semua vektor tersebut dapat ditunjuk oleh sudut mereka membuat dengan e 1 , memungkinkan kita untuk menulisn=2ABe1

A = cos ( θ - ϕ ) e 1 + sin ( θ - ϕ ) e 2 .

A=cos(θϕ)e1+sin(θϕ)e2.

Karena itu

B = cos ( θ + ϕ ) e 1 + sin ( θ + ϕ ) e 2 .

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(Lihat gambar di bawah.)

Menerapkan M sederhana: ia memperbaiki koordinat pertama A dan B dan mengalikan koordinat kedua mereka dengan λ 2 . Oleh karena itu sudut dari M A ke M B adalahMABλ2MAMB

f ( θ ) = arctan ( λ 2 tan ( θ + ϕ ) ) - arctan ( λ 2 tan ( θ - ϕ ) ) .

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

Karena M adalah fungsi kontinu, perbedaan sudut ini adalah fungsi kontinu θ . Bahkan, itu bisa dibedakan. Ini memungkinkan kita untuk menemukan sudut ekstrem dengan memeriksa nol turunan f ( θ ) . Derivatif itu mudah untuk dihitung: itu adalah rasio fungsi trigonometri. Nol hanya dapat muncul di antara nol dari pembilangnya, jadi jangan repot-repot menghitung penyebutnya. Kami memperolehMθf(θ)

f ( θ ) = λ 2 ( 1 - λ 2 ) ( λ 2 + 1 ) dosa ( 2 θ ) dosa ( 2 ϕ ) .

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

Kasus-kasus khusus λ 2 = 0 , λ 2 = 1 , dan ϕ = 0 mudah dipahami: mereka sesuai dengan situasi di mana M adalah dari peringkat yang dikurangi (dan dengan demikian menekan semua vektor ke dalam sebuah garis); di mana M adalah kelipatan dari matriks identitas; dan di mana A dan B adalah paralel (di mana sudut di antara mereka tidak dapat berubah, terlepas dari θ ). Kasus λ 2 = - 1 dihalangi oleh kondisi λ 20 .λ2=0λ2=1ϕ=0MMABθλ2=1λ20

Terlepas dari kasus-kasus khusus ini, nol hanya terjadi di mana dosa ( 2 θ ) = 0 : yaitu, θ = 0 atau θ = π / 2 . Ini berarti bahwa garis ditentukan oleh e 1 membagi dua sudut A B . Kita sekarang tahu bahwa nilai-nilai ekstrim dari sudut antara M A dan M B harus berbaring di antara nilai-nilai f ( θ ) , jadi mari kita menghitung mereka:sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)

f ( 0 ) = arctan ( λ 2 tan ( ϕ ) ) - arctan ( λ 2 tan ( - ϕ ) ) = 2 arctan ( λ 2 tan ( ϕ ) ) ; f ( π / 2 ) = arctan ( λ 2 tan ( π / 2 + ϕ ) ) - arctan( λ 2 tan ( π / 2 - ϕ ) ) = 2 arctan ( λ 2 cot ( - ϕ ) ) .

f(0)f(π/2)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

Cosinus yang sesuai adalah

cos ( f ( 0 ) ) = 1 - λ 2 2 tan ( ϕ ) 21 + λ 2 2 tan ( ϕ ) 2

cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2(2)

dan

cos ( f ( π / 2 ) ) = 1 - λ 2 2 cot ( ϕ ) 21 + λ 2 2 cot ( ϕ ) 2 =tan(ϕ)2-λ 2 2tan ( ϕ ) 2 + λ 2 2 .

cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.(3)

Seringkali cukup untuk memahami bagaimana M mendistorsi sudut kanan. Dalam hal ini, 2 ϕ = π / 2 , mengarah ke tan ( ϕ ) = cot ( ϕ ) = 1 , yang dapat Anda tancapkan ke formula sebelumnya.M2ϕ=π/2tan(ϕ)=cot(ϕ)=1

Perhatikan bahwa semakin kecil λ 2 , semakin ekstrim sudut ini menjadi dan semakin besar distorsi.λ2

Figure showing four configurations

Gambar ini menunjukkan empat konfigurasi vektor A dan B yang dipisahkan oleh sudut 2 ϕ = π / 3AB2ϕ=π/3 . Lingkaran unit dan gambar elipsnya di bawah M diarsir untuk referensi (dengan aksi M secara seragam di-skala ulang untuk membuat λ 1 = 1 ). Sosok judul menunjukkan nilai θ , titik tengah A dan B . Yang paling dekat dengan A dan B dapat datang ketika ditransformasikan oleh M adalah konfigurasi seperti di sebelah kiri dengan θ =MMλ1=1θABABM0 . Jarak terjauh mereka adalah konfigurasi seperti di kanan dengan θ = π / 2 . Dua kemungkinan menengah ditampilkan.θ=0θ=π/2

Solusi untuk semua dimensi

Kita telah melihat bagaimana M bertindak dengan memperluas setiap dimensi i dengan faktor λ i . Ini akan mendistorsi unit sphere { AMiλi|A A = 1 } ke dalam ellipsoid. The e i menentukan sumbu utamanya. The λ i adalah jarak dari asal, sepanjang sumbu ini, untuk ellipsoid. Akibatnya yang terkecil, λ n , adalahjarak terpendek(ke segala arah) dari asal ke ellipsoid dan yang terbesar, λ 1 , adalahjarak terjauh(ke segala arah) dari asal ke ellipsoid.{A|AA=1}eiλiλnλ1

Dalam dimensi yang lebih tinggi, n > 2n>2 , A dan B adalah bagian dari subruang dua dimensi. M memetakan lingkaran satuan di ruang bagian ini ke persimpangan ellipsoid dengan pesawat yang berisi M A dan M B . Persimpangan ini, menjadi distorsi linear dari sebuah lingkaran, adalah elips. Jelas jarak terjauh ke elips ini tidak lebih dari λ 1 = 1 dan jarak terpendek tidak kurang dari λ n .ABMMAMBλ1=1λn

Seperti yang kami amati pada akhir bagian sebelumnya, kemungkinan paling ekstrem adalah ketika A dan B terletak di bidang yang berisi dua dari e i di mana rasio λ i yang sesuai sekecil mungkin. Ini akan terjadi di bidang e 1 , e n . Kami sudah punya solusi untuk kasus itu.ABeiλie1,en

Kesimpulan

Ekstrem kesamaan cosinus dapat dicapai dengan menerapkan M ke dua vektor yang memiliki cosinus similarity cos ( 2 ϕ ) diberikan oleh ( 2 ) dan ( 3 )Mcos(2ϕ)(2)(3) . Mereka diperoleh dengan menempatkan A dan B pada sudut yang sama dengan arah di mana Σ = M M secara maksimal memperpanjang vektor apa pun (seperti arah e 1 ) dan memisahkannya ke arah di mana Σ memanjang vektor secara minimal (seperti e n arah).ABΣ=MMe1Σen

Ekstrim ini dapat dihitung dalam hal SVD dari M .M

whuber
sumber
Ini jawaban yang fantastis! Terima kasih banyak atas diskusi terperinci ini! Saya percaya bahwa Anda memiliki kesalahan tanda dalam eqn (3) di mana Anda seharusnya hanya memiliki tanda minus keseluruhan.
LFH
Saya tertarik pada kasus di mana sudut 2 ϕ mendekati nol dan saya ingin mendapatkan ketimpangan antara 2 ϕ dan f . Apakah benar bahwa berdasarkan perhitungan Anda, saya hanya perlu untuk menemukan yang paling ekstrim (yang terkecil) λ n dan dalam hal ini, ketimpangan asimtotik diberikan oleh 2 λ n φ f 2 λ - 12ϕ2ϕfλn n φsebagaiφ0? 2λnϕf2λ1nϕϕ0
LFH
6

Anda mungkin tertarik pada:

( M A , M B ) = A T ( M T M ) B ,

(MA,MB)=AT(MTM)B,

Anda dapat mendiagonalisasi M T M = U Σ U T (atau seperti yang Anda sebut, PCA), yang memberitahu Anda bahwa kesamaan A , B dalam transformasi MMTM=UΣUTA,BM berperilaku dengan memproyeksikan A , B ke komponen utama Anda, dan kemudian menghitung kesamaan di ruang baru ini. Untuk menyempurnakan ini sedikit lebih banyak, biarkan komponen utama menjadi u i dengan nilai eigen λ i . KemudianA,Buiλi

U B = i ( u i , b i ) u i , U A = i ( u i , a i ) u i , 

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

yang memberi Anda:

( M A , M B ) = n i = 1 ( u i , a i ) ( u i , b i ) λ i .

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

Perhatikan bahwa ada penskalaan yang terjadi di sini: λ i stretching / shrinking. Ketika A , B adalah vektor satuan dan jika setiap λ i = 1 , maka M sesuai dengan rotasi, dan Anda mendapatkan: sim ( M A , M B ) = sim ( A , B ) , yang setara dengan mengatakan bahwa produk dalam tidak berubah dalam rotasi. Secara umum, sudut tetap sama ketika M adalah transformasi konformal, yang dalam hal ini mengharuskan MλiA,Bλi=1Msim(MA,MB)=sim(A,B)MMdibalik dan dekomposisi kutub M memenuhi M = O P dengan P = a I , yaitu M T M = a 2 saya .MM=OPP=aIMTM=a2I

Alex R.
sumber
1
Pernyataan awal Anda tentang masalah mengabaikan normalisasi vektor A , B , M A , dan M B yang diperlukan untuk menghitung persamaan cosinus. Tampaknya tidak ada analisis selanjutnya yang membahas normalisasi ini. Perhatikan, khususnya, bahwa persamaan cosinus dipertahankan bahkan ketika semua nilai eigen sama dengan beberapa nilai (positif) yang berbeda dari 1 . Itu menunjukkan, bahkan dalam kasus sederhana ini, banyak hal yang dapat dikatakan. ABMAMB1
Whuber
@whuber: kesamaan cosinus dipertahankan persis ketika M adalah transformasi konformal, yang dalam hal ini setara dengan mengharuskan M untuk dapat dibalik dan M T M = a 2 I , kelipatan dari identitas. Kata lain, dekomposisi kutub M memenuhi M = O P , di mana P = a saya . Kau benar tentang normalisasi tapi, tampaknya konyol untuk berbicara tentang cosine similarity dengan vektor non-normalisasi A , B . MMMTM=a2IMM=OPP=aI
Alex R.
2
Sama sekali tidak konyol! Karena "kesamaan" ini diberikan oleh cosinus sudut antara vektor, masuk akal untuk dua vektor bukan nol. Yang saya maksud dengan "lebih dapat dikatakan" adalah bahwa batas efektif pada sudut antara gambar A dan B dapat diperoleh dalam hal sudut antara A dan B dan nilai eigen dari M .
whuber