Perkalian dan eksponensial rantai matriks

Jika saya memiliki dua matriks dan , masing-masing berdimensi dan , dan ingin menghitung , lebih efisien untuk terlebih dahulu menulis ulang ekspresi sebagai dan baru kemudian mengevaluasi secara numerik, karena adalah dimensi tetapi adalah dimensi . $A$ $B$ $1000\times2$ $2\times1000$ $(AB)^{5000}$ $A(BA)^{4999}B$ $AB$ $1000\times1000$ $BA$ $2\times2$

Saya ingin menyelesaikan versi umum masalah ini. Apakah ada algoritma yang cukup efisien (bukan kekerasan) untuk mengoptimalkan ekspresi yang mengandung:

Variabel matriks bebas dari dimensi yang diketahui
Produk dari subekspresi sewenang-wenang
Subekspresi sewenang-wenang dinaikkan menjadi kekuatan alami

... sehingga dibutuhkan paling sedikit pekerjaan untuk mengevaluasi secara numerik, setelah mengganti variabel matriks bebas dengan nilai matriks konkret?

Masalah penggandaan rantai matriks adalah kasus khusus dari masalah saya.

Edit:

Ini adalah jawaban sementara. Tampaknya secara intuitif benar bagi saya, tetapi saya tidak punya bukti bahwa itu benar. Jika ternyata benar, saya masih tertarik pada buktinya. (Jika itu tidak benar, tentu saja, tolong perbaiki saya.)

Untuk setiap produk yang dinaikkan menjadi daya, katakanlah, , pertimbangkan setiap permutasi siklik faktor-faktor: $(A_1 A_2 \ldots A_k)^n$

$(A_1 A_2 \ldots A_k)^n$
$A_1 (A_2 \ldots A_k A_1)^{n-1} A_2 \ldots A_k$
$A_1 A_2 (A_3 \ldots A_k A_1 A_2)^{n-1} A_3 \ldots A_k$
...
$A_1 A_2 \ldots A_{k-1} (A_k A_1 A_2 \ldots A_{k-1})^{n-1} A_k$

... secara rekursif. Setiap daya dihitung menggunakan eksponensial dengan mengkuadratkan (jelas), dan semua produk lain dihitung menggunakan urutan optimal yang dikembalikan oleh algoritma penggandaan rantai matriks.

Edit:

Gagasan yang diuraikan dalam edit saya sebelumnya masih agak tidak optimal. Eksponen dengan algoritma kuadrat sebenarnya mengevaluasi ekspresi dari bentuk atau , di mana belum tentu merupakan matriks identitas. Tapi algoritma saya tidak mempertimbangkan kemungkinan menggunakan eksponensial dengan mengkuadratkan algoritma dengan tidak sama dengan matriks identitas. $K A^n$ $A^n K$ $K$ $K$

optimization dynamic-programming linear-algebra ular sanca
sumber

@ gnasher729: Maaf, saya seharusnya lebih eksplisit. Saya tidak ingin memaksa semua kemungkinan, untuk alasan yang persis sama Anda tidak ingin menyelesaikan perkalian rantai matriks dengan kekuatan kasar. Saya baru saja mengedit pertanyaannya.

pyon

Perhatikan bahwa bahkan setelah Anda cerdik ekspresi faktor

masih lebih pintar faktor sebagai

. Intinya adalah, Anda mungkin harus mencampur antara perkalian rantai matriks dan algoritma standar lainnya untuk eksponensial cepat.

A (B A)^{4999} B

$A(BA)^{4999}B$

A (B A)^{2 * (2 * 1249 + 1) + 1} B

$A(BA)^{2*(2*1249+1)+1}B$

Apiwat Chantawibul

@ Billiska: Memang, itulah yang ingin saya lakukan: menggabungkan perkalian dan eksponensiasi rantai matriks dengan mengkuadratkan ke dalam algoritma tunggal untuk masalah gabungan. Tetapi ada beberapa masalah sial. Diberikan

, bagaimana saya mencegah algoritma untuk mencoba

, dan seterusnya?

A (B A)^{n - 1} B

$A(BA)^{n-1}B$

A B (A B)^{n - 2} A B

$AB(AB)^{n-2}AB$

A B A (B A)^{n - 3} B A B

$ABA(BA)^{n-3}BAB$

pyon

Kami mengubah basis menjadi vektor Eigen untuk eksponensial matriks dan ketika semua matriks memiliki kekuatan 1 maka kita dapat menggunakan perkalian rantai matriks.

Deep Joshi

@DeepJoshi Maaf, saya menemukan komentar Anda agak singkat. Tapi, jika saya memahami ide Anda dengan benar, aku takut itu tidak akan bekerja dalam kasus umum, karena dimensi ruang eigen dari

matriks kebutuhan tidak menambahkan hingga

. Dengan kata lain, tidak selalu demikian bahwa setiap vektor dapat dinyatakan sebagai kombinasi linear dari vektor eigen.

n \times n

$n \times n$

n

$n$

pyon

Jawaban:

Penafian: Metode berikut ini belum terbukti secara optimal. Bukti informal disediakan.

Masalahnya berkurang untuk menemukan pemesanan yang paling efisien ketika mempertimbangkan kuadrat produk.

$(ABC)^{50}$ $(ABC)^2$ $ABCABC$ $ABC$

$ABCABC$

$A(B(CA))BC$ $A(B(CA))^{49}BC$

$(A_1 A_2 \cdots A_n)^m$ $(A_1 A_2 \cdots A_n)^2$
$(A_1 A_2 \cdots A_n)^2$
$G$ $A_1 \cdot A_2 \cdot G^{m-1} \cdot A_n$

$(AB)^n$ $A$ $B$ $X \times Y$ $Y \times X$ $A$ $B$

$X \times Y$
$Y \times X$
$Y \times Y$
$X \times X$

$X < Y$ $Y ≤ X$

$X < Y$
$AB$ $X \times X$ $A$ $B$ $(AB)^n$

$Y ≤ X$
$BA$ $Y \times Y$ $A$ $B$ $A(BA)^{n-1}B$

$ABAB$

Menggunakan lebih banyak matriks, argumennya serupa. Mungkin bukti induktif mungkin? Gagasan umum adalah bahwa memecahkan MCM untuk kuadrat akan menemukan ukuran optimal untuk operasi dengan semua matriks yang terlibat dipertimbangkan.

Studi kasus:

julia> a=rand(1000,2);
julia> b=rand(2,1000);
julia> c=rand(1000,100);
julia> d=rand(100,1000);
julia> e=rand(1000,1000);

julia> @time (a*b*c*d*e)^30;
  0.395549 seconds (26 allocations: 77.058 MB, 1.58% gc time)

# Here I use an MCM solver to find out the optimal ordering for the square problem
julia> Using MatrixChainMultiply
julia> matrixchainmultiply("SOLVE_SQUARED", a,b,c,d,e,a,b,c,d,e)
Operation: SOLVE_SQUARED(A...) = begin  # none, line 1:
    A[1] * (((((A[2] * A[3]) * (A[4] * (A[5] * A[6]))) * (A[7] * A[8])) * A[9]) * A[10])
  end
Cost: 6800800

# Use the ordering found, note that exponentiation is applied to the group of 5 elements
julia> @time a*(((((b*c)*(d*(e*a)))^29*(b*c))*d)*e);
  0.009990 seconds (21 allocations: 7.684 MB)

# I also tried using the MCM for solving the problem directly
julia> @time matrixchainmultiply([30 instances of a,b,c,d,e]);
  0.094490 seconds (4.02 k allocations: 9.073 MB)

matteyas
sumber

(A B C)^{2}

$(ABC)^2$

A B C A B C

$ABCABC$

(A B C)^{n}

$(ABC)^n$

(A B C)^{n}

$(ABC)^n$

A (B C A)^{n - 1} B C

$A(BCA)^{n-1}BC$

A B (C A B)^{n - 1} C

$AB(CAB)^{n-1}C$

@DavidRicherby adalah bukti informal tambahan yang digunakan?

matteyas

@matteyas: Itu kurang lebih apa yang saya katakan di edit pertama pertanyaan saya, kan?

pyon

A B C A B C

$ABCABC$

-1

$A_1$ $A_n$ $A_i$ $A_j$ $O (n^3)$

gnasher729
sumber

Ini tidak memperhitungkan subekspresi akun yang dinaikkan ke daya (jika daya besar ini mungkin sangat tidak efisien), dan itu tidak memperhitungkan kesempatan untuk menggunakan eksponensial cepat untuk mencapai percepatan yang lebih baik , jadi saya menduga ini belum jawaban yang optimal.