Pertimbangkan persamaan diferensial berikut mana adalah status dan sebagai variabel kontrol. Solusi diberikan oleh mana adalah status inital yang diberikan.
Sekarang pertimbangkan program berikut mana \ rho> 0 menunjukkan preferensi waktu, V (\ cdot) adalah nilainya dan F (\ cdot) fungsi obyektif. Aplikasi ekonomi klasik adalah model pertumbuhan optimal Ramsey-Cass-Koopmans. Persamaan Hamilton-Jacobi-Bellman diberikan oleh \ begin {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ in [0, \ infty). \ end {align}
Katakanlah saya sudah memecahkan HJB untuk . Kontrol optimal kemudian diberikan oleh
The wiki Artikel mengatakan
... tetapi ketika diselesaikan di seluruh ruang keadaan, persamaan HJB adalah kondisi yang diperlukan dan cukup untuk optimal.
Dalam Bertsekas (2005) Dinamis Pemrograman dan Kontrol Optimal , Vol 1, 3rd ed., Di Proposisi 3.2.1 ia menyatakan bahwa pemecahan untuk adalah optimal fungsi biaya-to-go dan terkait optimal. Namun, ia secara eksplisit menyatakannya sebagai teorema kecukupan.
Sebenarnya, saya hanya ingin memastikan, bahwa jika saya telah memecahkan HJB dan memulihkan keadaan terkait dan mengontrol lintasan, bahwa saya tidak perlu khawatir dengan kondisi optimalitas tambahan.
Larutan
Saya mencoba
Saya pikir saya bisa mendapatkan kondisi yang diperlukan dari prinsip maksimum dengan persamaan HJB itu sendiri.
Tentukan hamiltonian
maka kita memiliki
yaitu
Tentukan fungsi sembarang dengan . Sekarang perbaiki
di mana adalah parameter. Masukkan istilah ke dalam hamiltonian maksimal yang memberi ρ V ( x ∗ + ε q ) = H ( x ∗ + ε q , u ∗ , V ′ ( x ∗ + ε q ) ) .
Pada kami memiliki solusi optimal. Jadi bedakan dengan untuk mendapatkan kondisi urutan pertama ε ρ V ′ q = H x q + H V ′ V ″ q .
Sekarang tentukan variabel adjoint dengan
Bedakan dari waktu ke waktu
dan perhatikan bahwa
Tancapkan everthing ke foc yang memberikan
Cukup banyak. Jadi penyelesaian HJB memang perlu dan memadai (dihilangkan di sini) untuk optimalitas. Seseorang harus menambahkannya ke wiki. Mungkin menghemat waktu untuk orang-orang yang berpikir tentang masalah seperti itu (tidak akan banyak menurut saya).
Namun kondisi transversalitas hilang.
II Mencoba
Tentukan fungsional hasil
Perhatikan bahwa dengan definisi . Tambahkan Term netral ke pembayaran funtional
Integrasi dengan bagian-bagian dari istilah yang tepat dan hasil rhs
Ganti kembali istilah itu
Tentukan
yang memberi
FOC untuk maksimumJ ε = ∫ ∞ 0 e - ρ t [ H x q + H u p + q ( ˙
Karena dan tidak dibatasi, kita harus memiliki
sumber
Jawaban:
(Ini mungkin harus dianggap sebagai komentar.)
Jika Anda telah menyelesaikan persamaan HJB, itu sudah cukup untuk mendapatkan solusi optimal. Jadi Anda tidak "harus peduli dengan kondisi optimal lainnya," yang menurut saya tampaknya menjawab pertanyaan Anda.
Tampaknya Anda khawatir tentang komponen teorema yang "perlu". Sisi keharusan dari pernyataan tersebut adalah sebagai berikut: jika ada solusi optimal, harus ada solusi untuk persamaan HJB.
Saya belum bekerja dengan masalah khusus ini, tetapi jawabannya secara umum adalah bahwa kita tidak berharap memiliki fungsi terdiferensiasi V. Karenanya kita tidak memiliki solusi untuk persamaan seperti yang dinyatakan. Sebaliknya, kita perlu melihat turunan umum, dan mengubah persamaan HJB menjadi ketidaksetaraan. Dalam hal ini, Anda mungkin mendapatkan "solusi viskositas." Jika kami memperluas penggunaan derivatif umum, dimungkinkan untuk membuktikan bahwa solusi seperti itu selalu ada. Melirik bukti Anda, mereka tidak akan membantu pada kondisi kebutuhan, karena Anda mengasumsikan dapat dibedakan.
sumber