Algoritma Frank–Wolfe

Templat:Nocat Algoritma Frank–Wolfe (bahasa Inggris: Frank-Wolfe algorithm) adalah algoritma optimasi iteratif orde pertama yang digunakan untuk optimasi cembung terkendala. Juga dikenal sebagai metode gradien bersyarat,^[1] algoritma gradien tereduksi, dan algoritma kombinasi cembung. Metode ini awalnya diusulkan oleh Marguerite Frank dan Philip Wolfe pada tahun 1956.^[2] Dalam setiap iterasi, algoritma Frank–Wolfe mempertimbangkan hampiran linear dari fungsi objektif, dan bergerak menuju peminimalisasi fungsi linier ini (diambil dari domain yang sama).

Rumusan masalah

Misalkan $𝒟$ adalah himpunan cembung kompak dalam ruang vektor dan $f : 𝒟 \to ℝ$ adalah fungsi terdiferensialkan bernilai riil yang konveks dan terdiferensialkan. Algoritma Frank–Wolfe memecahkan masalah optimasi

Minimasi

f (𝐱)

dengan

𝐱 \in 𝒟

.

Algoritma

Inisialisasi: Misal

k \leftarrow 0

, dan

𝐱_{0}

adalah poin sembarang pada

𝒟

.

Langkah 1. Submasalah pencarian arah: Cari

𝐬_{k}

yang menyelesaikan

Minimasi

𝐬^{T} \nabla f (𝐱_{k})

dengan

𝐬 \in 𝒟

(Interpretasi: Minimasi hampiran linear dari masalah yang diberikan dari hampiran Taylor orde pertama dari $f$ di sekitar $𝐱_{k}$ yang dibatasi untuk tetap berada di dalam $𝒟$ )

Langkah 2. Penentuan jumlah langkah: Tetapkan

α \leftarrow \frac{2}{k + 2}

, atau dengan cara lain, mencari

α

yang meminimalkan

f (𝐱_{k} + α (𝐬_{k} - 𝐱_{k}))

dengan

0 \leq α \leq 1

.

Langkah 3. Perbarui: Misalkan

𝐱_{k + 1} \leftarrow 𝐱_{k} + α (𝐬_{k} - 𝐱_{k})

, dan

k \leftarrow k + 1

kemudian kembali ke langkah 1.

Sifat-sifat

Meskipun metode yang mirip, seperti penurunan gradien untuk optimasi terkendala membutuhkan langkah proyeksi kembali ke himpunan yang layak di setiap iterasi, algoritma Frank–Wolfe hanya membutuhkan solusi masalah linear pada himpunan yang sama di setiap iterasi, dan secara otomatis tetap berada di himpunan yang layak.

Konvergensi algoritma Frank – Wolfe secara umum bersifat sublinear: galat pada fungsi objektif hingga mencapai optimal adalah $O (1 / k)$ setelah k iterasi, selama gradiennya kontinu Lipschitz terhadap suatu norma. Tingkat konvergensi yang sama juga dapat ditunjukkan jika submasalah hanya diselesaikan secara hampiran.^[3]

Iterasi algoritma selalu dapat direpresentasikan sebagai kombinasi cembung jarang dari titik-titik ekstrim dari himpunan layak, yang telah membantu popularitas algoritma ini untuk optimasi greedy jarang (sparse greedy optimization) dalam pemelajaran mesin dan pemrosesan sinyal,^[4] serta misalnya optimasi arus biaya minimum dalam jaringan transportasi.^[5]

Jika himpunan layak diberikan oleh himpunan berkendala linier, maka submasalah yang harus diselesaikan pada setiap iterasi menjadi program linier.

Sedangkan tingkat konvergensi pada kasus terburuk dengan $O (1 / k)$ secara umum tidak dapat diperbaiki, konvergensi yang lebih cepat dapat diperoleh untuk kelas masalah khusus, seperti beberapa masalah yang sangat cembung.^[6]

Batas bawah pada nilai solusi, dan analisis primal-dual

Karena $f$ adalah fungsi konveks, untuk dua titik sembarang, $𝐱, 𝐲 \in 𝒟$ kita mempunyai:

f (𝐲) \geq f (𝐱) + (𝐲 - 𝐱)^{T} \nabla f (𝐱)

Hal ini juga berlaku untuk solusi optimal (yang tidak diketahui). $𝐱^{*}$ . Artinya, $f (𝐱^{*}) \geq f (𝐱) + (𝐱^{*} - 𝐱)^{T} \nabla f (𝐱)$ . Batas bawah terbaik sehubungan titik tertentu $𝐱$ diberikan oleh

\begin{matrix} f (𝐱^{*}) & \geq f (𝐱) + (𝐱^{*} - 𝐱)^{T} \nabla f (𝐱) \\ \geq \min_{𝐲 \in D} {f (𝐱) + (𝐲 - 𝐱)^{T} \nabla f (𝐱)} \\ = f (𝐱) - 𝐱^{T} \nabla f (𝐱) + \min_{𝐲 \in D} 𝐲^{T} \nabla f (𝐱) \end{matrix}

Masalah optimasi yang terakhir diselesaikan pada setiap iterasi algoritma Frank–Wolfe. Oleh karena itu, solusi $𝐬_{k}$ dari submasalah pencarian arah dari Iterasi ke- $k$ dapat digunakan untuk menentukan peningkatan batas bawah $l_{k}$ pada setiap iterasi dengan menetapkan $l_{0} = - \infty$ dan

l_{k} := \max (l_{k - 1}, f (𝐱_{k}) + (𝐬_{k} - 𝐱_{k})^{T} \nabla f (𝐱_{k}))

Batas bawah pada nilai optimal yang tidak diketahui ini penting dalam praktiknya karena dapat digunakan sebagai kriteria penghentian, dan memberikan jaminan kualitas hampiran yang efisien pada setiap iterasi, karena selalu $l_{k} \leq f (𝐱^{*}) \leq f (𝐱_{k})$ .

Telah ditunjukkan bahwa kesenjangan dualitas ini yang sesuai, artinya perbedaan antara $f (𝐱_{k})$ dan batas bawah $l_{k}$ , menurun dengan tingkat konvergensi yang sama, yaitu $f (𝐱_{k}) - l_{k} = O (1 / k) .$

Catatan

Templat:Reflist

Bibliografi

Pranala eksternal

https://conditional-gradients.org/: sebuah survei terkait algoritma Frank–Wolfe.
Marguerite Frank memberikan penjelasan pribadi tentang sejarah algoritma

Lihat juga

Metode gradien hampiran

Templat:Algoritma optimasi

[1] Templat:Cite journal

[2] Templat:Cite journal

[3] Templat:Cite journal

[4] Templat:Cite journal

[5] Templat:Cite journal

[6] Templat:Cite book

[1]

[2]

[3]

[4]

[5]

[6]

Algoritma Frank–Wolfe

Daftar isi

Rumusan masalah

Algoritma

Sifat-sifat

Batas bawah pada nilai solusi, dan analisis primal-dual

Catatan

Bibliografi

Pranala eksternal

Lihat juga

Menu navigasi

Algoritma Frank–Wolfe

Rumusan masalah

Algoritma

Sifat-sifat

Batas bawah pada nilai solusi, dan analisis primal-dual

Catatan

Bibliografi

Pranala eksternal

Lihat juga

Menu navigasi

Pencarian