Kenali Flux: Generator Gambar AI Sumber Terbuka Baru yang Mengungguli Midjourney, SD3, dan Auraflow
Flux adalah model teks-ke-gambar sumber terbuka yang canggih dengan 12 miliar parameter. Kami membandingkannya dengan tiga pesaing teratas, dan satu yang terbaik.
Kiki • Aug 2, 2024
Black Forest Labs, kelompok yang membantu dalam pembuatan Stable Diffusion yang asli, telah merilis Flux, model teks-ke-gambar sumber terbuka terbesar hingga saat ini. Dengan 12 miliar parameter yang mengejutkan, Flux memiliki kemampuan untuk menghasilkan visual yang mengalahkan Midjourney dan mungkin mengalahkan model lain, baik tertutup maupun terbuka yang saat ini tersedia.
Tiga versi Flux tersedia: Flux Pro, versi sumber tertutup yang tersedia melalui API; Flux Schnell, versi yang lebih cepat, versi yang disaring yang beroperasi sepuluh kali lebih cepat, tersedia di bawah lisensi Apache 2 dan merupakan model yang paling canggih; dan Flux Dev, versi sumber terbuka dengan lisensi non-komersial untuk pengembangan komunitas.
Di Hugging Face, Anda dapat mengunduh Flux Dev dan Flux Schnell. Selain itu, ComfyUI telah diperbarui untuk mendukung model baru dalam alur kerja lokal.
Dalam pengumumannya pada hari Kamis, Black Forest Labs menekankan rekam jejak tim yang telah terbukti dalam pengembangan AI generatif untuk media.
“Adversarial Diffusion Distillation untuk sintesis gambar yang sangat cepat dan real-time; model Stabilitas AI Stable Diffusion untuk pembuatan gambar dan video (Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers), dan VQGAN dan Latent Diffusion adalah inovasi kami,” kata tim tersebut.
Setelah putaran pendanaan awal yang berhasil sebesar $31 juta, yang didirikan oleh Andreessen Horowitz dan didukung oleh para investor terkenal seperti Brendan Iribe, Michael Ovitz, dan Garry Tan, peluncuran ini diikuti.
Flux menyatakan dalam pengujian benchmarking bahwa modelnya telah menetapkan standar baru dalam sintesis gambar; dalam hal keragaman output, variabilitas ukuran/aspek, kualitas visual, kecepatan mengikuti, dan variabilitas ukuran/aspek, Flux melampaui model seperti Dall-E 3 (HD), Midjourney v6.0, dan SD3 Ultra.
Grafik Black Forest menyatakan bahwa model Pro dan Dev-nya merupakan generator gambar terbaik hingga saat ini; Schnell, yang kurang bertenaga, berada di antara Ideogram dan Midjourney v5.
Pengguna dengan GPU yang lebih kecil, bagaimanapun, mungkin tidak beruntung. Dengan berat kira-kira 23 GB, model open-source mungkin membutuhkan sekitar 24 GB VRAM untuk menjalankannya hingga versi terukurnya dirilis, jika ada. Pengguna dengan GPUS dengan VRAM 6 dan 8 GB, bagaimanapun, tampaknya harus segera meninggalkan sensasi pengujian model AI baru.
Untuk mendukung generasi cloud, Black Forest telah bekerja sama dengan Fal AI, pengembang model sumber terbuka Auraflow. Replicate.com juga menawarkan model-model ini untuk diuji coba secara gratis.
Untuk menghasilkan 33 gambar dengan Flux Pro atau 333 gambar dengan Flux Schell, harganya $1 setelah pengguna memenuhi kuota harian mereka. Daripada ideogram atau midjourney, ini adalah proposisi nilai yang lebih baik.
Paket Dasar Midjourney berharga $96/tahun dan memungkinkan pengguna mengambil sekitar 200 gambar per bulan, sekitar 25 gambar per dolar yang berarti $96/tahun. Paket Ideogram dasar berharga $84 per tahun; itu menawarkan hingga 50 gambar atau 400 gambar per bulan.
Seberapa baik hasil ciptaannya? Flux terlihat luar biasa dalam pengujian benchmark. Kami dapat memastikan bahwa kami terkesan setelah membandingkannya dengan generator gambar sumber terbuka terbaik saat ini.
source image: https://medium.com