Meta Merilis Model AI Open-Source Terbesar dan Terbaik

Llama 3.1 mengungguli OpenAI dan saingan lainnya dalam beberapa tolok ukur tertentu.

Kiki A. Ramadhan • Jul 26, 2024

Kiki • Jul 26, 2024

Meta menunjukkan bahwa mereka sedang mengerjakan sesuatu yang baru dalam industri AI pada bulan April lalu: sebuah model open-source yang memiliki kinerja yang sebanding dengan model privat terbaik dari perusahaan-perusahaan, seperti OpenAI.

Model itu telah rilis hari ini. Menurut Meta, Llama 3.1 adalah model AI open-source terbesar yang pernah ada. Menurut beberapa ukuran, ia mengalahkan GPT-4o dan Anthropic's Claude 3.5 Soneta.

Sambil menambahkan fitur yang dapat menghasilkan gambar berdasarkan kemiripan seseorang, ini juga membuat asisten Meta AI berbasis Llama tersedia di lebih banyak negara dan bahasa. Menurut CEO Mark Zuckerberg, Meta AI akan melampaui ChatGPT sebagai asisten yang paling banyak digunakan pada akhir tahun ini.

Model Llama 3.1, yang baru-baru ini dikeluarkan, jauh lebih kompleks daripada model Llama 3, yang lebih kecil. Dengan lebih dari 16.000 GPU H100 Nvidia yang sangat mahal, versi terbesarnya memiliki 405 miliar parameter.

Biaya pengembangan Llama 3.1 tidak diungkapkan oleh Meta, tetapi, berdasarkan harga chip Nvidia saja, dapat diprediksi bahwa harganya mencapai ratusan juta dolar.

Dengan biaya tersebut, mengapa Meta masih memberikan lisensi kepada Llama yang hanya memerlukan persetujuan dari perusahaan yang memiliki ratusan juta pengguna? Zuckerberg menyatakan dalam sebuah surat yang diterbitkan di blog perusahaan Meta bahwa model AI open-source akan mengambil alih model AI berpemilik, yang sudah berkembang lebih cepat daripada model berpemilik.

Ini serupa dengan bagaimana Linux menjadi sistem operasi open-source yang mendukung sebagian besar gawai, server, dan ponsel saat ini.

Dia membandingkan investasi Meta dalam AI sumber terbuka dengan Open Compute Project sebelumnya, yang menurutnya telah menyelamatkan perusahaan “miliaran” dengan meminta perusahaan luar seperti HP untuk membantu meningkatkan dan menstandarisasi desain pusat data Meta saat membangun kapasitasnya sendiri.

Ke depannya, ia mengharapkan dinamika yang sama terjadi pada AI, dengan menulis, “Saya yakin rilis Llama 3.1 akan menjadi titik balik dalam industri di mana sebagian besar pengembang mulai menggunakan open source.”

Untuk membantu menyebarkan Llama 3.1 ke seluruh dunia, Meta bekerja sama dengan lebih dari dua lusin perusahaan, termasuk Microsoft, Amazon, Google, Nvidia, dan Databricks, untuk membantu para pengembang menerapkan versi mereka sendiri.

Meta mengklaim bahwa Llama 3.1 membutuhkan biaya sekitar setengah dari biaya produksi GPT-4o OpenAI. Meta merilis bobot model sehingga perusahaan dapat melatihnya dengan data khusus dan menyesuaikannya dengan keinginan mereka.

Tidak mengherankan bahwa Meta tidak banyak berbicara tentang data yang digunakan untuk melatih Llama 3.1. Sementara para kritikus mengatakan ini adalah taktik untuk memperlambat serangan hukum hak cipta yang tidak terhindarkan yang akan datang, mereka yang bekerja di perusahaan AI mengatakan bahwa mereka tidak mengungkapkan informasi ini karena ini adalah rahasia dagang.

Meta akan menyatakan bahwa versi Llama 3.1 dengan 405 miliar parameter memperbaiki versi 70 miliar dan 8 miliar yang lebih kecil, menggunakan data sintetis, atau data yang dibuat oleh model dan bukan manusia.

Llama 3.1 akan menjadi populer di kalangan pengembang sebagai “guru untuk model yang lebih kecil yang kemudian digunakan” dengan cara yang “lebih hemat biaya”, menurut Wakil Presiden Meta untuk AI generatif Ahmad Al-Dahle.

Al-Dahle mengusulkan bahwa akan ada batas akhir, meskipun mungkin lebih jauh dari yang dianggap oleh banyak orang, ketika saya bertanya apakah Meta setuju dengan konsensus yang berkembang bahwa industri ini kehabisan data pelatihan berkualitas untuk model. “Kami yakin bahwa masih ada beberapa pelatihan lagi,” katanya. "Tetapi sulit untuk mengatakannya."

Mencari potensi keamanan siber dan kasus penggunaan biokimia adalah bagian dari tim merah Meta (atau pengujian adversarial) Llama 3.1 untuk pertama kalinya. Meta menggambarkan perilaku "agen" yang muncul sebagai alasan tambahan untuk menguji model ini dengan lebih teliti.

“Mengambil informasi dari internet berdasarkan kueri yang rumit dan memanggil beberapa alat secara berurutan untuk menyelesaikan tugas-tugas” adalah tujuan dari integrasi Llama 3.1 dengan API mesin pencari, menurut Al-Dahle.

Meminta model untuk menghitung jumlah rumah yang terjual di Amerika Serikat selama lima tahun terakhir adalah contoh tambahan yang ia berikan. "Model ini dapat mengambil pencarian [web] untuk Anda, membuat kode Python dan menjalankannya."

Implementasi Llama sendiri adalah asisten AI Meta. Chatbot multifungsi seperti ChatGPT dapat ditemukan di hampir semua bagian WhatsApp, Instagram, dan Facebook. Di Amerika Serikat, Llama 3.1 akan pertama kali tersedia melalui situs web Meta AI dan WhatsApp mulai minggu ini.

Dalam beberapa minggu berikutnya, Facebook dan Instagram akan mengikuti. Selain itu, Llama 3.1 telah diperbarui untuk mendukung bahasa-bahasa baru seperti Spanyol, Hindi, Italia, Jerman, dan Prancis.

Jika permintaan yang tidak ditentukan dalam minggu tertentu melampaui model parameter 405 miliar yang paling canggih dari Llama 3.1, asisten akan mengalihkan pengguna ke model 70 miliar yang lebih kecil.

Dengan demikian, model 405 miliar terlalu mahal bagi Meta untuk dilaksanakan secara menyeluruh. Setelah melakukan penilaian penggunaan awal, perusahaan akan memberikan lebih banyak informasi tentang ambang batas permintaan, menurut Jon Carvill, juru bicara.

Fitur Meta AI baru "Imagine Me" memindai wajah melalui kamera ponsel; setelah itu, pengguna dapat memasukkan wajah yang dihasilkannya ke dalam gambar. Meta diharapkan dapat mencegah pembuatan mesin pemalsuan dengan menangkap kemiripan dengan cara ini, bukan melalui foto di profil.

Meskipun itu berarti mengaburkan perbedaan antara apa yang nyata dan tidak nyata, perusahaan ini melihat adanya permintaan dari individu yang ingin membuat lebih banyak jenis media AI dan membagikannya ke feed mereka.

Dalam beberapa minggu mendatang, Meta AI akan menggantikan antarmuka perintah suaranya di headset Quest. Pengguna akan dapat menggunakan Meta AI pada Quest untuk mengidentifikasi dan mempelajari apa yang dilihat saat berada dalam mode passthrough headset yang menampilkan dunia nyata melalui layar, seperti yang dilakukannya pada kacamata Meta Ray-Ban.

Meta AI akan menjadi chatbot yang paling banyak digunakan pada akhir tahun ini, menurut Zuckerberg, ChatGPT memiliki lebih dari 100 juta pengguna tetapi Meta belum memberikan angka penggunaan asistennya.

Al-Dahle menyatakan, “Saya rasa seluruh industri masih dalam tahap awal menuju kesesuaian dengan pasar produk.” Meta dan pemain lain jelas percaya bahwa perlombaan baru saja dimulai, bahkan dengan betapa AI yang terlalu dibesar-besarkan sudah terasa.

source image: www.theverge.com