Nvidia Rilis Model AI Baru yang Digadang-gadang Siap Kalahkan GPT-4o

Nvidia meluncurkan model AI baru, Llama-3.1-Nemotron-70B-Instruct, yang terbukti lebih unggul dari GPT-4o dalam benchmark Chatbot Arena.

M A • Oct 18, 2024

M • Oct 18, 2024

Nvidia diam-diam meluncurkan model kecerdasan buatan (AI) baru pada 15 Oktober yang diklaim mampu mengungguli sistem AI terkemuka seperti GPT-4o dan Claude-3. Model baru ini, bernama Llama-3.1-Nemotron-70B-Instruct, menunjukkan keunggulannya di lmarena.AI’s Chatbot Arena, platform benchmarking yang membandingkan performa AI chatbot secara komprehensif.

Nemotron 70B, hasil modifikasi dari model open-source Llama-3.1-70B-Instruct milik Meta, dikembangkan oleh Nvidia untuk menjadi model AI yang lebih "berguna" daripada pesaing seperti ChatGPT milik OpenAI dan Claude-3 dari Anthropic.

Nvidia menggunakan pendekatan yang unik, termasuk pemanfaatan data set khusus dan perangkat keras AI mutakhir untuk menyempurnakan model ini. Hasilnya? Nemotron 70B diklaim sebagai salah satu model AI terbaik di dunia saat ini.

Nvidia Tingkatkan Model Llama-3.1 dari Meta

Llama-3.1-Nemotron-70B-Instruct adalah evolusi dari model open-source Llama-3.1-70B, yang dirancang oleh Meta sebagai fondasi bagi para pengembang. Melalui modifikasi dan penyempurnaan oleh Nvidia, Nemotron dioptimalkan agar lebih responsif, akurat, dan "berguna" untuk pengguna.

Keunggulan Nemotron bukan hanya soal kecepatan atau ukuran model, tetapi juga kemampuan untuk memberikan hasil yang lebih relevan dan membantu pengguna menyelesaikan tugas kompleks. Nvidia menggunakan metode fine-tuning canggih dan perangkat keras tercanggih yang dimilikinya, membuat Nemotron memiliki performa yang lebih tinggi dibandingkan model-model populer di pasaran.

Dalam pengujian yang dilakukan di Chatbot Arena, Nemotron mencatatkan skor 85 pada tes otomatis "Hard", menjadikannya salah satu model AI teratas dalam kategori ini, jika klaim Nvidia valid. Ini sangat menarik, mengingat Llama-3.1-Nemotron-70B adalah model open-source kelas menengah dengan hanya 70 miliar parameter, sedangkan GPT-4o dikembangkan dengan lebih dari 1 triliun parameter.

Pengujian performa model AI bukanlah hal yang sederhana. Performa AI dievaluasi melalui serangkaian tugas dan perbandingan yang hasilnya bersifat subjektif. Setiap model AI diuji dengan pertanyaan atau tugas yang sama, dan hasilnya dibandingkan satu sama lain.

Biasanya, evaluasi AI dilakukan oleh proktor manusia yang menentukan apakah jawaban yang diberikan model sudah cukup berguna. Nvidia percaya bahwa Nemotron-70B-Instruct dapat memberikan hasil yang lebih baik, tidak hanya pada pengujian otomatis tetapi juga dalam penggunaan nyata oleh manusia.

Nemotron Siap Guncang Pasar AI

Apa yang membuat pencapaian Nemotron semakin mengesankan adalah fakta bahwa Llama-3.1-70B hanyalah model kelas menengah dari Meta, sementara versi yang lebih besar, Llama-3.1-405B, memiliki lebih dari 400 miliar parameter. Hal ini menunjukkan potensi besar yang dimiliki oleh model open-source seperti Llama jika dikembangkan dengan tepat.

Dengan Nemotron, Nvidia menunjukkan bahwa meskipun model AI dengan jumlah parameter yang lebih kecil, seperti 70B, dapat mengungguli model yang lebih besar jika dikembangkan dengan pendekatan yang tepat.

Hal ini juga menjadi bukti bahwa Nvidia kini tidak hanya dikenal sebagai produsen perangkat keras AI terkemuka, tetapi juga sebagai pemain penting dalam pengembangan model AI canggih.

Sebagai perbandingan, GPT-4o yang dikembangkan oleh OpenAI diperkirakan memiliki lebih dari 1 triliun parameter. Meskipun memiliki jumlah parameter yang jauh lebih besar, performa GPT-4o dalam beberapa pengujian tidak mampu menyaingi Nemotron yang lebih ramping. Dengan inovasi ini, Nvidia berpotensi merevolusi pasar AI, menghadirkan kompetisi baru dalam dunia model AI yang terus berkembang.