Grok-2 dari xAI: Pesaing Baru yang Kuat untuk ChatGPT dan Claude di Arena AI

Grok-2 menunjukkan keunggulan dalam beberapa tugas, mengancam dominasi GPT-4o dan Claude. Apakah ini AI generatif terbaik yang baru? Simak perbandingannya di sini.

Kiki A. Ramadhan • Aug 19, 2024

Kiki • Aug 19, 2024

Dalam dunia kecerdasan buatan yang terus berkembang, persaingan semakin ketat. Baru-baru ini, xAI milik Elon Musk memperkenalkan versi terbaru dari model Grok, yakni Grok-2, hanya beberapa hari setelah OpenAI mengumumkan pembaruan pada ChatGPT-4o.

Grok-2 hadir dengan klaim besar bahwa ia dapat mengungguli Claude 3.5 Sonnet dari Anthropic, model yang telah lama mendominasi ruang AI generatif.\

Namun, apakah Grok-2 benar-benar mampu mengalahkan para pesaingnya di berbagai tugas?

Peringkat di Arena LLM dan Persaingan Sengit

Di tengah klaim ambisius xAI, Grok-2 berhasil menempati peringkat ketiga dalam leaderboard LLM Arena, yang disusun oleh LMSys Org berdasarkan preferensi pengguna.

Peringkat ini menunjukkan bahwa Grok-2 memang memiliki daya tarik di kalangan pengguna, meskipun sebelumnya Grok-1 sempat mengecewakan dengan fokus yang terlalu berlebihan pada humor yang tidak tepat.

Peringkat ini memperlihatkan bahwa Grok-2 telah mengalami peningkatan signifikan, tetapi bagaimana performanya dibandingkan dengan GPT-4o dari OpenAI dan Claude 3.5 Sonnet dari Anthropic?

Kreativitas Claude Tetap Memimpin

Saat diuji dalam tugas penulisan kreatif, Claude 3.5 Sonnet kembali menunjukkan kekuatannya sebagai pemimpin. Dalam tantangan menulis cerita pendek yang penuh dengan deskripsi hidup dan latar belakang budaya, Claude menunjukkan kemampuan superior dalam bahasa deskriptif dan integrasi budaya, memberikan pengalaman membaca yang mendalam dan menarik.

Sementara itu, Grok-2 juga tampil baik dengan plot yang jelas dan karakter yang menarik, meskipun kecepatan cerita yang lambat membuat akhir cerita kurang berdampak. GPT-4o, meskipun kuat, tertinggal di belakang Claude dalam tugas kreatif ini.

Pengkodean Claude Masih Unggul

Dalam tugas pengkodean, Claude kembali menunjukkan dominasinya dengan menghasilkan kode yang berfungsi penuh pada percobaan pertama, disertai penjelasan yang mendalam tentang karakteristik game yang diminta.

Grok-2, di sisi lain, menghasilkan kode yang berbeda dari permintaan, mengubah permainan menjadi tes ketahanan daripada reaksi cepat, yang meskipun menyenangkan, bukanlah yang diminta.

Grok-2 Mini, versi ringan dari Grok-2, tampil jauh di bawah standar, menunjukkan bahwa xAI masih perlu bekerja keras untuk menyempurnakan model ini.

Analisis dan Ringkasan Pertarungan Seimbang

Dalam tugas menganalisis dan merangkum dokumen panjang, Grok-2 dan GPT-4o bersaing ketat. GPT-4o menunjukkan kekuatannya dalam memberikan analisis yang lebih mendalam dan komprehensif, dengan wawasan yang lebih rinci tentang implikasi dokumen.

Di sisi lain, Grok-2 tampil sebagai penyederhana konten yang jelas dan ringkas, yang lebih mudah dipahami dalam waktu singkat.

Meskipun keduanya unggul dalam cara masing-masing, pengguna yang mencari ringkasan cepat mungkin lebih memilih Grok-2, sementara mereka yang membutuhkan analisis mendalam akan lebih puas dengan GPT-4o.

Pertanyaan Trik dan Topik Sensitif Grok-2 Tidak Terkalahkan

Grok-2 menunjukkan ketepatan luar biasa dalam menjawab pertanyaan trik, memberikan jawaban yang tepat dan langsung tanpa bingung dengan detail yang salah.

Dalam topik sensitif, Grok-2 mengambil pendekatan yang tidak terduga, dengan berani memberikan tanggapan yang tidak disaring, sebuah langkah yang mungkin kontroversial tetapi menunjukkan kekuatan Grok-2 dalam menangani pertanyaan yang sulit.

Memilih AI yang Tepat untuk Tugas yang Tepat

Grok-2 membuktikan dirinya sebagai pesaing serius dalam arena AI, unggul dalam beberapa tugas dibandingkan Claude 3.5 Sonnet dan GPT-4o. Namun, tidak ada satu model yang dapat dianggap sebagai yang terbaik dalam segala hal.

Claude tetap menjadi pilihan utama bagi penulis kreatif dan pengembang kode, sementara GPT-4o mungkin lebih cocok bagi mereka yang membutuhkan analisis mendalam dan dukungan plugin pihak ketiga.

Dengan biaya berlangganan yang lebih rendah, Grok-2 menawarkan nilai yang besar, terutama bagi mereka yang mencari keseimbangan antara kinerja dan biaya.

Bagi pengguna yang menginginkan akses ke generator gambar canggih dan model AI generatif dalam satu paket, langganan X Premium yang ditawarkan oleh xAI mungkin menjadi pilihan yang paling menarik.

Namun, bagi mereka yang membutuhkan kecanggihan dan keandalan tertinggi, ChatGPT Plus dan Claude Pro tetap menawarkan keunggulan yang sulit ditandingi.

Dalam lanskap AI yang semakin kompetitif, pilihan akhir tergantung pada kebutuhan spesifik pengguna dan tugas yang ingin diselesaikan.

Grok-2, dengan semua potensinya, telah menjadikan persaingan AI semakin menarik untuk diikuti.