OpenAi dan Grok siapa yang unggul?Simak

Diposting pada

webhostdiy– Pertarungan sengit antara dua kecerdasan buatan (AI) terbaru, OpenAI o3 dan Grok 4 milik xAI (Elon Musk), baru saja terjadi di atas papan catur digital. Keduanya bentrok di partai final turnamen catur yang digelar di Kaggle Game Arena, sebuah platform yang dijuluki sebagai “Colosseum”-nya pertarungan AI.

Menariknya, turnamen ini tidak diikuti oleh AI khusus catur, melainkan oleh model AI umum yang dirancang untuk tugas sehari-hari. Jadi, ini benar-benar uji ketangkasan otak digital!

Di partai final, Grok 4 tampil mengecewakan dengan kalah telak dari OpenAI o3. Pada pertandingan pertama, AI besutan Elon Musk itu bahkan melakukan blunder fatal—langsung mengorbankan gajah di awal permainan! Alih-alih mempertahankan posisi, Grok justru menukar bidak secara tidak strategis.

Kesalahan serupa terus berulang di game berikutnya. Akibatnya, Grok 4 tumbang tanpa ampun dengan skor 0-4. OpenAI o3 berhasil mendominasi tanpa memberi kesempatan sedikit pun bagi rivalnya untuk bangkit.

kunjungi laman berita terkini di Exposenews.id

Pertandingan ini ternyata disaksikan langsung oleh legenda catur, Grandmaster Magnus Carlsen! Bersama David Howell, sesama grandmaster yang jadi komentator, Carlsen menganalisis setiap langkah kedua AI.

“Grok seperti pemain klub yang cuma hafal pembukaan, tapi bingung setelah itu. Blunder-nya terlalu banyak,” ujar Carlsen dengan nada kritis.

Sebaliknya, OpenAI o3 dinilai bermain lebih solid. Meski tidak menunjukkan kejeniusan luar biasa, AI ini konsisten menghindari kesalahan fatal dan mampu memaksimalkan setiap keunggulan posisi.

Carlsen bahkan memberi perbandingan rating ELO:

  • Grok 4 hanya setara pemain pemula (800 ELO).
  • OpenAI o3 setara pemain hobi berpengalaman (1200 ELO).

“o3 bermain seperti manusia—efisien dan tahu cara menutup pertandingan,” tambahnya.

Catur Ternyata Masih Jadi Tantangan Besar untuk AI Umum

Pertandingan ini membuktikan bahwa meski AI seperti Grok 4 dan o3 jago dalam pemrosesan bahasa, catur tetap jadi ujian berat.

Para pengamat pun berpendapat, cara AI mengambil keputusan di catur bisa jadi cerminan performanya di dunia nyata. Misalnya, saat memproses dokumen hukum atau mengatur jadwal perjalanan. Jika di catur saja sering blunder, bagaimana dengan tugas kompleks lainnya?

kunjungi laman berita tidak ada dua nya di Exposnews.id

OpenAI o3 (rilis April 2025) adalah model bahasa mutakhir yang dirancang untuk memahami perintah secara logis dan responsif. Selain catur, ia bisa menangani berbagai tugas dengan konsisten.

Sementara Grok 4 adalah generasi terbaru AI xAI (Elon Musk).

Sayangnya, di ajang catur ini, Grok 4 gagal total.

Apa Kesimpulannya?

  1. OpenAI o3 lebih stabil dan minim blunder.
  2. Grok 4 butuh peningkatan signifikan dalam logika strategis.
  3. Catur masih jadi benchmark bagus untuk uji kecerdasan AI.

Jadi, meski AI semakin canggih dalam hal bahasa, untuk mengalahkan manusia (atau AI khusus catur seperti Stockfish), mereka masih harus banyak belajar!