DeepSeek V3.1 Resmi Rilis, ini lengkapnya!

webhostdiy.com — Perusahaan kecerdasan buatan (AI) asal Hangzhou, DeepSeek, secara resmi meluncurkan model bahasa terbaru mereka, yaitu DeepSeek V3.1. Kehadiran model ini tidak hanya memanaskan persaingan global di pasar AI, tetapi juga menantang dominasi perusahaan-perusahaan AS seperti OpenAI.

Sebagai pengembangan dari model V3 yang rilis Maret lalu, DeepSeek V3.1 menghadirkan sejumlah peningkatan besar. Misalnya, model ini sekarang memiliki 685 miliar parameter, sehingga menjadikannya salah satu model bahasa terbesar di dunia. Sebagai perbandingan, OpenAI GPT-3 hanya menggunakan 175 miliar parameter. Dengan kapasitas sebesar itu, DeepSeek V3.1 diharapkan dapat lebih pintar dalam menjawab, lebih nyambung dalam percakapan panjang, dan lebih fleksibel dalam menangani berbagai jenis tugas.

Selain itu, DeepSeek V3.1 juga dilengkapi dengan context window yang lebih panjang. Artinya, model ini mampu mengingat dan memahami lebih banyak informasi dalam satu percakapan. Bagi pengguna, fitur ini membuat interaksi dengan AI terasa lebih nyambung, konsisten, dan akurat, bahkan dalam percakapan yang sangat panjang.

Tidak hanya unggul dalam kapasitas memori, V3.1 juga mendukung berbagai format tensor, seperti BF16, F8_E4M3, dan F32. Hal ini tentu memberikan keleluasaan lebih bagi pengembang dan peneliti untuk menyesuaikan kebutuhan teknis mereka. Saat ini, DeepSeek V3.1 sudah dapat diunduh melalui platform Hugging Face, meskipun layanan API dan inference publiknya belum dirilis.

DeepSeek disebut mengadopsi strategi konsolidasi saat mengembangkan V3.1. Pendekatan ini mereka ambil setelah melihat kegagalan model hybrid sebelumnya, baik dari pengembangan internal maupun dari rival seperti “Qwen” yang dikembangkan oleh Alibaba Cloud. Model sebelumnya sempat mengalami penurunan performa saat menggabungkan berbagai kemampuan, tetapi kini DeepSeek berhasil menemukan formula yang lebih stabil.

Kehadiran DeepSeek V3.1 di pasar semakin memperketat persaingan dengan model-model unggulan lainnya, seperti GPT-5 dari OpenAI yang juga baru dirilis awal Agustus. GPT-5 menawarkan mode Fast, Auto, dan Thinking untuk menyesuaikan kebutuhan pengguna. Namun, DeepSeek mencoba menantang melalui parameter yang lebih besar dan distribusi terbuka melalui Hugging Face.

Bagi pengguna umum, peningkatan ini membuat percakapan dengan AI terasa lebih alami dan panjang. Sementara bagi komunitas pengembang, kehadiran V3.1 memperluas pilihan model AI sekaligus menjadi pesaing langsung bagi beberapa perusahaan besar yang selama ini memimpin pasar.

Sebelumnya, model DeepSeek R1 sudah membuat kejutan karena mampu mengungguli beberapa model AI dari perusahaan ternama dalam uji standar, meskipun dikembangkan dengan biaya yang jauh lebih rendah. Hal ini membuktikan bahwa perusahaan Tiongkok bisa menjadi penantang serius di industri AI yang selama ini didominasi oleh pemain AS seperti OpenAI, Google, dan Meta.

Saat ini, para penggemar teknologi masih menantikan rilis DeepSeek R2, penerus dari R1 yang sebelumnya menuai pujian. Namun, peluncurannya disebut tertunda karena CEO DeepSeek, Liang Wenfeng, dikenal sebagai perfeksionis yang ingin memastikan kualitas produk benar-benar matang sebelum dirilis.

Dengan segala keunggulan dan inovasinya, DeepSeek V3.1 tidak hanya menjadi bukti kemajuan AI dari Tiongkok, tetapi juga memberikan tekanan lebih bagi pesaing dari Barat. Model ini diharapkan dapat memberikan pengalaman lebih baik bagi pengguna dan sekaligus mendorong inovasi lebih lanjut di dunia AI.

Sebarkan ini:

Posting terkait:

Tinggalkan Balasan Batalkan balasan