DeepMind Rilis DiffusionGemma, AI Open-source 4 Kali Lebih Cepat dari Gemma Biasa

Webhostdiy.com – Google secara resmi meluncurkan model kecerdasan buatan terbarunya yang diberi nama DiffusionGemma pada Rabu (10/6/2026). Model canggih ini dikembangkan oleh DeepMind, divisi AI andalan Google yang selama ini dikenal sebagai gudang inovasi teknologi masa depan. Menariknya, DiffusionGemma hadir sebagai penerus dari lini AI open-source Gemma 4 yang sebelumnya sudah menarik perhatian para pengembang di seluruh dunia.

Bukan AI Biasa! DiffusionGemma Kerjanya Beda Total

Namun, jangan bayangkan DiffusionGemma sama seperti model AI pada umumnya! Model ini memiliki cara kerja yang benar-benar berbeda karena tidak menghasilkan output secara berurutan. Perbedaan fundamental inilah yang menjadi kunci keunggulan utamanya dibandingkan pendahulunya.

Untuk memahami keunikan DiffusionGemma, kita perlu melihat dulu bagaimana sebagian besar model AI bekerja saat ini. Pada umumnya, model AI menghasilkan teks secara berurutan, token demi token dari kiri ke kanan seperti orang membaca buku. Teknik yang disebut autoregresif ini memang sudah terbukti efektif, tetapi ternyata memiliki keterbatasan tersendiri dalam hal kecepatan dan efisiensi.

DiffusionGemma justru membalik konsep tersebut dengan menerapkan teknik diffusion yang revolusioner. Alih-alih menulis kata demi kata, model ini menghasilkan seluruh blok teks secara paralel dalam satu waktu, mirip seperti cara kerja model pembuat gambar AI yang sudah kita kenal. Bayangkan seperti melukis, di mana model ini membuat sketsa kasar terlebih dahulu, kemudian menyempurnakannya secara bertahap hingga menjadi jawaban akhir yang sempurna.

Speknya Gila! 26 Miliar Parameter Tapi Cuma Aktif 3,8 Miliar

Google mengklaim bahwa pendekatan inovatif ini membuat kinerja DiffusionGemma jauh lebih cepat dan lebih efisien, terutama ketika dijalankan secara lokal di perangkat seperti GPU Nvidia DGX atau bahkan GPU gaming ringan sekalipun. Ini berarti para pengembang tidak perlu lagi mengandalkan infrastruktur cloud yang mahal untuk menjalankan model AI canggih.

Secara teknis, DiffusionGemma dibangun dengan arsitektur Mixture of Experts (MoE) yang mencakup total 26 miliar parameter. Namun jangan khawatir! Hanya sekitar 3,8 miliar parameter yang aktif digunakan saat proses inferensi berlangsung. Karena efisiensi ini, model dapat dijalankan dengan nyaman pada perangkat yang memiliki RAM sekitar 18 GB, termasuk GPU gaming kelas atas yang mungkin sudah Anda miliki di rumah.

Google dengan antusias membagikan hasil pengujian mereka melalui posting blog resmi. Dalam pengujian menggunakan kartu grafis Nvidia RTX 5090, DiffusionGemma mampu menghasilkan sekitar 700 token per detik yang sungguh mencengangkan! Bahkan ketika dijalankan menggunakan akselerator AI Nvidia H100, kecepatannya tembus hingga 1.000 token per detik. Angka ini empat kali lebih cepat dibandingkan model Gemma autoregressive dengan ukuran yang sebanding. Bayangkan, apa yang bisa Anda lakukan dengan kecepatan secepat itu?

Nggak Cuma Cepat, Jago Pecahkan Sudoku Juga!

Menurut penjelasan Google, kinerja spektakuler tersebut dapat dicapai karena DiffusionGemma menggeser beban kerja dari bandwidth memori ke komputasi. Dengan strategi ini, model dapat menghasilkan hingga 256 token secara paralel hanya dalam satu proses. Ini seperti memiliki 256 penulis yang bekerja bersamaan untuk menyelesaikan sebuah tulisan, dibandingkan hanya satu penulis yang bekerja secara berurutan.

Dukungan komputasi paralel ini menjadikan DiffusionGemma sangat cocok untuk berbagai tugas yang bersifat tidak linier. Misalnya, Anda bisa menggunakannya untuk pengeditan teks langsung yang memungkinkan perubahan terjadi secara instan. Model ini juga handal untuk penyusunan urutan molekul dalam penelitian kimia, pembuatan grafik matematika yang kompleks, hingga pemecahan teka-teki Sudoku yang selama ini menjadi momok bagi model AI konvensional.

Berbicara tentang Sudoku, perlu diketahui bahwa permainan logika ini selama ini dikenal sebagai tantangan berat bagi model AI konvensional. Mengapa? Karena setiap angka pada kotak Sudoku bergantung pada angka lain yang belum tentu sudah dihasilkan oleh model. Model autoregresif akan kesulitan karena mereka tidak bisa “melihat” angka-angka selanjutnya saat sedang mengisi kotak pertama.

Dengan kemampuan memperbaiki banyak token secara bersamaan, DiffusionGemma dinilai lebih mudah menemukan pola dan solusi yang konsisten. Google bahkan menunjukkan demonstrasi langsung bagaimana model tersebut dapat menyelesaikan puzzle Sudoku dengan melakukan koreksi berulang pada seluruh papan permainan hingga menemukan jawaban yang tepat. Ini seperti memiliki pemain Sudoku profesional yang bisa melihat seluruh papan dan melakukan koreksi di semua kotak yang salah secara bersamaan.

Masih Eksperimen, Tapi Udah Bisa Dicoba Sekarang!

Meskipun DiffusionGemma memiliki segudang keunggulan, Google dengan jujur mengakui bahwa teknik diffusion pada model ini masih memiliki sejumlah keterbatasan. Beberapa di antaranya yaitu tingkat kesalahan yang lebih tinggi dibandingkan model AI autoregresif. Hal ini terjadi karena pendekatan paralel memang lebih rentan terhadap kesalahan dibandingkan pendekatan sekuensial yang lebih terkontrol.

Untuk memahami keterbatasan ini, bayangkan pada model pembuat gambar, kesalahan pada beberapa piksel biasanya tidak terlalu memengaruhi hasil akhir karena mata manusia masih bisa menafsirkan gambar secara keseluruhan. Namun dalam teks, kesalahan pada satu token saja dapat mengubah makna kalimat secara signifikan. Sebuah kata yang salah bisa mengubah seluruh pesan yang ingin disampaikan, sehingga tingkat akurasi menjadi sangat krusial.

Selain itu, pendekatan diffusion juga kurang efisien untuk menghasilkan jawaban yang sangat pendek. Mengapa demikian? Karena model tetap harus menjalankan proses paralel yang cukup besar meskipun output yang dihasilkan hanya sedikit. Ini seperti menyalakan mesin pesawat jet hanya untuk perjalanan sejauh 100 meter, tentu tidak efisien baik dari segi waktu maupun sumber daya komputasi.

Alasan itulah yang membuat Google masih sebatas bereksperimen dengan DiffusionGemma dan belum mengadopsinya ke Gemini yang digunakan secara luas lewat cloud. Tim peneliti masih terus menyempurnakan model ini untuk mengurangi tingkat kesalahan dan meningkatkan efisiensinya dalam berbagai skenario penggunaan. Namun, langkah ini menunjukkan komitmen Google untuk terus berinovasi dan mengeksplorasi berbagai pendekatan baru dalam pengembangan AI.

Kabar baiknya, DiffusionGemma sudah tersedia untuk diunduh oleh para pengembang melalui platform Hugging Face yang populer di kalangan komunitas AI. Model ini dirilis dengan lisensi Apache 2.0, sama seperti model Gemma generasi keempat lainnya. Lisensi open-source ini berarti para pengembang bebas menggunakan, memodifikasi, dan mendistribusikan model sesuai kebutuhan mereka tanpa harus membayar biaya lisensi yang mahal.

Dengan dirilisnya DiffusionGemma, Google sekali lagi membuktikan komitmennya dalam memajukan teknologi AI yang lebih cepat, lebih efisien, dan lebih mudah diakses oleh semua kalangan. Meskipun masih dalam tahap eksperimental, model ini membuka jalan bagi pendekatan baru dalam pengembangan AI yang mungkin akan mengubah cara kita berinteraksi dengan teknologi kecerdasan buatan di masa depan.

Dapatkan juga berita teknologi terbaru hanya di newtechclub.com

Bukan AI Biasa! DiffusionGemma Kerjanya Beda Total

Speknya Gila! 26 Miliar Parameter Tapi Cuma Aktif 3,8 Miliar

Nggak Cuma Cepat, Jago Pecahkan Sudoku Juga!

Masih Eksperimen, Tapi Udah Bisa Dicoba Sekarang!

Sebarkan ini:

Posting terkait: