Apple Pamer AI Sharp: Render 3D Fotorealistik Hanya dari Satu Foto dan Dalam Satu Detik

Webhostdiy.com – Perusahaan teknologi raksasa Apple baru saja mengembangkan model kecerdasan buatan (AI) teranyar yang mereka beri nama “Sharp”. Model AI canggih ini punya satu kemampuan yang bikin geleng-geleng: mengubah gambar 2D biasa menjadi visual 3D yang nyaris mirip aslinya! Namun, yang paling mencengangkan, ternyata kemampuan keren itu bisa dijalankan oleh Sharp hanya dalam waktu kurang dari satu detik saja. Bayangkan, dalam hitungan sepersekian detik, foto biasa kamu berubah jadi adegan tiga dimensi!

Selanjutnya, Apple memaparkan semua kehebatan Sharp ini dalam sebuah studi berjudul “Sharp Monocular View Synthesis in Less Than a Second”. Menurut mereka, Sharp tidak hanya cepat, tetapi juga mampu menghasilkan gambar 3D dengan akurasi yang sangat tinggi. Hasilnya, gambar yang dihasilkan punya dimensi dan proporsi yang sangat sesuai, persis seperti objek asli yang kita lihat di dunia nyata. Dengan kata lain, detail dan kedalamannya sangat terjaga.

Tak cuma klaim, dalam studi tersebut Apple juga secara langsung memamerkan kebolehan Sharp dalam menyulap foto biasa menjadi gambar 3D. Hasilnya? Benar-benar realistis! Bahkan, detail-detail kecil seperti bulu halus pada hewan peliharaan bisa tampak sangat tajam dan hidup. Hasil render-nya nyaris tidak bisa dibedakan dari foto langsung objek aslinya, seolah-olah kita bisa melihat dan meraba objek dalam foto tersebut.

Lalu, bagaimana sih cara kerjanya? Secara lebih spesifik, para peneliti Apple menjelaskan bahwa Sharp menggunakan pendekatan revolusioner bernama 3D Gaussian Splatting. Pertama-tama, model AI ini akan mengubah satu foto tunggal menjadi sebuah representasi ruang tiga dimensi. Prosesnya dimulai dengan menyusun adegan dari jutaan—bahkan mungkin miliaran—titik cahaya virtual yang sangat kecil.

Setelah itu, Sharp akan memproses semua titik cahaya virtual tersebut dalam satu kali komputasi raksasa di dalam jaringan sarafnya. Teknik inilah yang menjadi kunci kecepatannya. Alhasil, rekonstruksi atau pembangunan ulang adegan 3D yang komplet dapat diselesaikan dalam waktu kurang dari satu detik. Tim peneliti Apple dengan bangga menyatakan, “Representasi 3D Gaussian yang dihasilkan Sharp dapat dirender secara real-time untuk menghasilkan gambar fotorealistik beresolusi tinggi dari sudut pandang yang berdekatan.”

Nah, di sinilah letak keunggulan utama Sharp. Sebab, selama ini untuk membangun satu adegan 3D yang baik, biasanya kita membutuhkan puluhan hingga ratusan foto dari berbagai sudut yang berbeda. Akan tetapi, Sharp dirancang secara khusus untuk mampu merekonstruksi satu lingkungan 3D utuh hanya dari satu foto saja! Ini seperti memiliki kemampuan super untuk melihat dimensi ketiga dari sebuah gambar datar.

Tentu saja, untuk mencapai kemampuan luar biasa ini, Apple tidak main-main dalam melatih Sharp. Mereka melatihnya menggunakan kombinasi data sintetis (buatan komputer) dan gambar dunia nyata dalam skala yang sangat besar. Melalui proses pelatihan intensif ini, Sharp secara perlahan belajar mengenali pola kedalaman, tekstur, dan bentuk umum yang sering muncul di berbagai skenario pemotretan.

Lantas, apa yang terjadi saat Sharp menerima foto baru? Pertama, AI ini akan langsung memperkirakan jarak setiap objek dalam foto. Kemudian, berdasarkan pengetahuan yang didapat dari pelatihan, ia akan menyempurnakan estimasi jarak tersebut. Setelah itu, dalam sekejap, Sharp menentukan posisi, warna, ukuran, dan karakteristik dari jutaan titik Gaussian 3D sekaligus. Proses inilah yang akhirnya membuat rekonstruksi 3D bisa dilakukan dengan kecepatan tinggi dan akurasi memukau.

Bahkan, Apple dengan percaya diri mengklaim bahwa Sharp mencatatkan peningkatan signifikan dibandingkan model generasi sebelumnya. Sharp berhasil menurunkan metrik kesalahan visual seperti LPIPS hingga 25–34 persen dan DISTS sebesar 21–43 persen. Yang lebih dahsyat lagi, waktu sintesis atau pembuatan gambar 3D-nya dipangkas hingga ribuan kali lebih cepat! Benar-benar lompatan teknologi yang fantastis.

Meski terdengar sempurna, model AI ini masih memiliki satu kekurangan untuk saat ini. Sharp hanya bekerja optimal untuk sudut pandang virtual yang masih berada di dekat posisi kamera asli saat foto diambil. Dengan kata lain, AI ini tidak secara ajaib menciptakan atau “mengarang” bagian baru dari adegan yang tidak terekam dalam foto asli. Oleh karena itu, jika sudut pandang virtual kita geser terlalu jauh, akurasi visualnya berisiko menurun karena akan muncul bagian yang kosong atau tidak jelas.

Akan tetapi, pembatasan ini sengaja diambil oleh Apple sebagai sebuah pertimbangan desain. Tujuannya jelas, yaitu untuk menjaga kecepatan pemrosesan yang super cepat sekaligus mempertahankan kualitas hasil 3D yang tetap sangat realistis dan tidak aneh. Jadi, lebih baik fokus pada kualitas di area yang diketahui, daripada mengarang bagian yang tidak jelas.

Nah, buat kamu yang penasaran dan ingin langsung mencoba, kabar baiknya Sharp sudah bisa diakses oleh publik melalui platform GitHub! Sudah banyak pengguna yang menjajal kemampuannya dan membagikan hasil yang menakjubkan di media sosial X/Twitter. Kamu bisa melihat sendiri betapa realistisnya hasil transformasi 2D ke 3D yang dilakukan oleh AI cerdas besutan Apple ini. Jadi, siap-siap terpukau dengan masa depan fotografi dan augmented reality yang semakin dekat!

Kunjungi juga situs berita terupdate hanya di Desapenari.id

Sebarkan ini:

Posting terkait:

Tinggalkan Balasan Batalkan balasan