Kumparan Logo

Google Rilis Gemini Omni, AI yang Bisa Edit Video via Prompt Teks

kumparanTECHverified-green

·waktu baca 3 menit

comment
0
sosmed-whatsapp-white
copy-circle
more-vertical
Gemini Omni. Foto: Google
zoom-in-whitePerbesar
Gemini Omni. Foto: Google

Google memperkenalkan Gemini Omni dalam ajang Google I/O 2026. Teknologi kecerdasan buatan (AI) terbaru ini memungkinkan pengguna mengedit video hanya lewat prompt (perintah) teks sederhana, tanpa perlu memakai software editing yang rumit.

CEO Google, Sundar Pichai, mengatakan Gemini Omni menjadi langkah lanjutan mereka untuk menciptakan model AI multimodal yang mampu memahami sekaligus menghasilkan teks, gambar, audio, hingga video dalam satu sistem terpadu. "(Gemini Omni) bisa menciptakan apa pun dari input apa pun," kata Pichai dalam sesi briefing media.

Fitur utama Gemini Omni dimulai dari kemampuan membuat dan mengedit video. Pengguna dapat menggabungkan gambar, audio, video, dan teks ke dalam satu prompt. AI kemudian akan memahami seluruh konteks tersebut untuk menghasilkan video yang konsisten.

Google menyebut Omni tidak sekadar "menempelkan" berbagai media menjadi satu. Model AI ini diklaim memahami unsur fisika, budaya, sejarah, hingga sains untuk menghasilkan video yang lebih realistis.

Salah satu demo yang ditampilkan adalah ketika Omni diberi prompt 'video claymation tentang protein folding'. AI itu langsung membuat video animasi stop-motion lengkap dengan narasi suara yang menjelaskan proses pelipatan protein.

Teknologi ini dikembangkan dengan menggabungkan kecerdasan model Gemini dan kemampuan rendering video dari model media Google seperti Google Veo. Director of Product Management Google DeepMind, Nicole Brichtova, menegaskan Omni bukan sekadar pembaruan Veo.

“Ini adalah langkah berikutnya dalam menggabungkan kecerdasan Gemini dengan kemampuan rendering model media kami,” ujarnya, mengutip TechCrunch.

video youtube embed

Selain membuat video, Gemini Omni juga bisa mengedit foto menggunakan perintah teks biasa, mirip seperti fitur Nano Banana milik Google. Pengguna cukup mengetik instruksi seperti menghapus objek di latar belakang atau mengubah elemen tertentu dalam video maupun foto.

Google juga menghadirkan fitur avatar digital pribadi. Pengguna dapat membuat video menggunakan avatar diri mereka sendiri, mirip fitur Cameos yang sempat populer di aplikasi Sora milik OpenAI.

Untuk mencegah penyalahgunaan deepfake, Google mewajibkan proses verifikasi khusus. Pengguna harus merekam wajah sambil mengucapkan serangkaian angka sebelum avatar digital dibuat dan disimpan.

Seluruh video yang dibuat dengan Gemini Omni juga akan dibekali watermark digital SynthID. Teknologi ini memungkinkan orang memverifikasi apakah sebuah video dibuat menggunakan AI Google.

Model pertama yang dirilis adalah Gemini Omni Flash. Teknologi ini mulai tersedia di aplikasi Gemini, YouTube Shorts, dan studio kreatif AI bernama Flow.

Versi Flash saat ini mampu membuat video berdurasi hingga 10 detik. Google mengatakan batas tersebut bukan karena keterbatasan model AI, tetapi keputusan awal agar lebih banyak pengguna bisa mencoba teknologinya.

Google juga menyiapkan penggunaan Gemini Omni untuk profesional dan bisnis. Dalam beberapa pekan ke depan, Gemini Omni akan tersedia lewat API untuk developer dan perusahaan.

Google turut menyiapkan versi lebih canggih bernama Omni Pro. Model ini diklaim akan memiliki performa lebih tinggi untuk kebutuhan profesional, meski jadwal peluncurannya belum diumumkan.