Google kembali menunjukkan dominasinya di ranah kecerdasan buatan dengan memperkenalkan Veo 3, model AI generatif terbaru yang dirancang untuk menciptakan video secara otomatis hanya dari input teks.
Teknologi ini resmi diumumkan dalam ajang Google I/O 2025 dan disebut-sebut sebagai lompatan besar dalam dunia kreatif berbasis AI.
Yang membuat Veo 3 berbeda dari pendahulunya adalah kemampuannya menghasilkan audio dan dialog secara mandiri, bahkan tanpa perintah eksplisit dari pengguna.
Veo 3 tidak hanya memahami konteks visual, tetapi juga mampu menambahkan elemen naratif sesuai dengan adegan yang diciptakan.
Hasil akhirnya adalah video yang tidak hanya terlihat realistis, tetapi juga terdengar seolah-olah dibuat oleh tim produksi profesional.
Baca juga: Mark Zuckerberg Bongkar Ide Liar Meta di Sidang Antitrust, Termasuk Pisahkan Instagram
Inovasi Google yang Memadukan Visual dan Audio AI
Dalam presentasinya di Google I/O, Josh Woodward selaku VP Google untuk produk Gemini, menyebut Veo 3 sebagai bagian dari ‘era baru penciptaan konten’.
Ia menegaskan bahwa teknologi ini memungkinkan siapa saja untuk membuat video yang sangat meyakinkan tanpa perlu keterampilan editing atau produksi video secara teknis.
Fitur unggulan dari Veo 3 adalah kemampuan menghasilkan suara, efek audio, bahkan suara manusia secara otomatis. Ini berarti pengguna hanya perlu mengetikkan narasi singkat dan dalam hitungan menit, sistem akan mengubahnya menjadi video dengan animasi, latar musik, dan bahkan kemungkinan suara yang dihasilkan secara mandiri.
Namun untuk menikmati seluruh fitur Veo 3, pengguna diwajibkan berlangganan paket Google AI Ultra, yang saat ini ditawarkan dengan harga premium.
Hal ini menandakan bahwa teknologi tersebut lebih ditujukan bagi kreator profesional, institusi media, hingga perusahaan produksi konten.
Potensi dan Risiko di Era Video Generatif AI
Meski menawarkan banyak kemudahan, kehadiran Veo 3 juga memunculkan sejumlah kekhawatiran, terutama soal penyebaran misinformasi dan video palsu.
Baca juga: Android Auto Dapat Dukungan Spotify Jam, Aplikasi Video, dan Browser Web
Dengan kualitas video yang begitu realistis, tidak menutup kemungkinan teknologi ini digunakan untuk membuat video manipulatif, seperti berita palsu, propaganda, atau konten sensasional yang mengelabui publik.
Kemampuan Veo 3 untuk menambahkan suara atau narasi secara otomatis juga memunculkan tantangan baru dalam regulasi konten digital.
Sebab, ketika sistem AI dapat ‘mengarang’ bagian dari video tanpa kontrol penuh dari pengguna, maka tanggung jawab atas isi konten menjadi semakin kabur.
Untuk mengatasi hal ini, Google menyatakan telah menyematkan sistem keamanan internal dan akan terus memperbarui model Veo 3 agar tidak disalahgunakan.
Selain itu, perusahaan juga tengah menjajaki kerja sama dengan mitra regulasi dan platform distribusi media untuk memastikan transparansi dalam penggunaan teknologi ini.
Ke depannya, Google berencana menghadirkan kontrol tambahan bagi pengguna untuk mengatur tingkat narasi otomatis, memperhalus sinkronisasi bibir dan suara, serta memperluas dukungan bahasa.
Dengan semakin banyaknya aktor besar seperti OpenAI, Meta, dan Adobe yang juga mengembangkan teknologi sejenis, persaingan di pasar AI video generator diprediksi akan semakin ketat dan seru.