Model AI Baru Google Bisa Bikin Video dengan Perintah Suara

1 jam yang lalu

PERUSAHAAN teknologi Google baru saja meluncurkan model akal imitasi (AI) terbarunya yang mampu menghasilkan video hanya dengan instruksi suara. Produk bernama Gemini Omni Flash ini dirilis khusus untuk pelanggan Google AI Plus, Pro, dan Ultra di seluruh dunia.

Hal pembeda dari produk AI baru Google ini adalah kemampuannya yang bisa menerjemahkan perintah suara dari pengguna, tanpa perlu lagi memasukkan teks prompt yang panjang. Pengguna hanya perlu berkata “buat patung dari gelembung” atau “ketika orang tersebut menyentuh cermin, buatlah cermin itu bergelombang seperti cairan” maka video berbasis AI akan tercipta.

Scroll ke bawah untuk melanjutkan membaca

Menurut Phone Arena, model AI ini mampu mempertahankan bentuk karakter wajah dari setiap instruksi yang diberikan. Kondisi ini sekaligus menjawab permasalahan video AI yang selama ini dianggap kerap terkendala dari sisi visual wajah karena tidak mirip dengan permintaan pengguna.

Omni tidak hanya menghasilkan visual yang indah, tetapi juga mempertimbangkan apa yang seharusnya terjadi selanjutnya. Google mengatakan model ini memiliki pemahaman yang lebih baik tentang gravitasi, energi kinetik, dan dinamika fluida, sehingga adegan terasa tidak seperti halusinasi AI dan lebih seperti rekaman nyata.

Google juga memberikan pengetahuan kepada Gemini yang lebih luas tentang sejarah, sains, dan budaya untuk menghasilkan video bergaya penjelasan. Misalnya, sebuah petunjuk singkat tentang pelipatan protein dapat menghasilkan penjelasan lengkap dalam bentuk animasi.

Setiap video yang dihasilkan Gemini Omni memiliki tanda air SynthID yang tidak terlihat. Pengguna dapat memverifikasi asal usul AI dari video apa pun melalui aplikasi Gemini, Chrome, atau Pencarian. Itu adalah pengaman tingkat tinggi, mengingat betapa cepatnya teknologi ini berkembang.