OpenAI Luncurkan GPT&Realtime&2 untuk Interaksi Suara Real&Time

Sedang Trending 1 jam yang lalu

OpenAI secara resmi meluncurkan GPT-Realtime-2, sebuah model kecerdasan buatan berbasis audio terbaru yang mampu melakukan percakapan suara natural dan penalaran kompleks secara real-time pada Rabu (13/5/2026). Peluncuran ini dilakukan melalui pembaruan antarmuka pemrograman aplikasi (API) untuk mendukung pengembang asisten virtual.

Model baru tersebut diperkenalkan sebagai bagian dari paket pembaruan bertajuk Advancing Voice Intelligence with New Models in the API. Dilansir dari Bloombergtechnoz, teknologi ini dirancang untuk menghadirkan interaksi yang lebih cepat tanpa perlu mengubah audio menjadi teks terlebih dahulu.

Selain model utama tersebut, OpenAI turut merilis GPT-Realtime-Translate untuk penerjemahan lintas bahasa dan GPT-Realtime-Whisper untuk transkripsi streaming. Ketiga inovasi ini menyasar kebutuhan layanan pelanggan otomatis serta dokumentasi pertemuan secara langsung bagi para pengembang aplikasi global.

"Kami memperkenalkan tiga model audio di API yang membuka kelas baru aplikasi suara untuk pengembang," tulis OpenAI.

Pihak pengembang menyatakan bahwa GPT-Realtime-2 merupakan model audio perdana yang mengintegrasikan kemampuan penalaran sekelas GPT-5 ke dalam interaksi suara. Sistem ini diklaim mampu memahami konteks percakapan yang panjang serta menangani interupsi pengguna secara lebih manusiawi.

Secara teknis, model GPT-Realtime-2 mencatatkan peningkatan performa signifikan dengan skor evaluasi 15,2 persen lebih tinggi dibandingkan versi GPT-Realtime-1.5 dalam pengujian Big Bench. Peningkatan ini memperkuat fungsionalitas agen suara dalam lingkungan produksi yang menuntut respons instan.

Terkait jangkauan fitur, GPT-Realtime-Translate telah mendukung lebih dari 70 bahasa input dan 13 bahasa output. Sementara itu, GPT-Realtime-Whisper dioptimalkan khusus untuk pembuatan takarir rapat otomatis dan pencatatan dokumentasi secara streaming.

Daftar Harga Layanan OpenAI Realtime APIModelInputOutput
GPT-Realtime-2US$32 per 1 juta tokenUS$64 per 1 juta token
GPT-Realtime-TranslateUS$0,034 per menit-
GPT-Realtime-WhisperUS$0,017 per menit-

Untuk skema biaya, penggunaan GPT-Realtime-2 ditetapkan sebesar US$32 per 1 juta token input audio dan US$64 per 1 juta token output. OpenAI juga memberlakukan tarif khusus sebesar US$0,40 per 1 juta token untuk input cache dalam sistem API tersebut.