AI Google Bisa Ubah Nada Suara, Kini Gratis Dipakai

3 weeks ago 35

Harianjogja.com, JOGJA—Inovasi terbaru dari Google menghadirkan suara AI yang kini bisa diatur menjadi antusias, serius, hingga santai, bahkan tersedia gratis untuk pengguna.

Model text-to-speech terbaru bernama Gemini 3.1 Flash TTS ini mendukung lebih dari 70 bahasa, termasuk Bahasa Indonesia, dan mulai dirilis global sejak Rabu (15/4/2026).

Kemampuan baru ini membuka peluang besar bagi kreator konten, pendidik, hingga pelaku bisnis di Indonesia untuk menghasilkan audio berkualitas tinggi tanpa harus menggunakan jasa pengisi suara profesional.

Gemini 3.1 Flash TTS merupakan bagian dari pengembangan keluarga AI Gemini yang fokus pada peningkatan kualitas interaksi berbasis suara. Salah satu keunggulan utamanya adalah kemampuan menghasilkan suara yang terdengar lebih natural dan ekspresif, mendekati intonasi manusia.

Fitur yang paling menonjol adalah penggunaan “Audio Tags”, yang memungkinkan pengguna mengatur gaya bicara hanya melalui perintah teks. The Decorder mengungkapkan, dengan fitur ini, pengguna bisa menentukan apakah suara AI terdengar antusias, serius, santai, atau bahkan seperti narator audiobook.

Tak hanya itu, model ini juga mendukung percakapan dengan lebih dari satu pembicara (multi-speaker), sehingga cocok untuk membuat konten seperti podcast atau dialog interaktif tanpa perlu merekam suara manusia.

Pilihan gaya suara yang tersedia juga beragam, mulai dari gaya kasual hingga formal seperti pembawa berita. Pengguna bahkan bisa memilih aksen tertentu, termasuk aksen Amerika dan Inggris, sesuai kebutuhan konten.

Dalam pengujian yang dilakukan oleh Artificial Analysis, model ini mencatat skor Elo 1.211 dan dinilai unggul dalam perbandingan kualitas dan biaya. Bahkan, performanya disebut melampaui beberapa model populer seperti ElevenLabs v3 dan hanya sedikit di bawah Inworld 1.5 Max.

Untuk penggunaan, Google menyediakan akses gratis bagi pengguna umum. Namun, data dari penggunaan versi gratis akan dimanfaatkan untuk pengembangan teknologi lebih lanjut.

Sementara itu, versi berbayar menawarkan tarif sekitar 1 dolar AS per juta token untuk input teks dan 20 dolar AS per juta token untuk output audio. Tersedia juga mode batch dengan biaya lebih rendah.

Saat ini, Gemini 3.1 Flash TTS masih berada dalam tahap pratinjau dan dapat diakses melalui API Gemini, Vertex AI untuk kalangan perusahaan, serta Google Vids bagi pengguna Workspace. Pengguna umum dapat mencoba layanan ini melalui Google AI Studio.

Untuk menjaga transparansi, setiap audio yang dihasilkan akan dilengkapi watermark digital menggunakan teknologi SynthID. Watermark ini tidak terdengar oleh manusia, tetapi dapat dikenali oleh sistem komputer sebagai penanda konten buatan AI.

Dengan hadirnya teknologi ini, pengguna kini memiliki kontrol lebih besar terhadap produksi audio digital. Suara AI tidak lagi terdengar kaku, melainkan mampu menyampaikan emosi dan gaya komunikasi yang lebih hidup sesuai kebutuhan.

Cek Berita dan Artikel yang lain di Harian Jogja, dan edisi cetak versi elektronik kami hadir di Epaper Harian Jogja.

Read Entire Article