OpenAI Membuka Era Baru dalam Teknologi Suara dan Gambar!

OpenAI, perusahaan riset kecerdasan buatan (AI) ternama, baru-baru ini mengumumkan peluncuran berbagai teknologi AI canggih. Dari model pengenalan suara multibahasa hingga model teks-ke-gambar, OpenAI terus memperluas cakupan dan aksesibilitas teknologi AI. Simak berita lengkapnya berikut ini!

Whisper V3: Pengenalan Suara Multibahasa

OpenAI telah merilis sumber terbuka dari model pengenalan suara terbaru mereka, Whisper V3. Model ini menunjukkan kemampuan luar biasa dalam memahami dan menyalin suara dalam berbagai bahasa, melampaui model berbasis bahasa Inggris sebelumnya.

Whisper V3 mampu menangani berbagai input bahasa dengan efektif, meski efektivitasnya dapat berfluktuasi tergantung pada bahasa yang ditranskripsi. Model ini tersedia di GitHub dengan lisensi yang memperbolehkan pengguna untuk menyalin berbagai bentuk konten dengan akurasi terbaik di kelasnya.

DALL-E 3 dan Audio API: Membawa AI ke Tingkat Berikutnya

OpenAI juga memperkenalkan DALL-E 3, model teks-ke-gambar mereka yang sekarang dapat diakses melalui API. Dibandingkan dengan pendahulunya, DALL-E 3 memiliki beberapa keterbatasan, namun tetap menawarkan berbagai opsi format dan kualitas.

Selain itu, OpenAI juga meluncurkan Audio API, yang menyediakan akses ke enam suara preset dan dua varian model AI generatif. CEO OpenAI, Sam Altman, menekankan kealamiannya dalam menghasilkan audio, yang berpotensi meningkatkan interaksi aplikasi, aksesibilitas, pembelajaran bahasa, dan bantuan suara.

OpenAI: Mendorong Inovasi dan Aksesibilitas

Peluncuran API ini mencerminkan komitmen OpenAI untuk memperluas aksesibilitas dan utilitas teknologi AI canggih. Seiring dengan perkembangan teknologi, OpenAI berada di garis depan dalam memberdayakan pengembang dan kreator dengan alat inovatif.

Dengan dataset besar yang mencakup 680.000 jam data yang dipantau dengan ketat, OpenAI terus memperhalus alat AI mereka untuk mendorong inovasi dan memperluas cakupan teknologi pengenalan suara di seluruh dunia.

Dengan langkah-langkah besar ini, OpenAI terus membuka jalan bagi penelitian dan aplikasi AI. Dengan berbagi teknologi mereka secara terbuka, mereka memfasilitasi penelitian lebih lanjut dan pengembangan aplikasi praktis dalam bidang ini, membuka peluang baru bagi peneliti, pengembang, dan pengguna di seluruh dunia.

Ikuti kami di Google News untuk mendapatkan berita-berita terbaru seputar crypto. Nyalakan notifikasi agar tidak ketinggalan beritanya.

*Disclaimer

Konten ini bertujuan memperkaya informasi pembaca. Selalu lakukan riset mandiri dan gunakan uang dingin sebelum berinvestasi. Segala aktivitas jual beli dan investasi aset crypto menjadi tanggung jawab pembaca.

Referensi:

Mpost. Whisper V3 by OpenAI Goes Open Source, Expanding Voice Recognition Across Languages. Diakses pada tanggal 8 November 2023
Tech News 180. OPENAI UNVEILS NEW APIS: DALL-E 3, TEXT-TO-SPEECH, AND MORE. Diakses pada tanggal 8 November 2023