OpenAI Membuka Era Baru dalam Teknologi Suara dan Gambar!
OpenAI, perusahaan riset kecerdasan buatan (AI) ternama, baru-baru ini mengumumkan peluncuran berbagai teknologi AI canggih. Dari model pengenalan suara multibahasa hingga model teks-ke-gambar, OpenAI terus memperluas cakupan dan aksesibilitas teknologi AI. Simak berita lengkapnya berikut ini!
Whisper V3: Pengenalan Suara Multibahasa
OpenAI telah merilis sumber terbuka dari model pengenalan suara terbaru mereka, Whisper V3. Model ini menunjukkan kemampuan luar biasa dalam memahami dan menyalin suara dalam berbagai bahasa, melampaui model berbasis bahasa Inggris sebelumnya.
Whisper V3 mampu menangani berbagai input bahasa dengan efektif, meski efektivitasnya dapat berfluktuasi tergantung pada bahasa yang ditranskripsi. Model ini tersedia di GitHub dengan lisensi yang memperbolehkan pengguna untuk menyalin berbagai bentuk konten dengan akurasi terbaik di kelasnya.
Baca Juga: Ingin Lepas dari Microsoft, OpenAI Berencana Membuat Chip AI Sendiri!
DALL-E 3 dan Audio API: Membawa AI ke Tingkat Berikutnya
OpenAI juga memperkenalkan DALL-E 3, model teks-ke-gambar mereka yang sekarang dapat diakses melalui API. Dibandingkan dengan pendahulunya, DALL-E 3 memiliki beberapa keterbatasan, namun tetap menawarkan berbagai opsi format dan kualitas.
Selain itu, OpenAI juga meluncurkan Audio API, yang menyediakan akses ke enam suara preset dan dua varian model AI generatif. CEO OpenAI, Sam Altman, menekankan kealamiannya dalam menghasilkan audio, yang berpotensi meningkatkan interaksi aplikasi, aksesibilitas, pembelajaran bahasa, dan bantuan suara.
Baca Juga: OpenAI Siapkan Alat Deteksi Gambar AI dan Kemungkinan Peluncuran GPT-5!
OpenAI: Mendorong Inovasi dan Aksesibilitas
Peluncuran API ini mencerminkan komitmen OpenAI untuk memperluas aksesibilitas dan utilitas teknologi AI canggih. Seiring dengan perkembangan teknologi, OpenAI berada di garis depan dalam memberdayakan pengembang dan kreator dengan alat inovatif.
Dengan dataset besar yang mencakup 680.000 jam data yang dipantau dengan ketat, OpenAI terus memperhalus alat AI mereka untuk mendorong inovasi dan memperluas cakupan teknologi pengenalan suara di seluruh dunia.
Dengan langkah-langkah besar ini, OpenAI terus membuka jalan bagi penelitian dan aplikasi AI. Dengan berbagi teknologi mereka secara terbuka, mereka memfasilitasi penelitian lebih lanjut dan pengembangan aplikasi praktis dalam bidang ini, membuka peluang baru bagi peneliti, pengembang, dan pengguna di seluruh dunia.
Ikuti kami di Google News untuk mendapatkan berita-berita terbaru seputar crypto. Nyalakan notifikasi agar tidak ketinggalan beritanya.
*Disclaimer
Konten ini bertujuan memperkaya informasi pembaca. Selalu lakukan riset mandiri dan gunakan uang dingin sebelum berinvestasi. Segala aktivitas jual beli dan investasi aset crypto menjadi tanggung jawab pembaca.
Referensi:
- Mpost. Whisper V3 by OpenAI Goes Open Source, Expanding Voice Recognition Across Languages. Diakses pada tanggal 8 November 2023
- Tech News 180. OPENAI UNVEILS NEW APIS: DALL-E 3, TEXT-TO-SPEECH, AND MORE. Diakses pada tanggal 8 November 2023