Berita dan Artikel Terbaru

Microsoft Memperluas AI Melampaui Teks dengan Model Suara, Transkripsi, dan Gambar Baru

03.04.2026

Microsoft memperluas portofolio kecerdasan buatannya melampaui model bahasa besar dengan merilis tiga alat AI baru: kemampuan transkripsi suara dan teks tingkat lanjut, dan model pembuatan gambar generasi kedua. Perkembangan ini menandakan ambisi raksasa teknologi tersebut untuk menjadikan dirinya sebagai penyedia AI yang komprehensif, bukan sekadar pesaing chatbot berbasis teks.

Alat AI Suara dan Teks Baru

Model transkripsi yang baru diluncurkan menawarkan kemampuan untuk mengubah rekaman audio menjadi teks dalam 25 bahasa. Dirancang untuk aplikasi seperti pembuatan teks video, ringkasan rapat, dan asisten yang dilengkapi suara, alat ini memenuhi permintaan yang terus meningkat akan pemrosesan audio yang mudah diakses dan efisien. Selain itu, model pembuatan suara Microsoft dapat membuat klip audio berdurasi hingga 60 detik, yang berpotensi menyederhanakan alur kerja pembuatan konten dan komunikasi.

Pembuatan Gambar yang Ditingkatkan

Model pembuatan gambar Microsoft yang diperbarui mewakili langkah maju dalam pembuatan konten visual berbasis AI. Perusahaan mengklaim model generasi kedua menghasilkan gambar lebih cepat dan lebih realisme dibandingkan pendahulunya. Alat ini saat ini dapat diakses melalui Microsoft Foundry dan MAI Playground, dengan rencana untuk mengintegrasikannya ke dalam platform yang banyak digunakan seperti Bing dan PowerPoint, sehingga visual yang dihasilkan AI lebih mudah tersedia bagi pengguna sehari-hari.

Melampaui Chatbots: Pergeseran Strategis Microsoft

Ekspansi Microsoft ke dalam model AI multi-modal (suara, gambar, teks) terjadi pada saat industri sedang beralih ke arah pembuktian utilitas praktis di tempat kerja. Meskipun Copilot Microsoft tetap menjadi pemain kunci dalam ruang chatbot perusahaan, khususnya untuk bisnis yang sudah berinvestasi di ekosistem Microsoft (Office 365 dan Azure), perusahaan ini jelas melakukan diversifikasi. Hal ini berbeda dengan pesaing seperti OpenAI, yang baru-baru ini menghentikan aplikasi video Sora AI untuk berkonsentrasi pada penawaran inti.

Kemampuan untuk berinvestasi besar-besaran dalam beragam proyek AI merupakan keuntungan utama bagi perusahaan teknologi mapan seperti Microsoft. Tidak seperti kebanyakan startup, mereka memiliki sumber daya finansial dan komputasi untuk mengeksplorasi beberapa aplikasi AI secara bersamaan. Peluncuran model-model ini menggarisbawahi strategi tersebut, memposisikan Microsoft sebagai penyedia AI serbaguna yang siap memenuhi kebutuhan bisnis dan konsumen yang terus berkembang.

Langkah terbaru Microsoft menunjukkan visi jangka panjang: menjadi toko serba ada untuk solusi AI, yang mencakup pembuatan konten teks, suara, dan visual. Diversifikasi ini sangat penting dalam pasar yang berkembang pesat dimana spesialisasi saja tidak cukup.

The Iran War of 2026: Assessing the Endgame and Lasting Consequences