Microsoft розширює свій портфель штучного інтелекту, виходячи за рамки великих мовних моделей, із випуском трьох нових інструментів ІІ: просунуті можливості голосової та текстової транскрипції, а також модель генерації зображень другого покоління. Ці розробки сигналізують про амбіції технологічного гіганта закріпитися як комплексний постачальник ІІ, а не просто конкурент у текстових чат-ботах.
Нові Голосові та Текстові Інструменти ІІ
Нещодавно запущена модель транскрипції може перетворювати аудіозаписи на текст 25 мовами. Розроблена для таких додатків, як створення субтитрів для відео, складання зведень нарад та голосових помічників, ця технологія відповідає зростаючому попиту на доступну та ефективну обробку аудіо. Паралельно з цим голосова модель Microsoft може створювати аудіокліпи довжиною до 60 секунд, що потенційно оптимізує робочі процеси створення та комунікації контенту.
Покращена генерація зображень
Оновлена модель генерації зображень Microsoft є кроком уперед у створенні візуального контенту за допомогою ІІ. Компанія стверджує, що модель другого покоління робить зображення швидше та з більшою реалістичністю порівняно зі своїм попередником. Інструмент в даний час доступний через Microsoft Foundry і MAI playground, з планами інтеграції в платформи, що широко використовуються, такі як Bing і PowerPoint, роблячи візуальні матеріали, згенеровані ІІ, більш доступними для повсякденних користувачів.
За Межами Чат-ботів: Стратегічний Зсув Microsoft
Розширення Microsoft в багатомодальні моделі ІІ (голос, зображення, текст) відбувається тоді, коли галузь переходить до демонстрації практичної користі робочому місці. У той час як Copilot від Microsoft залишається ключовим гравцем у просторі корпоративних чат-ботів, особливо для підприємств, які вже інвестували в екосистему Microsoft (Office 365 та Azure), компанія явно диверсифікує свою діяльність. Це контрастує з конкурентами, такими як OpenAI, яка нещодавно припинила підтримку свого відеопрограми Sora AI, щоб зосередитися на основних пропозиціях.
Здатність інвестувати значні кошти у різноманітні проекти ІІ є ключовою перевагою для усталених технологічних компаній, таких як Microsoft. На відміну від багатьох стартапів, вони мають фінансові та обчислювальні ресурси для одночасного вивчення кількох додатків ІІ. Запуск цих моделей підтверджує цю стратегію, позиціонуючи Microsoft як універсального постачальника ІІ, готового до мінливих потреб бізнесу та споживачів.
Останні кроки Microsoft вказують на довгострокове бачення: стати універсальним магазином рішень ІІ, що охоплює текст, голос і створення візуального контенту. Ця диверсифікація має вирішальне значення на ринку, що швидко розвивається, де однієї лише спеціалізації недостатньо.








































