Microsoft breidt AI uit buiten tekst met nieuwe spraak-, transcriptie- en beeldmodellen

5

Microsoft breidt zijn kunstmatige-intelligentieportfolio verder uit dan grote taalmodellen met de release van drie nieuwe AI-tools: geavanceerde mogelijkheden voor spraak- en teksttranscriptie, en een model voor het genereren van afbeeldingen van de tweede generatie. Deze ontwikkelingen duiden op de ambitie van de technologiegigant om zichzelf te profileren als een alomvattende AI-aanbieder, en niet alleen als concurrent op het gebied van tekstgebaseerde chatbots.

Nieuwe AI-tools voor spraak en tekst

Het onlangs gelanceerde transcriptiemodel biedt de mogelijkheid om audio-opnamen in 25 talen naar tekst om te zetten. Deze tool is ontworpen voor toepassingen zoals video-ondertiteling, samenvattingen van vergaderingen en spraakgestuurde assistenten en komt tegemoet aan de groeiende vraag naar toegankelijke en efficiënte audioverwerking. Daarnaast kan het spraakgeneratiemodel van Microsoft audiofragmenten van maximaal 60 seconden lang maken, waardoor de creatie van inhoud en de communicatieworkflows mogelijk worden gestroomlijnd.

Verbeterde beeldgeneratie

Het bijgewerkte model voor het genereren van afbeeldingen van Microsoft vertegenwoordigt een stap voorwaarts in de creatie van AI-gestuurde visuele inhoud. Het bedrijf beweert dat het model van de tweede generatie beelden sneller en realistischer produceert dan zijn voorganger. De tool is momenteel toegankelijk via de Foundry- en MAI-speeltuin van Microsoft, met plannen om deze te integreren in veelgebruikte platforms zoals Bing en PowerPoint, waardoor door AI gegenereerde beelden gemakkelijker beschikbaar worden voor gewone gebruikers.

Beyond Chatbots: de strategische verschuiving van Microsoft

De uitbreiding van Microsoft naar multimodale AI-modellen (stem, beeld, tekst) komt op een moment dat de industrie verschuift naar het bewijzen van praktisch nut op de werkplek. Hoewel Copilot van Microsoft een belangrijke speler blijft op het gebied van zakelijke chatbots, vooral voor bedrijven die al in het ecosysteem van Microsoft (Office 365 en Azure) hebben geïnvesteerd, is het bedrijf duidelijk aan het diversifiëren. Dit staat in contrast met concurrenten als OpenAI, dat onlangs zijn Sora AI-video-app heeft stopgezet om zich te concentreren op het kernaanbod.

Het vermogen om zwaar te investeren in diverse AI-projecten is een belangrijk voordeel voor gevestigde technologiebedrijven als Microsoft. In tegenstelling tot veel startups beschikken zij over de financiële en computationele middelen om meerdere AI-toepassingen tegelijkertijd te verkennen. De lancering van deze modellen onderstreept die strategie, waarbij Microsoft wordt gepositioneerd als een veelzijdige AI-leverancier die klaar is voor de veranderende behoeften van bedrijven en consumenten.

De nieuwste stappen van Microsoft suggereren een langetermijnvisie: een one-stop-shop zijn voor AI-oplossingen, die de creatie van tekst, spraak en visuele inhoud omvatten. Deze diversificatie is van cruciaal belang in een snel evoluerende markt waar specialisatie alleen niet voldoende is.