Společnost Adobe tento týden představila významné aktualizace své sady Firefly s umělou inteligencí, se zvláštním zaměřením na možnosti generování zvuku. Nové funkce, Create Soundtrack a Create Speech, jsou navrženy tak, aby zjednodušily proces vytváření obsahu tím, že nabízejí řešení pro hudbu a hlasový záznam využívající umělou inteligenci. Tyto nástroje jsou aktuálně ve verzi beta a slibují tvůrcům větší flexibilitu a kontrolu nad zvukem generovaným umělou inteligencí.
Zjednodušení licencování hudby generované umělou inteligencí
Klíčovou výhodou Firefly Generate Soundtrack je jeho univerzální licence. Společnost Adobe zaručuje, že jakoukoli hudbu vytvořenou tímto nástrojem lze použít pro komerční účely bez jakéhokoli časového omezení. To řeší důležitý problém pro tvůrce, kteří často čelí složitým a nákladným omezením hudebních licencí. Podle šéfa Adobe pro audio AI Jaye LeBoeufa je cílem „odstranit zmatky“ ohledně hudebních práv v digitálním věku. Umělá inteligence je navržena tak, aby se vyhnula problémům s autorskými právy, protože je školena na licencovaném obsahu, čímž se zabrání případnému zastavení šíření nebo stížnostem na platformách, jako je YouTube.
Systém také obsahuje bezpečnostní mechanismy: například požadavky odkazující na konkrétní umělce (jako je Taylor Swift) jsou odmítnuty, aby se zabránilo neoprávněnému kopírování materiálů chráněných autorským právem.
Vytváření zvukových stop AI: Přístup krok za krokem
Generate Soundtrack funguje tak, že analyzuje nahraná videa a nabízí návrhy. Umělá inteligence generuje návrhy na základě atmosféry, stylu a účelu videa a umožňuje tvůrcům tyto návrhy podle potřeby vylepšit. Uživatelé mohou upravit tempo, úroveň energie a trvání tak, aby vyhovovaly jejich obsahu. Během několika minut Firefly poskytuje čtyři instrumentální variace, přizpůsobené délce videa (až pět minut).
Chcete-li začít:
- Otevřete Firefly ve svém webovém prohlížeči.
- Klikněte na „Vytvořit“ a poté na „Vytvořit zvukovou stopu“.
- Nahrajte své video.
- Zobrazte nebo upravte nápovědu vygenerovanou AI.
- Upravte energii, tempo a trvání.
- Vygenerujte a stáhněte si zvukovou stopu.
Přístup k Firefly vyžaduje předplatné Adobe začínající na 10 USD měsíčně.
Generování řeči AI: Vyladění pro realismus
Nástroj Generate Speech od Firefly nabízí vysoký stupeň přizpůsobení. Uživatelé mohou zadat text (až 7 500 znaků) a vybrat si z 50 různých hlasů, včetně genderově neutrálních možností, ve 20 jazycích. Nástroj jde nad rámec jednoduchého převodu textu na řeč a umožňuje uživatelům přidávat pauzy, upravovat tón a opravovat výslovnost pomocí funkce fonetické analýzy.
Adobe zdůrazňuje důležitost realistické řeči pro tvůrce, kterým nemusí být příjemné nahrávat vlastní hlasové projevy. LeBoeuf vysvětluje, že cílem je zmocnit “majitele malých podniků, pedagogy, opravdu každého, kdo má příběh, o který se chtějí podělit.”
Rozšíření partnerství pro inovace AI
Kromě vlastního vývoje společnost Adobe rozšiřuje partnerství se společnostmi zabývajícími se umělou inteligencí, jako jsou ElevenLabs (pro vícejazyčné generování řeči) a Topaz Labs, což jí umožňuje dále integrovat modely umělé inteligence třetích stran do své platformy. Společnost také představuje pátou verzi Firefly Image Model s vylepšeným fotorealismem a editací založenou na dotazech, stejně jako beta verzi Firefly Video Editor s vícestopou časovou osou pro kompilaci klipů AI.
Expanze Adobe do audio AI je významným krokem v demokratizaci tvorby obsahu, poskytuje nástroje, které řeší licenční problémy a zvyšují kreativní kontrolu. Závazek společnosti k partnerství předvídá budoucnost, ve které bude mediální produkce založená na AI stále dostupnější a efektivnější.


























