A Adobe revelou esta semana atualizações significativas em seu pacote Firefly AI, com foco principal nos recursos de geração de áudio. Os novos recursos, Generate Soundtrack e Generate Speech, visam agilizar a criação de conteúdo, oferecendo soluções de música e narração com tecnologia de IA. Essas ferramentas estão atualmente em versão beta, prometendo aos criadores maior controle e flexibilidade sobre o áudio gerado por IA.
Licenciamento de música AI simplificado
Uma das principais vantagens do Generate Soundtrack da Firefly é seu licenciamento universal. A Adobe garante que qualquer música criada por meio da ferramenta seja gratuita para uso comercial, por tempo indeterminado. Isso aborda um grande problema para os criadores que muitas vezes enfrentam restrições complexas e caras de licenciamento de música. De acordo com o chefe de áudio de IA da Adobe, Jay LeBoeuf, o objetivo é “remover a confusão” em torno dos direitos musicais na era digital. A IA foi projetada para evitar problemas de direitos autorais, treinando em conteúdo licenciado, evitando possíveis remoções ou avisos em plataformas como o YouTube.
O sistema também inclui salvaguardas; por exemplo, solicitações que fazem referência a artistas específicos (como Taylor Swift) são rejeitadas para evitar a replicação não autorizada de material protegido por direitos autorais.
Criando trilhas sonoras de IA: uma abordagem passo a passo
O Generate Soundtrack funciona analisando vídeos enviados e sugerindo prompts. A IA gera avisos com base na vibração, estilo e propósito do vídeo, permitindo que os criadores refinem essas sugestões conforme necessário. Os usuários podem ajustar o ritmo, os níveis de energia e a duração para corresponder ao seu conteúdo. Em poucos minutos, Firefly oferece quatro variações instrumentais adaptadas à duração do vídeo (até cinco minutos).
Para começar:
- Abra o Firefly na web.
- Clique em “Gerar” e depois em “Gerar trilha sonora”.
- Envie seu vídeo.
- Revise ou edite o prompt gerado pela IA.
- Ajuste a energia, o andamento e a duração.
- Gere e baixe a trilha sonora.
Os planos da Adobe são necessários para acessar o Firefly, a partir de US$ 10 por mês.
Geração de fala com IA: ajuste fino para realismo
A ferramenta Generate Speech do Firefly oferece um alto grau de personalização. Os usuários podem inserir texto (até 7.500 caracteres) e escolher entre 50 vozes diversas, incluindo opções não binárias, em 20 idiomas. A ferramenta vai além da simples conversão de texto em fala, permitindo aos usuários adicionar pausas, ajustar o tom e corrigir pronúncias usando um recurso de divisão fonética.
A Adobe enfatiza a importância de uma fala realista para criadores que podem não se sentir confortáveis em gravar suas próprias narrações. LeBoeuf explica que o objetivo é capacitar “proprietários de pequenos negócios, educadores, todos que realmente têm uma história para contar”.
Expandindo parcerias para inovação em IA
Além de seus próprios desenvolvimentos, a Adobe está expandindo parcerias com empresas de IA como ElevenLabs (para geração de fala multilíngue) e Topaz Labs, integrando ainda mais modelos de IA de terceiros em sua plataforma. A empresa também está lançando um modelo de imagem Firefly de quinta geração com fotorrealismo aprimorado e edição baseada em prompt, junto com um editor de vídeo Firefly beta com uma linha do tempo multitrack para compilação de clipes de IA.
A expansão da Adobe para áudio de IA marca um passo significativo na democratização da criação de conteúdo, fornecendo ferramentas que abordam questões de licenciamento e aprimoram o controle criativo. O compromisso da empresa com parcerias sugere um futuro onde a produção de mídia baseada em IA se tornará cada vez mais acessível e eficiente.



























