Adobe hat diese Woche wichtige Updates für seine Firefly AI-Suite vorgestellt, wobei der Schwerpunkt auf Funktionen zur Audiogenerierung liegt. Die neuen Funktionen Generate Soundtrack und Generate Speech zielen darauf ab, die Erstellung von Inhalten durch die Bereitstellung KI-gestützter Musik- und Voiceover-Lösungen zu optimieren. Diese Tools befinden sich derzeit in der Betaphase und versprechen Entwicklern mehr Kontrolle und Flexibilität über KI-generiertes Audio.
KI-Musiklizenzierung vereinfacht
Ein wesentlicher Vorteil von Generate Soundtrack von Firefly ist seine universelle Lizenzierung. Adobe stellt sicher, dass die mit dem Tool erstellte Musik auf unbestimmte Zeit kostenlos kommerziell genutzt werden kann. Dies behebt ein großes Problem für Musikschaffende, die oft mit komplexen und teuren Beschränkungen bei der Musiklizenzierung konfrontiert sind. Laut Jay LeBoeuf, Leiter AI Audio bei Adobe, besteht das Ziel darin, „die Verwirrung“ um Musikrechte im digitalen Zeitalter zu beseitigen. Die KI soll Urheberrechtsprobleme vermeiden, indem sie an lizenzierten Inhalten trainiert und mögliche Deaktivierungen oder Streiks auf Plattformen wie YouTube verhindert.
Das System umfasst auch Schutzmaßnahmen; Beispielsweise werden Eingabeaufforderungen, die sich auf bestimmte Künstler (wie Taylor Swift) beziehen, abgelehnt, um eine unbefugte Vervielfältigung von urheberrechtlich geschütztem Material zu verhindern.
KI-Soundtracks erstellen: Ein Schritt-für-Schritt-Ansatz
Soundtrack generieren funktioniert, indem hochgeladene Videos analysiert und Eingabeaufforderungen vorgeschlagen werden. Die KI generiert Eingabeaufforderungen basierend auf der Stimmung, dem Stil und dem Zweck des Videos und ermöglicht es den Erstellern, diese Vorschläge nach Bedarf zu verfeinern. Benutzer können Tempo, Energieniveau und Dauer an ihren Inhalt anpassen. Innerhalb weniger Minuten liefert Firefly vier Instrumentalvariationen, die auf die Länge des Videos (bis zu fünf Minuten) abgestimmt sind.
Um zu beginnen:
- Öffnen Sie Firefly im Internet.
- Klicken Sie auf „Generieren“ und dann auf „Soundtrack generieren“.
- Laden Sie Ihr Video hoch.
- Überprüfen oder bearbeiten Sie die von der KI generierte Eingabeaufforderung.
- Passen Sie Energie, Tempo und Dauer an.
- Generieren Sie den Soundtrack und laden Sie ihn herunter.
Für den Zugriff auf Firefly sind Adobe-Pläne erforderlich, die bei 10 $ pro Monat beginnen.
KI-Sprachgenerierung: Feinabstimmung für Realismus
Das Generate Speech-Tool von Firefly bietet ein hohes Maß an Anpassungsmöglichkeiten. Benutzer können Text (bis zu 7.500 Zeichen) eingeben und aus 50 verschiedenen Stimmen, einschließlich nichtbinärer Optionen, in 20 Sprachen wählen. Das Tool geht über die einfache Text-zu-Sprache-Umwandlung hinaus, indem es Benutzern ermöglicht, mithilfe einer phonetischen Aufschlüsselungsfunktion Pausen hinzuzufügen, den Ton anzupassen und die Aussprache zu korrigieren.
Adobe betont die Bedeutung lebensechter Sprache für Entwickler, denen die Aufnahme ihrer eigenen Voice-Over-Stimmen möglicherweise unangenehm ist. LeBoeuf erklärt, dass das Ziel darin besteht, „Kleinunternehmer, Pädagogen und alle zu befähigen, die wirklich nur eine Geschichte zu erzählen haben“.
Ausbau von Partnerschaften für KI-Innovation
Zusätzlich zu seinen eigenen Entwicklungen baut Adobe Partnerschaften mit KI-Unternehmen wie ElevenLabs (für mehrsprachige Sprachgenerierung) und Topaz Labs aus und integriert KI-Modelle von Drittanbietern weiter in seine Plattform. Das Unternehmen bringt außerdem ein Firefly-Bildmodell der fünften Generation mit verbessertem Fotorealismus und aufforderungsbasierter Bearbeitung sowie einen Beta-Firefly-Videoeditor mit einer mehrspurigen Zeitleiste für die KI-Clip-Zusammenstellung auf den Markt.
Die Expansion von Adobe in den Bereich KI-Audio stellt einen bedeutenden Schritt bei der Demokratisierung der Inhaltserstellung dar und stellt Tools bereit, die Lizenzprobleme angehen und die kreative Kontrolle verbessern. Das Engagement des Unternehmens für Partnerschaften deutet auf eine Zukunft hin, in der die KI-gestützte Medienproduktion immer zugänglicher und effizienter wird.


























