Häufig gestellte Fragen

So funktioniert DeliverCC.

Untertitelformate, Sprachunterstützung, Workflow, Preise und der Rest. Wenn Sie Ihre Frage nicht finden, schreiben Sie an hello@delivercc.io.

Technik und Formate

Welche Untertitelformate exportiert DeliverCC, und welches nutze ich?

DeliverCC gibt aus einer einzigen Generierung vier Formate aus. Hier ist, was jedes ist und wo Sie es einsetzen:

FormatWas es istWo Sie es einsetzen
SRTDas universelle Untertitelformat. Klartext, einfache TimecodesYouTube, Vimeo, Facebook, Instagram, TikTok, die meisten Video-Editoren
VTTStandard für Web-Video. WebVTT-FormatHTML5-Videoplayer, Web-Einbettungen
SCCScenarist Closed Captions. Broadcast-Standard CEA-608US-Broadcast-TV (CBS, NBC, ABC, Fox)
TTMLTimed Text Markup Language. Apple-Music-Dialekt für synchronisierte Songtexte (auf Zeilenebene)Synchronisierte Songtexte bei Apple Music. Die Datei, die Labels über ihren Distributor senden, um die Karaoke-artige Hervorhebung in der Apple-Music-App zu ermöglichen
Untertitelt DeliverCC Dialoge und Ad-libs, oder nur gesungene Texte?

Beides. Fügen Sie alles ein, was untertitelt werden soll: den Songtext, die Ad-libs und jeden gesprochenen Dialog, und DeliverCC richtet alles aus. Eine Broadcast-Untertiteldatei muss jedes Wort enthalten, gesungen wie gesprochen, deshalb macht erst das Untertiteln der gesprochenen Teile Ihre Auslieferung vollständig und konform.

Da das Tool den Text ausrichtet, den Sie bereitstellen, muss alles, was untertitelt werden soll, in dem stehen, was Sie einfügen. Ein Ad-lib, das nicht in Ihrem Textblatt steht, erscheint nicht, sofern Sie es nicht hinzufügen.

Was ist der Unterschied zwischen Video-Untertiteln und synchronisierten Songtexten bei Apple Music?

Sie gehen an zwei verschiedene Orte. Video-Untertitel (SRT, VTT und SCC) gehören zu Ihrem Video. Sie zeigen Text über dem Bild, synchron zu allem Hörbaren, und funktionieren überall dort, wo das Video läuft: SRT und VTT für YouTube, Vimeo und soziale Medien, und SCC für US-Broadcast-TV. Synchronisierte Songtexte bei Apple Music gehören dagegen zum Song. Es sind die Texte, die in der Apple-Music-App Zeile für Zeile mitlaufen und hervorgehoben werden, während der Track spielt. Derselbe getimte Text darunter, zwei verschiedene Ziele, und sie sind nicht austauschbar. Das eine malt Worte auf ein Video, das andere treibt die Songtextansicht in der Streaming-App an.

TTML (Timed Text Markup Language) ist ein W3C-Standard für getimten Text. DeliverCC gibt den Apple-Music-Dialekt für synchronisierte Songtexte von TTML aus, das Format auf Zeilenebene, das Apple Music für Texte nutzt, die sich im Takt der Wiedergabe hervorheben. Es ist die Datei, die Ihr Label oder Distributor bei Apple einreicht, über Transporter oder iTunes Connect, um synchronisierte Songtexte für ein Release zu aktivieren. Es ist kein allgemeines Video-Untertitel-TTML und kein Video-Untertitel. Nutzen Sie für Video die Ausgabe SRT, VTT oder SCC.

Kann ich DeliverCC für Spotify-Songtexte nutzen?

Nicht als Datei, denn Spotify akzeptiert keine. Spotifys synchronisierte Songtexte werden vollständig von Musixmatch betrieben. Der einzige Weg, sie hinzuzufügen, ist, ein Künstler- oder Label-Konto in Musixmatch zu verifizieren und die Texte im eigenen Tool von Musixmatch zu synchronisieren, das sie dann an Spotify weitergibt. Kein Tool kann Spotify eine fertige Songtextdatei übergeben.

Apple Music ist anders: Es akzeptiert eine zeitsynchrone TTML-Songtextdatei, die direkt vom Rechteinhaber oder Distributor eingereicht wird, also die Datei, die DeliverCC erzeugt. DeliverCC bedient also das Ziel, das eine Datei annimmt, und lässt jenes aus, das manuelle Arbeit in einem separaten Tool erfordert. Instagram, Amazon Music und Tidal laufen auf dieselbe Weise über Musixmatch wie Spotify.

Welche Sprachen unterstützt DeliverCC?

Einundzwanzig Alignment-Sprachen, die die meisten großen Musikmärkte abdecken:

Englisch, Spanisch, Portugiesisch, Koreanisch, Japanisch, Französisch, Deutsch, Italienisch, Arabisch, Dänisch, Niederländisch, Finnisch, Hindi, Indonesisch, Norwegisch, Polnisch, Russisch, Schwedisch, Thailändisch, Türkisch und Chinesisch.

Jede Sprache nutzt das beste verfügbare Alignment-Modell. Eines sollten Sie für Sprachen mit nicht-lateinischer Schrift wissen (Koreanisch, Japanisch, Arabisch, Hindi, Thai, Chinesisch): Fügen Sie Ihren Songtext in der nativen Schrift des Songs ein, nicht in romanisierter Form. „Tum ho meri zindagi" richtet sich für einen Hindi-Song nicht aus. „तुम हो मेरी ज़िन्दगी" schon.

Warum Forced Alignment statt Speech-to-Text?

Gesangsstimmen bringen Speech-to-Text zum Scheitern. Genuschelter Vortrag, Ad-libs, Harmonien, Autotune, nicht-lexikalische Laute, all das verschlechtert die Transkriptionsgenauigkeit so weit, dass das Ergebnis nicht mit dem übereinstimmt, was tatsächlich gesungen wurde.

DeliverCC verfolgt einen anderen Ansatz. Sie liefern die korrekten Texte, die vom Künstler freigegebene Version, und das System richtet diese Texte am Audio aus, statt zu raten, was gesungen wurde. Die Untertitel sagen genau das, was das Textblatt sagt, mit einer Timing-Genauigkeit auf Wortebene, die selbst bei den schwierigsten Gesangsperformances hält.

Export für Lyric-Videos

Kann ich DeliverCC für Lyric-Videos nutzen?

Ja. Dieselbe Alignment-Engine, die Ihre Untertitel timt, exportiert auch getimten Songtext nach Premiere Pro, DaVinci Resolve, After Effects und Final Cut Pro, sodass Sie sich das Keyframing jedes Worts von Hand sparen. Sie gestalten den Look, DeliverCC übernimmt das Timing.

Welche Editoren unterstützt der Lyric-Video-Export?

Premiere Pro (ein SRT auf Wortebene), DaVinci Resolve und Final Cut Pro (ein gemeinsames FCPXML) und After Effects (ein .jsx-Skript). LRC und Enhanced LRC sind außerdem für Lyric- und Karaoke-Player verfügbar.

Ist der Lyric-Video-Export ein separates Produkt oder ein separater Tarif?

Nein. Jede Generierung gibt Ihnen jedes Format, Untertitel und Editor-Exporte zugleich, mit unbegrenzten Downloads. Es gibt keinen separaten Lyric-Video-Tarif.

Ist der Lyric-Video-Export dasselbe wie synchronisierte Songtexte bei Apple Music?

Nein. Synchronisierte Songtexte bei Apple Music sind eine TTML-Datei auf Zeilenebene für die Music-App. Der Lyric-Video-Export ist getimter Text auf Wortebene, den Sie in Ihren Editor holen, um ihn zu gestalten und zu animieren. DeliverCC erzeugt beides aus demselben Upload.

Workflow

Liefere ich die Texte, oder transkribiert DeliverCC sie?

Sie liefern sie. DeliverCC ist darauf ausgelegt, dass das Textblatt die Quelle der Wahrheit ist, nicht eine Transkription. Das entspricht dem Workflow, den die meisten Labels bereits nutzen: Untertitel gehen abgestimmt auf die offiziellen, freigegebenen Texte raus, nicht auf das, was eine KI in der Aufnahme gehört zu haben glaubt. DeliverCC übernimmt das Timing, Sie bestimmen, was die Worte sagen.

Wie lange dauert eine Generierung?

Typische Generierung: 30 bis 60 Sekunden vom Klick auf Generieren bis zum Erscheinen der Untertitel. Die erste Anfrage auf einem kalten Worker dauert länger (etwa 90 Sekunden, während die Infrastruktur hochfährt). Folgende Anfragen auf warmen Workern sind durchweg schneller. Die meisten Nutzer sehen im normalen Betrieb Zeiten unter 60 Sekunden.

Kann ich das Alignment nach der Generierung manuell bearbeiten?

Ja. Jede Generierung landet im Timeline-Editor mit Wellenform-Ansicht, ziehbaren Blockkanten, Textbearbeitung pro Block sowie vollständigem Rückgängig und Wiederholen. Die meisten Songs brauchen null Bearbeitungen. Wenn Bearbeitungen nötig sind (meist bei Ad-libs oder instrumentalen Intros), dauert die Korrektur Sekunden. Bearbeitungen werden in die exportierte Untertiteldatei eingebacken, in welchem Format Sie auch wählen.

Wie geht DeliverCC mit Ad-libs, genuschelten Vocals und Producer-Tags um?

Forced Alignment geht damit besser um als Transkriptionstools. Ad-libs („yeah", „oh", „mmm"), Producer-Tags und genuschelte oder harmonisierte Vocals verwirren alle Untertitel-Tools, die auf Speech-to-Text setzen. DeliverCC richtet sich an den Texten aus, die Sie liefern, also:

  • Wenn Ihr Textblatt das Ad-lib enthält, wird es automatisch zusammen mit der Stimme getimt.
  • Wenn Ihr Textblatt es auslässt (was für Füll-Laute wie „yeah" und „mmm" normal ist), richten sich die umliegenden Worte trotzdem korrekt aus. Das Ad-lib wird einfach nicht untertitelt.

Wenn Sie ein Ad-lib hinzufügen wollen, das nicht im Textblatt stand, oder eines entfernen, das drin war, können Sie im Timeline-Editor den Text jedes Blocks bearbeiten und das Timing manuell anpassen.

Upload und Dateiformate

Was kann ich hochladen, und gibt es ein Größenlimit?

DeliverCC akzeptiert gängige Audio- und Videoformate:

  • Audio: MP3, WAV, FLAC, AAC, M4A, OGG
  • Video: MP4, MOV, M4V, WebM, AVI, MKV

Uploads sind auf 500 MB und 15 Minuten Dauer begrenzt. DeliverCC zieht das Audio automatisch aus Video-Uploads, sodass Sie selbst nichts konvertieren müssen.

Tipp für Musikvideo-Editoren: Rohe Video-Exporte (MOV, ProRes usw.) sind oft viele Gigabyte groß, weit über dem Upload-Limit von 500 MB. Der schnellere Weg ist, eine reine Audiodatei aus Ihrem Videoeditor zu exportieren und diese hochzuladen. Ein 5-minütiger Song als MP3 ist typischerweise unter 10 MB, während derselbe Song als Rohvideo Gigabyte groß sein kann. Die Generierung führt in beiden Fällen dasselbe Alignment aus, und Sie sparen sich die lange Upload-Wartezeit.

Vertrauen und Geschäftliches

Was passiert mit meinem Audio, nachdem ich Untertitel generiert habe?

Audiodateien werden etwa 14 Tage nach dem Upload automatisch aus dem Speicher von DeliverCC gelöscht, ein Zeitfenster, das die Projektprüfungs- und Überarbeitungsphase abdeckt.

Generierte Untertiteldateien bleiben in Ihrem Konto, bis Sie sie löschen. Weder Ihr Audio noch Ihre Texte werden zum Trainieren irgendeines Modells verwendet. Die vollständige Aufbewahrungsrichtlinie steht in der Datenschutzerklärung.

Wie funktioniert das Credit-System?

Ein Credit entspricht einer Untertitelgenerierung. Sie erhalten mit diesem einen Credit alle vier Exportformate, generiert aus denselben Alignment-Daten.

Monatstarife gewähren Credits zu Beginn jedes Abrechnungszeitraums und setzen sie monatlich zurück: Creator gibt 5, Studio 12, Label 30. Pay-as-you-go-Credits werden einzeln gekauft und verfallen nie. Wenn Ihnen mitten im Monat die Credits ausgehen, können Sie einen Pay-as-you-go-Credit kaufen oder auf einen höheren Tarif wechseln. Es gibt keine Mehrkosten bei Überschreitung und keine Gebühren pro Format.

Have questions? Email hello@delivercc.io