Untertitelformate, Sprachunterstützung, Workflow, Preise und der Rest. Wenn Sie Ihre Frage nicht finden, schreiben Sie an hello@delivercc.io.
DeliverCC gibt aus einer einzigen Generierung vier Formate aus. Hier ist, was jedes ist und wo Sie es einsetzen:
| Format | Was es ist | Wo Sie es einsetzen |
|---|---|---|
| SRT | Das universelle Untertitelformat. Klartext, einfache Timecodes | YouTube, Vimeo, Facebook, Instagram, TikTok, die meisten Video-Editoren |
| VTT | Standard für Web-Video. WebVTT-Format | HTML5-Videoplayer, Web-Einbettungen |
| SCC | Scenarist Closed Captions. Broadcast-Standard CEA-608 | US-Broadcast-TV (CBS, NBC, ABC, Fox) |
| TTML | Timed Text Markup Language. Apple-Music-Dialekt für synchronisierte Songtexte (auf Zeilenebene) | Synchronisierte Songtexte bei Apple Music. Die Datei, die Labels über ihren Distributor senden, um die Karaoke-artige Hervorhebung in der Apple-Music-App zu ermöglichen |
Beides. Fügen Sie alles ein, was untertitelt werden soll: den Songtext, die Ad-libs und jeden gesprochenen Dialog, und DeliverCC richtet alles aus. Eine Broadcast-Untertiteldatei muss jedes Wort enthalten, gesungen wie gesprochen, deshalb macht erst das Untertiteln der gesprochenen Teile Ihre Auslieferung vollständig und konform.
Da das Tool den Text ausrichtet, den Sie bereitstellen, muss alles, was untertitelt werden soll, in dem stehen, was Sie einfügen. Ein Ad-lib, das nicht in Ihrem Textblatt steht, erscheint nicht, sofern Sie es nicht hinzufügen.
Sie gehen an zwei verschiedene Orte. Video-Untertitel (SRT, VTT und SCC) gehören zu Ihrem Video. Sie zeigen Text über dem Bild, synchron zu allem Hörbaren, und funktionieren überall dort, wo das Video läuft: SRT und VTT für YouTube, Vimeo und soziale Medien, und SCC für US-Broadcast-TV. Synchronisierte Songtexte bei Apple Music gehören dagegen zum Song. Es sind die Texte, die in der Apple-Music-App Zeile für Zeile mitlaufen und hervorgehoben werden, während der Track spielt. Derselbe getimte Text darunter, zwei verschiedene Ziele, und sie sind nicht austauschbar. Das eine malt Worte auf ein Video, das andere treibt die Songtextansicht in der Streaming-App an.
TTML (Timed Text Markup Language) ist ein W3C-Standard für getimten Text. DeliverCC gibt den Apple-Music-Dialekt für synchronisierte Songtexte von TTML aus, das Format auf Zeilenebene, das Apple Music für Texte nutzt, die sich im Takt der Wiedergabe hervorheben. Es ist die Datei, die Ihr Label oder Distributor bei Apple einreicht, über Transporter oder iTunes Connect, um synchronisierte Songtexte für ein Release zu aktivieren. Es ist kein allgemeines Video-Untertitel-TTML und kein Video-Untertitel. Nutzen Sie für Video die Ausgabe SRT, VTT oder SCC.
Nicht als Datei, denn Spotify akzeptiert keine. Spotifys synchronisierte Songtexte werden vollständig von Musixmatch betrieben. Der einzige Weg, sie hinzuzufügen, ist, ein Künstler- oder Label-Konto in Musixmatch zu verifizieren und die Texte im eigenen Tool von Musixmatch zu synchronisieren, das sie dann an Spotify weitergibt. Kein Tool kann Spotify eine fertige Songtextdatei übergeben.
Apple Music ist anders: Es akzeptiert eine zeitsynchrone TTML-Songtextdatei, die direkt vom Rechteinhaber oder Distributor eingereicht wird, also die Datei, die DeliverCC erzeugt. DeliverCC bedient also das Ziel, das eine Datei annimmt, und lässt jenes aus, das manuelle Arbeit in einem separaten Tool erfordert. Instagram, Amazon Music und Tidal laufen auf dieselbe Weise über Musixmatch wie Spotify.
Einundzwanzig Alignment-Sprachen, die die meisten großen Musikmärkte abdecken:
Englisch, Spanisch, Portugiesisch, Koreanisch, Japanisch, Französisch, Deutsch, Italienisch, Arabisch, Dänisch, Niederländisch, Finnisch, Hindi, Indonesisch, Norwegisch, Polnisch, Russisch, Schwedisch, Thailändisch, Türkisch und Chinesisch.
Jede Sprache nutzt das beste verfügbare Alignment-Modell. Eines sollten Sie für Sprachen mit nicht-lateinischer Schrift wissen (Koreanisch, Japanisch, Arabisch, Hindi, Thai, Chinesisch): Fügen Sie Ihren Songtext in der nativen Schrift des Songs ein, nicht in romanisierter Form. „Tum ho meri zindagi" richtet sich für einen Hindi-Song nicht aus. „तुम हो मेरी ज़िन्दगी" schon.
Gesangsstimmen bringen Speech-to-Text zum Scheitern. Genuschelter Vortrag, Ad-libs, Harmonien, Autotune, nicht-lexikalische Laute, all das verschlechtert die Transkriptionsgenauigkeit so weit, dass das Ergebnis nicht mit dem übereinstimmt, was tatsächlich gesungen wurde.
DeliverCC verfolgt einen anderen Ansatz. Sie liefern die korrekten Texte, die vom Künstler freigegebene Version, und das System richtet diese Texte am Audio aus, statt zu raten, was gesungen wurde. Die Untertitel sagen genau das, was das Textblatt sagt, mit einer Timing-Genauigkeit auf Wortebene, die selbst bei den schwierigsten Gesangsperformances hält.
Ja. Dieselbe Alignment-Engine, die Ihre Untertitel timt, exportiert auch getimten Songtext nach Premiere Pro, DaVinci Resolve, After Effects und Final Cut Pro, sodass Sie sich das Keyframing jedes Worts von Hand sparen. Sie gestalten den Look, DeliverCC übernimmt das Timing.
Premiere Pro (ein SRT auf Wortebene), DaVinci Resolve und Final Cut Pro (ein gemeinsames FCPXML) und After Effects (ein .jsx-Skript). LRC und Enhanced LRC sind außerdem für Lyric- und Karaoke-Player verfügbar.
Nein. Jede Generierung gibt Ihnen jedes Format, Untertitel und Editor-Exporte zugleich, mit unbegrenzten Downloads. Es gibt keinen separaten Lyric-Video-Tarif.
Nein. Synchronisierte Songtexte bei Apple Music sind eine TTML-Datei auf Zeilenebene für die Music-App. Der Lyric-Video-Export ist getimter Text auf Wortebene, den Sie in Ihren Editor holen, um ihn zu gestalten und zu animieren. DeliverCC erzeugt beides aus demselben Upload.
Sie liefern sie. DeliverCC ist darauf ausgelegt, dass das Textblatt die Quelle der Wahrheit ist, nicht eine Transkription. Das entspricht dem Workflow, den die meisten Labels bereits nutzen: Untertitel gehen abgestimmt auf die offiziellen, freigegebenen Texte raus, nicht auf das, was eine KI in der Aufnahme gehört zu haben glaubt. DeliverCC übernimmt das Timing, Sie bestimmen, was die Worte sagen.
Typische Generierung: 30 bis 60 Sekunden vom Klick auf Generieren bis zum Erscheinen der Untertitel. Die erste Anfrage auf einem kalten Worker dauert länger (etwa 90 Sekunden, während die Infrastruktur hochfährt). Folgende Anfragen auf warmen Workern sind durchweg schneller. Die meisten Nutzer sehen im normalen Betrieb Zeiten unter 60 Sekunden.
Ja. Jede Generierung landet im Timeline-Editor mit Wellenform-Ansicht, ziehbaren Blockkanten, Textbearbeitung pro Block sowie vollständigem Rückgängig und Wiederholen. Die meisten Songs brauchen null Bearbeitungen. Wenn Bearbeitungen nötig sind (meist bei Ad-libs oder instrumentalen Intros), dauert die Korrektur Sekunden. Bearbeitungen werden in die exportierte Untertiteldatei eingebacken, in welchem Format Sie auch wählen.
Forced Alignment geht damit besser um als Transkriptionstools. Ad-libs („yeah", „oh", „mmm"), Producer-Tags und genuschelte oder harmonisierte Vocals verwirren alle Untertitel-Tools, die auf Speech-to-Text setzen. DeliverCC richtet sich an den Texten aus, die Sie liefern, also:
Wenn Sie ein Ad-lib hinzufügen wollen, das nicht im Textblatt stand, oder eines entfernen, das drin war, können Sie im Timeline-Editor den Text jedes Blocks bearbeiten und das Timing manuell anpassen.
DeliverCC akzeptiert gängige Audio- und Videoformate:
Uploads sind auf 500 MB und 15 Minuten Dauer begrenzt. DeliverCC zieht das Audio automatisch aus Video-Uploads, sodass Sie selbst nichts konvertieren müssen.
Tipp für Musikvideo-Editoren: Rohe Video-Exporte (MOV, ProRes usw.) sind oft viele Gigabyte groß, weit über dem Upload-Limit von 500 MB. Der schnellere Weg ist, eine reine Audiodatei aus Ihrem Videoeditor zu exportieren und diese hochzuladen. Ein 5-minütiger Song als MP3 ist typischerweise unter 10 MB, während derselbe Song als Rohvideo Gigabyte groß sein kann. Die Generierung führt in beiden Fällen dasselbe Alignment aus, und Sie sparen sich die lange Upload-Wartezeit.
Audiodateien werden etwa 14 Tage nach dem Upload automatisch aus dem Speicher von DeliverCC gelöscht, ein Zeitfenster, das die Projektprüfungs- und Überarbeitungsphase abdeckt.
Generierte Untertiteldateien bleiben in Ihrem Konto, bis Sie sie löschen. Weder Ihr Audio noch Ihre Texte werden zum Trainieren irgendeines Modells verwendet. Die vollständige Aufbewahrungsrichtlinie steht in der Datenschutzerklärung.
Ein Credit entspricht einer Untertitelgenerierung. Sie erhalten mit diesem einen Credit alle vier Exportformate, generiert aus denselben Alignment-Daten.
Monatstarife gewähren Credits zu Beginn jedes Abrechnungszeitraums und setzen sie monatlich zurück: Creator gibt 5, Studio 12, Label 30. Pay-as-you-go-Credits werden einzeln gekauft und verfallen nie. Wenn Ihnen mitten im Monat die Credits ausgehen, können Sie einen Pay-as-you-go-Credit kaufen oder auf einen höheren Tarif wechseln. Es gibt keine Mehrkosten bei Überschreitung und keine Gebühren pro Format.
Have questions? Email hello@delivercc.io