Question 1

Welche Untertitelformate exportiert DeliverCC, und welches nutze ich?

Accepted Answer

DeliverCC gibt aus einer einzigen Generierung vier Formate aus: SRT (universelles Untertitelformat für YouTube, Vimeo, soziale Medien), VTT (Standard für Web-Video für HTML5-Player), SCC (Scenarist Closed Captions für US-Broadcast-TV) und TTML (Apple-Music-Dialekt für synchronisierte Songtexte, die Datei auf Zeilenebene, die Labels an Apple Music senden, um die Karaoke-artige Hervorhebung der Songtexte in der App zu ermöglichen).

Question 2

Untertitelt DeliverCC Dialoge und Ad-libs, oder nur gesungene Texte?

Accepted Answer

Beides. Fügen Sie alles ein, was untertitelt werden soll: den Songtext, die Ad-libs und jeden gesprochenen Dialog, und DeliverCC richtet alles aus. Eine Broadcast-Untertiteldatei muss jedes Wort enthalten, gesungen wie gesprochen, deshalb macht erst das Untertiteln der gesprochenen Teile Ihre Auslieferung vollständig und konform.

Da das Tool den Text ausrichtet, den Sie bereitstellen, muss alles, was untertitelt werden soll, in dem stehen, was Sie einfügen. Ein Ad-lib, das nicht in Ihrem Textblatt steht, erscheint nicht, sofern Sie es nicht hinzufügen.

Question 3

Was ist der Unterschied zwischen Video-Untertiteln und synchronisierten Songtexten bei Apple Music?

Accepted Answer

Sie gehen an zwei verschiedene Orte. Video-Untertitel (SRT, VTT und SCC) gehören zu Ihrem Video. Sie zeigen Text über dem Bild, synchron zu allem Hörbaren, und funktionieren überall dort, wo das Video läuft: SRT und VTT für YouTube, Vimeo und soziale Medien, und SCC für US-Broadcast-TV. Synchronisierte Songtexte bei Apple Music gehören dagegen zum Song. Es sind die Texte, die in der Apple-Music-App Zeile für Zeile mitlaufen und hervorgehoben werden, während der Track spielt. Derselbe getimte Text darunter, zwei verschiedene Ziele, und sie sind nicht austauschbar. Das eine malt Worte auf ein Video, das andere treibt die Songtextansicht in der Streaming-App an.

TTML (Timed Text Markup Language) ist ein W3C-Standard für getimten Text. DeliverCC gibt den Apple-Music-Dialekt für synchronisierte Songtexte von TTML aus, das Format auf Zeilenebene, das Apple Music für Texte nutzt, die sich im Takt der Wiedergabe hervorheben. Es ist die Datei, die Ihr Label oder Distributor bei Apple einreicht, über Transporter oder iTunes Connect, um synchronisierte Songtexte für ein Release zu aktivieren. Es ist kein allgemeines Video-Untertitel-TTML und kein Video-Untertitel. Nutzen Sie für Video die Ausgabe SRT, VTT oder SCC.

Question 4

Kann ich DeliverCC für Spotify-Songtexte nutzen?

Accepted Answer

Nicht als Datei, denn Spotify akzeptiert keine. Spotifys synchronisierte Songtexte werden vollständig von Musixmatch betrieben. Der einzige Weg, sie hinzuzufügen, ist, ein Künstler- oder Label-Konto in Musixmatch zu verifizieren und die Texte im eigenen Tool von Musixmatch zu synchronisieren, das sie dann an Spotify weitergibt. Kein Tool kann Spotify eine fertige Songtextdatei übergeben.

Apple Music ist anders: Es akzeptiert eine zeitsynchrone TTML-Songtextdatei, die direkt vom Rechteinhaber oder Distributor eingereicht wird, also die Datei, die DeliverCC erzeugt. DeliverCC bedient also das Ziel, das eine Datei annimmt, und lässt jenes aus, das manuelle Arbeit in einem separaten Tool erfordert. Instagram, Amazon Music und Tidal laufen auf dieselbe Weise über Musixmatch wie Spotify.

Question 5

Welche Sprachen unterstützt DeliverCC?

Accepted Answer

DeliverCC unterstützt einundzwanzig Alignment-Sprachen: Englisch, Spanisch, Portugiesisch, Koreanisch, Japanisch, Französisch, Deutsch, Italienisch, Arabisch, Dänisch, Niederländisch, Finnisch, Hindi, Indonesisch, Norwegisch, Polnisch, Russisch, Schwedisch, Thailändisch, Türkisch und Chinesisch. Jede Sprache nutzt das beste verfügbare Alignment-Modell. Für Sprachen mit nicht-lateinischer Schrift (Koreanisch, Japanisch, Arabisch, Hindi, Thai, Chinesisch) müssen die Texte in der nativen Schrift des Songs bereitgestellt werden, nicht in romanisierter Transliteration.

Question 6

Warum Forced Alignment statt Speech-to-Text?

Accepted Answer

Gesangsstimmen bringen Speech-to-Text zum Scheitern. Genuschelter Vortrag, Ad-libs, Harmonien, Autotune, nicht-lexikalische Laute, all das verschlechtert die Transkriptionsgenauigkeit so weit, dass das Ergebnis nicht mit dem übereinstimmt, was tatsächlich gesungen wurde.

DeliverCC verfolgt einen anderen Ansatz. Sie liefern die korrekten Texte, die vom Künstler freigegebene Version, und das System richtet diese Texte am Audio aus, statt zu raten, was gesungen wurde. Die Untertitel sagen genau das, was das Textblatt sagt, mit einer Timing-Genauigkeit auf Wortebene, die selbst bei den schwierigsten Gesangsperformances hält.

Question 7

Kann ich DeliverCC für Lyric-Videos nutzen?

Accepted Answer

Ja. Dieselbe Alignment-Engine, die Ihre Untertitel timt, exportiert auch getimten Songtext nach Premiere Pro, DaVinci Resolve, After Effects und Final Cut Pro, sodass Sie sich das Keyframing jedes Worts von Hand sparen. Sie gestalten den Look, DeliverCC übernimmt das Timing.

Question 8

Welche Editoren unterstützt der Lyric-Video-Export?

Accepted Answer

Premiere Pro (ein SRT auf Wortebene), DaVinci Resolve und Final Cut Pro (ein gemeinsames FCPXML) und After Effects (ein .jsx-Skript). LRC und Enhanced LRC sind außerdem für Lyric- und Karaoke-Player verfügbar.

Question 9

Ist der Lyric-Video-Export ein separates Produkt oder ein separater Tarif?

Accepted Answer

Nein. Jede Generierung gibt Ihnen jedes Format, Untertitel und Editor-Exporte zugleich, mit unbegrenzten Downloads. Es gibt keinen separaten Lyric-Video-Tarif.

Question 10

Ist der Lyric-Video-Export dasselbe wie synchronisierte Songtexte bei Apple Music?

Accepted Answer

Nein. Synchronisierte Songtexte bei Apple Music sind eine TTML-Datei auf Zeilenebene für die Music-App. Der Lyric-Video-Export ist getimter Text auf Wortebene, den Sie in Ihren Editor holen, um ihn zu gestalten und zu animieren. DeliverCC erzeugt beides aus demselben Upload.

Question 11

Liefere ich die Texte, oder transkribiert DeliverCC sie?

Accepted Answer

Sie liefern die Texte. DeliverCC ist darauf ausgelegt, dass das Textblatt die Quelle der Wahrheit ist, nicht eine Transkription. Das entspricht dem Workflow, den die meisten Labels bereits nutzen: Untertitel gehen abgestimmt auf die offiziellen Texte raus, nicht auf das, was eine KI in der Aufnahme gehört zu haben glaubt. DeliverCC übernimmt das Timing, Sie bestimmen, was die Worte sagen.

Question 12

Wie lange dauert eine Generierung?

Accepted Answer

Eine typische Generierung dauert 30 bis 60 Sekunden vom Klick auf Generieren bis zum Erscheinen der Untertitel. Die erste Anfrage auf einem kalten Worker kann etwa 90 Sekunden dauern, während die Infrastruktur hochfährt; folgende Anfragen auf warmen Workern sind durchweg schneller. Die meisten Nutzer sehen im normalen Betrieb Zeiten unter 60 Sekunden.

Question 13

Kann ich das Alignment nach der Generierung manuell bearbeiten?

Accepted Answer

Ja. Jede Generierung landet im Timeline-Editor mit Wellenform-Ansicht, ziehbaren Blockkanten, Textbearbeitung pro Block sowie vollständigem Rückgängig und Wiederholen. Die meisten Songs brauchen null Bearbeitungen. Wenn Bearbeitungen nötig sind (meist bei Ad-libs oder instrumentalen Intros), dauert die Korrektur Sekunden. Bearbeitungen werden in die exportierte Untertiteldatei eingebacken, in welchem Format Sie auch wählen.

Question 14

Wie geht DeliverCC mit Ad-libs, genuschelten Vocals und Producer-Tags um?

Accepted Answer

Forced Alignment geht mit Ad-libs, Producer-Tags und genuschelten Vocals besser um als Transkriptionstools. DeliverCC richtet sich an den Texten aus, die Sie liefern: Wenn Ihr Textblatt das Ad-lib enthält, wird es automatisch zusammen mit der Stimme getimt. Wenn Ihr Textblatt es auslässt (was für Füll-Laute wie „yeah" und „mmm" normal ist), richten sich die umliegenden Worte trotzdem korrekt aus. Wenn Sie nach der Generierung ein Ad-lib hinzufügen oder entfernen wollen, können Sie im Timeline-Editor den Text jedes Blocks bearbeiten und das Timing manuell anpassen.

Question 15

Was kann ich hochladen, und gibt es ein Größenlimit?

Accepted Answer

DeliverCC akzeptiert gängige Audioformate (MP3, WAV, FLAC, AAC, M4A, OGG) und Videoformate (MP4, MOV, M4V, WebM, AVI, MKV). Uploads sind auf 500 MB und 15 Minuten Dauer begrenzt. DeliverCC extrahiert das Audio automatisch aus Video-Uploads. Für Musikvideo-Editoren: Rohe Video-Exporte können viele Gigabyte groß sein (über dem 500-MB-Limit), daher ist der Export einer reinen Audiodatei aus Ihrem Editor der schnellere Weg. Eine MP3 von 5 Minuten ist typischerweise unter 10 MB.

Question 16

Was passiert mit meinem Audio, nachdem ich Untertitel generiert habe?

Accepted Answer

Audiodateien werden etwa 14 Tage nach dem Upload automatisch aus dem Speicher von DeliverCC gelöscht, ein Zeitfenster, das die Projektprüfungs- und Überarbeitungsphase abdeckt.

Generierte Untertiteldateien bleiben in Ihrem Konto, bis Sie sie löschen. Weder Ihr Audio noch Ihre Texte werden zum Trainieren irgendeines Modells verwendet. Die vollständige Aufbewahrungsrichtlinie steht in der Datenschutzerklärung.

Question 17

Wie funktioniert das Credit-System?

Accepted Answer

Ein Credit entspricht einer Untertitelgenerierung. Sie erhalten mit diesem einen Credit alle vier Exportformate, generiert aus denselben Alignment-Daten.

Monatstarife gewähren Credits zu Beginn jedes Abrechnungszeitraums und setzen sie monatlich zurück: Creator gibt 5, Studio 12, Label 30. Pay-as-you-go-Credits werden einzeln gekauft und verfallen nie. Wenn Ihnen mitten im Monat die Credits ausgehen, können Sie einen Pay-as-you-go-Credit kaufen oder auf einen höheren Tarif wechseln. Es gibt keine Mehrkosten bei Überschreitung und keine Gebühren pro Format.

Format	Was es ist	Wo Sie es einsetzen
SRT	Das universelle Untertitelformat. Klartext, einfache Timecodes	YouTube, Vimeo, Facebook, Instagram, TikTok, die meisten Video-Editoren
VTT	Standard für Web-Video. WebVTT-Format	HTML5-Videoplayer, Web-Einbettungen
SCC	Scenarist Closed Captions. Broadcast-Standard CEA-608	US-Broadcast-TV (CBS, NBC, ABC, Fox)
TTML	Timed Text Markup Language. Apple-Music-Dialekt für synchronisierte Songtexte (auf Zeilenebene)	Synchronisierte Songtexte bei Apple Music. Die Datei, die Labels über ihren Distributor senden, um die Karaoke-artige Hervorhebung in der Apple-Music-App zu ermöglichen

So funktioniert DeliverCC.

Technik und Formate

Export für Lyric-Videos

Workflow

Upload und Dateiformate

Vertrauen und Geschäftliches