Question 1

Quels formats de sous-titres DeliverCC exporte-t-il, et lequel utiliser ?

Accepted Answer

DeliverCC produit quatre formats à partir d'une seule génération : SRT (format de sous-titres universel pour YouTube, Vimeo, les réseaux sociaux), VTT (standard de la vidéo web pour les lecteurs HTML5), SCC (Scenarist Closed Captions pour la TV broadcast américaine) et TTML (dialecte des paroles synchronisées d'Apple Music, le fichier au niveau de la ligne que les labels envoient à Apple Music pour activer la mise en évidence des paroles façon karaoké dans l'app).

Question 2

DeliverCC sous-titre-t-il les dialogues et les ad-libs, ou seulement les paroles chantées ?

Accepted Answer

Les deux. Collez tout ce que vous voulez sous-titrer : les paroles, les ad-libs et tout dialogue parlé, et DeliverCC aligne l'ensemble. Un fichier de sous-titres broadcast doit contenir chaque mot, chanté comme parlé, donc sous-titrer les parties parlées est ce qui rend votre livraison complète et conforme.

Comme l'outil aligne le texte que vous fournissez, tout ce que vous voulez sous-titrer doit figurer dans ce que vous collez. Un ad-lib absent de votre feuille de paroles n'apparaîtra pas, sauf si vous l'ajoutez.

Question 3

Quelle est la différence entre les sous-titres vidéo et les paroles synchronisées d'Apple Music ?

Accepted Answer

Ils vont à deux endroits différents. Les sous-titres vidéo (SRT, VTT et SCC) accompagnent votre vidéo. Ils affichent le texte par-dessus l'image, synchronisé avec tout ce qui est audible, et fonctionnent partout où la vidéo est lue : SRT et VTT pour YouTube, Vimeo et les réseaux sociaux, et SCC pour la TV broadcast américaine. Les paroles synchronisées d'Apple Music accompagnent plutôt la chanson. Ce sont les paroles qui défilent et se mettent en évidence ligne par ligne dans l'app Apple Music pendant la lecture du morceau. Le même texte calé en dessous, deux destinations différentes, et ils ne sont pas interchangeables. L'un affiche les mots sur une vidéo, l'autre alimente l'affichage des paroles dans l'app de streaming.

Le TTML (Timed Text Markup Language) est un standard W3C pour le texte calé. DeliverCC génère le dialecte des paroles synchronisées d'Apple Music du TTML, le format au niveau de la ligne qu'Apple Music utilise pour les paroles qui se mettent en évidence au rythme de la lecture. C'est le fichier que votre label ou distributeur soumet à Apple, via Transporter ou iTunes Connect, pour activer les paroles synchronisées d'une sortie. Ce n'est pas un TTML de sous-titres vidéo classique et ce n'est pas un sous-titre vidéo. Pour la vidéo, utilisez la sortie SRT, VTT ou SCC.

Question 4

Puis-je utiliser DeliverCC pour les paroles Spotify ?

Accepted Answer

Pas sous forme de fichier, car Spotify n'en accepte pas. Les paroles synchronisées de Spotify sont entièrement gérées par Musixmatch. Le seul moyen de les ajouter est de vérifier un compte artiste ou label dans Musixmatch et de synchroniser les paroles dans l'outil de Musixmatch, qui les transmet ensuite à Spotify. Aucun outil ne peut fournir à Spotify un fichier de paroles fini.

Apple Music est différent : il accepte un fichier de paroles TTML synchronisé soumis directement par l'ayant droit ou le distributeur, qui est le fichier que DeliverCC produit. DeliverCC sert donc la destination qui accepte un fichier et laisse celle qui exige un travail manuel dans un outil séparé. Instagram, Amazon Music et Tidal passent par Musixmatch de la même manière que Spotify.

Question 5

Quelles langues DeliverCC prend-il en charge ?

Accepted Answer

DeliverCC prend en charge vingt et une langues d'alignement : anglais, espagnol, portugais, coréen, japonais, français, allemand, italien, arabe, danois, néerlandais, finnois, hindi, indonésien, norvégien, polonais, russe, suédois, thaï, turc et chinois. Chaque langue utilise le meilleur modèle d'alignement disponible. Pour les langues à écriture non latine (coréen, japonais, arabe, hindi, thaï, chinois), les paroles doivent être fournies dans l'écriture native de la chanson, pas en translittération romanisée.

Question 6

Pourquoi l'alignement forcé plutôt que la reconnaissance vocale ?

Accepted Answer

Les voix musicales font échouer la reconnaissance vocale. Diction marmonnée, ad-libs, harmonies, autotune, sons non lexicaux, tout cela dégrade la précision de la transcription au point que le résultat ne correspond pas à ce qui a réellement été chanté.

DeliverCC adopte une autre approche. Vous fournissez les paroles correctes, la version approuvée par l'artiste, et le système aligne ces paroles sur l'audio au lieu de deviner ce qui a été chanté. Les sous-titres disent exactement ce que dit la feuille de paroles, avec une précision de calage au mot qui tient même sur les performances vocales les plus difficiles.

Question 7

Puis-je utiliser DeliverCC pour des vidéos lyriques ?

Accepted Answer

Oui. Le même moteur d'alignement qui cale vos sous-titres exporte aussi le texte des paroles calé vers Premiere Pro, DaVinci Resolve, After Effects et Final Cut Pro, pour vous éviter de poser des keyframes sur chaque mot à la main. Vous concevez le rendu, DeliverCC gère le calage.

Question 8

Quels éditeurs l'export pour vidéos lyriques prend-il en charge ?

Accepted Answer

Premiere Pro (un SRT au mot), DaVinci Resolve et Final Cut Pro (un FCPXML commun) et After Effects (un script .jsx). Le LRC et l'Enhanced LRC sont aussi disponibles pour les lecteurs de paroles et de karaoké.

Question 9

L'export pour vidéos lyriques est-il un produit ou un forfait séparé ?

Accepted Answer

Non. Chaque génération vous donne tous les formats, les sous-titres comme les exports vers les éditeurs, avec des téléchargements illimités. Il n'y a pas de forfait vidéo lyrique séparé.

Question 10

L'export pour vidéos lyriques est-il la même chose que les paroles synchronisées d'Apple Music ?

Accepted Answer

Non. Les paroles synchronisées d'Apple Music sont un fichier TTML au niveau de la ligne pour l'app Music. L'export pour vidéos lyriques est un texte calé au mot que vous importez dans votre éditeur pour le concevoir et l'animer. DeliverCC produit les deux à partir du même import.

Question 11

Est-ce que je fournis les paroles, ou DeliverCC les transcrit-il ?

Accepted Answer

Vous fournissez les paroles. DeliverCC est conçu autour de la feuille de paroles comme source de vérité, pas d'une transcription. Cela correspond au workflow que la plupart des labels utilisent déjà : les sous-titres sont diffusés en accord avec les paroles officielles, pas avec ce qu'une IA croit avoir entendu dans l'enregistrement. DeliverCC gère le calage, vous contrôlez ce que disent les mots.

Question 12

Combien de temps prend une génération ?

Accepted Answer

Une génération typique prend 30 à 60 secondes entre le clic sur Générer et l'apparition des sous-titres. La première requête sur un worker à froid peut prendre environ 90 secondes, le temps que l'infrastructure démarre ; les requêtes suivantes sur des workers à chaud sont toujours plus rapides. La plupart des utilisateurs constatent des temps inférieurs à 60 secondes en utilisation normale.

Question 13

Puis-je modifier l'alignement manuellement après la génération ?

Accepted Answer

Oui. Chaque génération arrive dans l'éditeur de montage avec une vue de forme d'onde, des bords de blocs déplaçables, l'édition du texte bloc par bloc, et des annuler/rétablir complets. La plupart des chansons ne nécessitent aucune retouche. Quand une retouche est nécessaire (généralement pour des ad-libs ou des intros instrumentales), la correction prend quelques secondes. Les retouches sont intégrées au fichier de sous-titres exporté, dans le format que vous choisissez.

Question 14

Comment DeliverCC gère-t-il les ad-libs, les voix marmonnées et les producer tags ?

Accepted Answer

L'alignement forcé gère les ad-libs, les producer tags et les voix marmonnées mieux que les outils de transcription. DeliverCC s'aligne sur les paroles que vous fournissez : si votre feuille de paroles inclut l'ad-lib, il est calé automatiquement en même temps que la voix. Si votre feuille de paroles l'omet (ce qui est normal pour les « yeah » et « mmm » de remplissage), les mots autour s'alignent quand même correctement. Si vous voulez ajouter ou retirer un ad-lib après la génération, l'éditeur de montage vous permet de modifier le texte de n'importe quel bloc et d'ajuster le calage manuellement.

Question 15

Que puis-je importer, et y a-t-il une limite de taille ?

Accepted Answer

DeliverCC accepte les formats audio standard (MP3, WAV, FLAC, AAC, M4A, OGG) et vidéo (MP4, MOV, M4V, WebM, AVI, MKV). Les imports sont limités à 500 Mo et 15 minutes de durée. DeliverCC extrait automatiquement l'audio des imports vidéo. Pour les monteurs de clips : les exports vidéo bruts peuvent peser plusieurs Go (au-delà de la limite de 500 Mo), donc exporter un fichier audio seul depuis votre éditeur est la voie la plus rapide. Un MP3 de 5 minutes fait généralement moins de 10 Mo.

Question 16

Qu'arrive-t-il à mon audio après la génération des sous-titres ?

Accepted Answer

Les fichiers audio sont automatiquement supprimés du stockage de DeliverCC environ 14 jours après l'import, une fenêtre qui couvre la phase de relecture et de révision du projet.

Les fichiers de sous-titres générés restent dans votre compte jusqu'à ce que vous les supprimiez. Rien de votre audio ni de vos paroles n'est utilisé pour entraîner un quelconque modèle. La politique de conservation complète figure dans la politique de confidentialité.

Question 17

Comment fonctionne le système de crédits ?

Accepted Answer

Un crédit équivaut à une génération de sous-titres. Vous obtenez les quatre formats d'export avec ce seul crédit, générés à partir des mêmes données d'alignement.

Les forfaits mensuels accordent des crédits au début de chaque période de facturation et se réinitialisent chaque mois : Creator en donne 5, Studio 12, Label 30. Les crédits Pay-as-you-go s'achètent à l'unité et n'expirent jamais. Si vous êtes à court en cours de mois, vous pouvez acheter un crédit Pay-as-you-go ou passer à un forfait supérieur. Il n'y a aucuns frais de dépassement ni frais par format.

Format	Ce que c'est	Où l'utiliser
SRT	Le format de sous-titres universel. Texte brut, timecodes simples	YouTube, Vimeo, Facebook, Instagram, TikTok, la plupart des éditeurs vidéo
VTT	Standard de la vidéo web. Format WebVTT	Lecteurs vidéo HTML5, intégrations web
SCC	Scenarist Closed Captions. Standard broadcast CEA-608	TV broadcast américaine (CBS, NBC, ABC, Fox)
TTML	Timed Text Markup Language. Dialecte des paroles synchronisées d'Apple Music (au niveau de la ligne)	Paroles synchronisées des chansons sur Apple Music. Le fichier que les labels envoient via leur distributeur pour activer la mise en évidence façon karaoké dans l'app Apple Music

Comment fonctionne DeliverCC.

Technique et formats

Export pour vidéos lyriques

Workflow

Import et formats de fichiers

Confiance et questions pratiques