Formats de sous-titres, langues prises en charge, workflow, tarifs, et le reste. Si vous ne trouvez pas votre question, écrivez à hello@delivercc.io.
DeliverCC produit quatre formats à partir d'une seule génération. Voici ce qu'est chacun et où l'utiliser :
| Format | Ce que c'est | Où l'utiliser |
|---|---|---|
| SRT | Le format de sous-titres universel. Texte brut, timecodes simples | YouTube, Vimeo, Facebook, Instagram, TikTok, la plupart des éditeurs vidéo |
| VTT | Standard de la vidéo web. Format WebVTT | Lecteurs vidéo HTML5, intégrations web |
| SCC | Scenarist Closed Captions. Standard broadcast CEA-608 | TV broadcast américaine (CBS, NBC, ABC, Fox) |
| TTML | Timed Text Markup Language. Dialecte des paroles synchronisées d'Apple Music (au niveau de la ligne) | Paroles synchronisées des chansons sur Apple Music. Le fichier que les labels envoient via leur distributeur pour activer la mise en évidence façon karaoké dans l'app Apple Music |
Les deux. Collez tout ce que vous voulez sous-titrer : les paroles, les ad-libs et tout dialogue parlé, et DeliverCC aligne l'ensemble. Un fichier de sous-titres broadcast doit contenir chaque mot, chanté comme parlé, donc sous-titrer les parties parlées est ce qui rend votre livraison complète et conforme.
Comme l'outil aligne le texte que vous fournissez, tout ce que vous voulez sous-titrer doit figurer dans ce que vous collez. Un ad-lib absent de votre feuille de paroles n'apparaîtra pas, sauf si vous l'ajoutez.
Ils vont à deux endroits différents. Les sous-titres vidéo (SRT, VTT et SCC) accompagnent votre vidéo. Ils affichent le texte par-dessus l'image, synchronisé avec tout ce qui est audible, et fonctionnent partout où la vidéo est lue : SRT et VTT pour YouTube, Vimeo et les réseaux sociaux, et SCC pour la TV broadcast américaine. Les paroles synchronisées d'Apple Music accompagnent plutôt la chanson. Ce sont les paroles qui défilent et se mettent en évidence ligne par ligne dans l'app Apple Music pendant la lecture du morceau. Le même texte calé en dessous, deux destinations différentes, et ils ne sont pas interchangeables. L'un affiche les mots sur une vidéo, l'autre alimente l'affichage des paroles dans l'app de streaming.
Le TTML (Timed Text Markup Language) est un standard W3C pour le texte calé. DeliverCC génère le dialecte des paroles synchronisées d'Apple Music du TTML, le format au niveau de la ligne qu'Apple Music utilise pour les paroles qui se mettent en évidence au rythme de la lecture. C'est le fichier que votre label ou distributeur soumet à Apple, via Transporter ou iTunes Connect, pour activer les paroles synchronisées d'une sortie. Ce n'est pas un TTML de sous-titres vidéo classique et ce n'est pas un sous-titre vidéo. Pour la vidéo, utilisez la sortie SRT, VTT ou SCC.
Pas sous forme de fichier, car Spotify n'en accepte pas. Les paroles synchronisées de Spotify sont entièrement gérées par Musixmatch. Le seul moyen de les ajouter est de vérifier un compte artiste ou label dans Musixmatch et de synchroniser les paroles dans l'outil de Musixmatch, qui les transmet ensuite à Spotify. Aucun outil ne peut fournir à Spotify un fichier de paroles fini.
Apple Music est différent : il accepte un fichier de paroles TTML synchronisé soumis directement par l'ayant droit ou le distributeur, qui est le fichier que DeliverCC produit. DeliverCC sert donc la destination qui accepte un fichier et laisse celle qui exige un travail manuel dans un outil séparé. Instagram, Amazon Music et Tidal passent par Musixmatch de la même manière que Spotify.
Vingt et une langues d'alignement, couvrant la plupart des grands marchés musicaux :
Anglais, espagnol, portugais, coréen, japonais, français, allemand, italien, arabe, danois, néerlandais, finnois, hindi, indonésien, norvégien, polonais, russe, suédois, thaï, turc et chinois.
Chaque langue utilise le meilleur modèle d'alignement disponible pour elle. Une chose à savoir pour les langues à écriture non latine (coréen, japonais, arabe, hindi, thaï, chinois) : collez vos paroles dans l'écriture native de la chanson, pas dans une version romanisée. « Tum ho meri zindagi » ne s'alignera pas pour une chanson en hindi. « तुम हो मेरी ज़िन्दगी » s'alignera.
Les voix musicales font échouer la reconnaissance vocale. Diction marmonnée, ad-libs, harmonies, autotune, sons non lexicaux, tout cela dégrade la précision de la transcription au point que le résultat ne correspond pas à ce qui a réellement été chanté.
DeliverCC adopte une autre approche. Vous fournissez les paroles correctes, la version approuvée par l'artiste, et le système aligne ces paroles sur l'audio au lieu de deviner ce qui a été chanté. Les sous-titres disent exactement ce que dit la feuille de paroles, avec une précision de calage au mot qui tient même sur les performances vocales les plus difficiles.
Oui. Le même moteur d'alignement qui cale vos sous-titres exporte aussi le texte des paroles calé vers Premiere Pro, DaVinci Resolve, After Effects et Final Cut Pro, pour vous éviter de poser des keyframes sur chaque mot à la main. Vous concevez le rendu, DeliverCC gère le calage.
Premiere Pro (un SRT au mot), DaVinci Resolve et Final Cut Pro (un FCPXML commun) et After Effects (un script .jsx). Le LRC et l'Enhanced LRC sont aussi disponibles pour les lecteurs de paroles et de karaoké.
Non. Chaque génération vous donne tous les formats, les sous-titres comme les exports vers les éditeurs, avec des téléchargements illimités. Il n'y a pas de forfait vidéo lyrique séparé.
Non. Les paroles synchronisées d'Apple Music sont un fichier TTML au niveau de la ligne pour l'app Music. L'export pour vidéos lyriques est un texte calé au mot que vous importez dans votre éditeur pour le concevoir et l'animer. DeliverCC produit les deux à partir du même import.
Vous les fournissez. DeliverCC est conçu autour de la feuille de paroles comme source de vérité, pas d'une transcription. Cela correspond au workflow que la plupart des labels utilisent déjà : les sous-titres sont diffusés en accord avec les paroles officielles validées, pas avec ce qu'une IA croit avoir entendu dans l'enregistrement. DeliverCC gère le calage, vous contrôlez ce que disent les mots.
Génération typique : 30 à 60 secondes entre le moment où vous cliquez sur Générer et l'apparition des sous-titres. La première requête sur un worker à froid prend plus de temps (environ 90 secondes, le temps que l'infrastructure démarre). Les requêtes suivantes sur des workers à chaud sont toujours plus rapides. La plupart des utilisateurs constatent des temps inférieurs à 60 secondes en utilisation normale.
Oui. Chaque génération arrive dans l'éditeur de montage avec une vue de forme d'onde, des bords de blocs déplaçables, l'édition du texte bloc par bloc, et des annuler/rétablir complets. La plupart des chansons ne nécessitent aucune retouche. Quand une retouche est nécessaire (généralement pour des ad-libs ou des intros instrumentales), la correction prend quelques secondes. Les retouches sont intégrées au fichier de sous-titres exporté, dans le format que vous choisissez.
L'alignement forcé gère cela mieux que les outils de transcription. Les ad-libs (« yeah », « oh », « mmm »), les producer tags et les voix marmonnées ou harmonisées déroutent tous les outils de sous-titrage qui reposent sur la reconnaissance vocale. DeliverCC s'aligne sur les paroles que vous fournissez, donc :
Si vous voulez ajouter un ad-lib qui n'était pas dans votre feuille de paroles, ou en retirer un qui y était, l'éditeur de montage vous permet de modifier le texte de n'importe quel bloc et d'ajuster le calage manuellement.
DeliverCC accepte les formats audio et vidéo standard :
Les imports sont limités à 500 Mo et 15 minutes de durée. DeliverCC extrait automatiquement l'audio des imports vidéo, vous n'avez donc rien à convertir vous-même.
Astuce pour les monteurs de clips : Les exports vidéo bruts (MOV, ProRes, etc.) pèsent souvent plusieurs Go, bien au-delà de la limite d'import de 500 Mo. La voie la plus rapide est d'exporter un fichier audio seul depuis votre éditeur vidéo et d'importer celui-ci. Une chanson de 5 minutes en MP3 fait généralement moins de 10 Mo, alors que la même chanson en vidéo brute peut peser plusieurs Go. La génération exécute le même alignement dans les deux cas, et vous évitez la longue attente d'import.
Les fichiers audio sont automatiquement supprimés du stockage de DeliverCC environ 14 jours après l'import, une fenêtre qui couvre la phase de relecture et de révision du projet.
Les fichiers de sous-titres générés restent dans votre compte jusqu'à ce que vous les supprimiez. Rien de votre audio ni de vos paroles n'est utilisé pour entraîner un quelconque modèle. La politique de conservation complète figure dans la politique de confidentialité.
Un crédit équivaut à une génération de sous-titres. Vous obtenez les quatre formats d'export avec ce seul crédit, générés à partir des mêmes données d'alignement.
Les forfaits mensuels accordent des crédits au début de chaque période de facturation et se réinitialisent chaque mois : Creator en donne 5, Studio 12, Label 30. Les crédits Pay-as-you-go s'achètent à l'unité et n'expirent jamais. Si vous êtes à court en cours de mois, vous pouvez acheter un crédit Pay-as-you-go ou passer à un forfait supérieur. Il n'y a aucuns frais de dépassement ni frais par format.
Have questions? Email hello@delivercc.io