Perguntas frequentes

Como o DeliverCC funciona.

Formatos de legenda, idiomas suportados, workflow, preços e o resto. Se não encontrar a sua pergunta, escreva para hello@delivercc.io.

Técnica e formatos

Quais formatos de legenda o DeliverCC exporta, e qual eu uso?

O DeliverCC gera quatro formatos a partir de uma única geração. Veja o que é cada um e onde usar:

FormatoO que éOnde usar
SRTO formato de legenda universal. Texto simples, timecodes simplesYouTube, Vimeo, Facebook, Instagram, TikTok, a maioria dos editores de vídeo
VTTPadrão de vídeo web. Formato WebVTTPlayers de vídeo HTML5, embeds web
SCCScenarist Closed Captions. Padrão broadcast CEA-608TV broadcast dos EUA (CBS, NBC, ABC, Fox)
TTMLTimed Text Markup Language. Dialeto de letras sincronizadas do Apple Music (por linha)Letras sincronizadas das músicas no Apple Music. O arquivo que as gravadoras enviam pela distribuidora para ativar o destaque estilo karaokê no app do Apple Music
O DeliverCC legenda diálogos e ad-libs, ou só a letra cantada?

Os dois. Cole tudo o que você quer legendar: a letra, os ad-libs e qualquer diálogo falado, e o DeliverCC alinha tudo. Um arquivo de legenda broadcast precisa conter cada palavra, cantada e falada, então legendar as partes faladas é o que deixa a sua entrega completa e em conformidade.

Como a ferramenta alinha o texto que você fornece, tudo o que você quer legendar precisa estar no que você cola. Um ad-lib que não está na sua folha de letra não vai aparecer, a menos que você o adicione.

Qual é a diferença entre legendas de vídeo e letras sincronizadas do Apple Music?

Elas vão para dois lugares diferentes. As legendas de vídeo (SRT, VTT e SCC) acompanham o seu vídeo. Mostram o texto por cima da imagem, sincronizado com tudo o que é audível, e funcionam em qualquer lugar onde o vídeo é reproduzido: SRT e VTT para YouTube, Vimeo e redes sociais, e SCC para a TV broadcast dos EUA. As letras sincronizadas do Apple Music acompanham a música. São as letras que rolam e se destacam linha por linha no app do Apple Music enquanto a faixa toca. O mesmo texto sincronizado por baixo, dois destinos diferentes, e não são intercambiáveis. Um pinta as palavras sobre um vídeo, o outro alimenta a exibição das letras no app de streaming.

O TTML (Timed Text Markup Language) é um padrão W3C para texto sincronizado. O DeliverCC gera o dialeto de letras sincronizadas do Apple Music do TTML, o formato por linha que o Apple Music usa para as letras que se destacam no ritmo da reprodução. É o arquivo que a sua gravadora ou distribuidora envia para a Apple, via Transporter ou iTunes Connect, para ativar as letras sincronizadas de um lançamento. Não é um TTML de legenda de vídeo comum e não é uma legenda de vídeo. Para vídeo, use a saída SRT, VTT ou SCC.

Posso usar o DeliverCC para as letras do Spotify?

Não como arquivo, porque o Spotify não aceita um. As letras sincronizadas do Spotify são gerenciadas inteiramente pela Musixmatch. O único jeito de adicioná-las é verificar uma conta de artista ou gravadora na Musixmatch e sincronizar as letras na ferramenta da Musixmatch, que então as repassa ao Spotify. Nenhuma ferramenta consegue entregar ao Spotify um arquivo de letra pronto.

O Apple Music é diferente: ele aceita um arquivo de letra TTML sincronizado enviado direto pelo detentor dos direitos ou pela distribuidora, que é o arquivo que o DeliverCC produz. Então o DeliverCC atende o destino que aceita um arquivo e deixa de fora aquele que exige trabalho manual numa ferramenta separada. Instagram, Amazon Music e Tidal passam pela Musixmatch do mesmo jeito que o Spotify.

Quais idiomas o DeliverCC suporta?

Vinte e um idiomas de alinhamento, cobrindo a maior parte dos principais mercados musicais:

Inglês, espanhol, português, coreano, japonês, francês, alemão, italiano, árabe, dinamarquês, holandês, finlandês, hindi, indonésio, norueguês, polonês, russo, sueco, tailandês, turco e chinês.

Cada idioma usa o melhor modelo de alinhamento disponível para ele. Uma coisa a saber para idiomas de escrita não latina (coreano, japonês, árabe, hindi, tailandês, chinês): cole a letra na escrita nativa da música, não em versão romanizada. "Tum ho meri zindagi" não vai alinhar para uma música em hindi. "तुम हो मेरी ज़िन्दगी" vai.

Por que alinhamento forçado em vez de reconhecimento de fala?

Vozes musicais quebram o reconhecimento de fala. Dicção arrastada, ad-libs, harmonias, autotune, sons não lexicais, tudo isso piora a precisão da transcrição a ponto de o resultado não corresponder ao que foi realmente cantado.

O DeliverCC adota uma abordagem diferente. Você fornece a letra correta, a versão aprovada pelo artista, e o sistema alinha essa letra ao áudio em vez de adivinhar o que foi cantado. As legendas dizem exatamente o que a folha de letra diz, com uma precisão de timing por palavra que se mantém até nas performances vocais mais difíceis.

Export para vídeo com letra

Posso usar o DeliverCC para vídeos com letra?

Sim. O mesmo motor de alinhamento que sincroniza as suas legendas também exporta o texto da letra sincronizado para Premiere Pro, DaVinci Resolve, After Effects e Final Cut Pro, então você pula a etapa de colocar keyframe em cada palavra na mão. Você cria o visual, o DeliverCC cuida do timing.

Quais editores o export para vídeo com letra suporta?

Premiere Pro (um SRT por palavra), DaVinci Resolve e Final Cut Pro (um FCPXML compartilhado) e After Effects (um script .jsx). LRC e Enhanced LRC também estão disponíveis para players de letra e karaokê.

O export para vídeo com letra é um produto ou plano separado?

Não. Cada geração te dá todos os formatos, legendas e exports para editor juntos, com downloads ilimitados. Não existe um plano separado para vídeo com letra.

O export para vídeo com letra é a mesma coisa que as letras sincronizadas do Apple Music?

Não. As letras sincronizadas do Apple Music são um arquivo TTML por linha para o app Music. O export para vídeo com letra é texto sincronizado por palavra que você leva para o seu editor para criar e animar. O DeliverCC produz os dois a partir do mesmo upload.

Workflow

Eu forneço a letra, ou o DeliverCC transcreve?

Você fornece. O DeliverCC foi construído com a folha de letra como fonte da verdade, não uma transcrição. Isso corresponde ao workflow que a maioria das gravadoras já usa: as legendas saem alinhadas à letra oficial aprovada, não ao que uma IA acha que ouviu na gravação. O DeliverCC cuida do timing, você controla o que as palavras dizem.

Quanto tempo leva uma geração?

Geração típica: 30 a 60 segundos do momento em que você clica em Gerar até as legendas aparecerem. A primeira requisição em um worker frio leva mais tempo (cerca de 90 segundos enquanto a infraestrutura sobe). As requisições seguintes em workers quentes são consistentemente mais rápidas. A maioria dos usuários vê tempos abaixo de 60 segundos no uso normal.

Posso editar o alinhamento manualmente depois da geração?

Sim. Cada geração chega no editor de timeline com visualização de forma de onda, bordas de bloco arrastáveis, edição de texto bloco a bloco e desfazer/refazer completos. A maioria das músicas não precisa de nenhuma edição. Quando alguma edição é necessária (geralmente para ad-libs ou intros instrumentais), a correção leva segundos. As edições são incorporadas ao arquivo de legenda exportado, no formato que você escolher.

Como o DeliverCC lida com ad-libs, vocais arrastados e producer tags?

O alinhamento forçado lida com isso melhor que ferramentas de transcrição. Ad-libs ("yeah", "oh", "mmm"), producer tags e vocais arrastados ou harmonizados confundem todas as ferramentas de legenda que dependem de reconhecimento de fala. O DeliverCC se alinha à letra que você fornece, então:

  • Se a sua folha de letra inclui o ad-lib, ele será sincronizado automaticamente junto com o vocal.
  • Se a sua folha de letra o omite (o que é normal para sons de preenchimento como "yeah" e "mmm"), as palavras ao redor ainda se alinham corretamente. O ad-lib simplesmente não é legendado.

Se você quiser adicionar um ad-lib que não estava na sua folha de letra, ou remover um que estava, o editor de timeline permite editar o texto de qualquer bloco e ajustar o timing manualmente.

Upload e formatos de arquivo

O que posso enviar, e existe um limite de tamanho?

O DeliverCC aceita os formatos de áudio e vídeo padrão:

  • Áudio: MP3, WAV, FLAC, AAC, M4A, OGG
  • Vídeo: MP4, MOV, M4V, WebM, AVI, MKV

Os uploads são limitados a 500 MB e 15 minutos de duração. O DeliverCC extrai o áudio automaticamente dos uploads de vídeo, então você não precisa converter nada por conta própria.

Dica para editores de videoclipe: Exports de vídeo brutos (MOV, ProRes etc.) costumam ter vários gigabytes, bem acima do limite de upload de 500 MB. O caminho mais rápido é exportar um arquivo só de áudio do seu editor de vídeo e enviar esse. Uma música de 5 minutos em MP3 costuma ter menos de 10 MB, enquanto a mesma música em vídeo bruto pode ter gigabytes. A geração roda o mesmo alinhamento nos dois casos, e você evita a longa espera de upload.

Confiança e questões práticas

O que acontece com o meu áudio depois que eu gero as legendas?

Os arquivos de áudio são apagados automaticamente do armazenamento do DeliverCC cerca de 14 dias após o upload, uma janela que cobre a fase de revisão e ajuste do projeto.

Os arquivos de legenda gerados ficam na sua conta até você apagá-los. Nada do seu áudio nem da sua letra é usado para treinar qualquer modelo. A política de retenção completa está na política de privacidade.

Como funciona o sistema de créditos?

Um crédito equivale a uma geração de legendas. Você recebe os quatro formatos de export com esse único crédito, gerados a partir dos mesmos dados de alinhamento.

Os planos mensais concedem créditos no início de cada ciclo de cobrança e são renovados todo mês: o Creator dá 5, o Studio 12, o Label 30. Os créditos Pay-as-you-go são comprados um a um e nunca expiram. Se acabarem no meio do mês, você pode comprar um crédito Pay-as-you-go ou subir de plano. Não há cobrança por excedente nem taxa por formato.

Have questions? Email hello@delivercc.io