Question 1

Quais formatos de legenda o DeliverCC exporta, e qual eu uso?

Accepted Answer

O DeliverCC gera quatro formatos a partir de uma única geração: SRT (formato de legenda universal para YouTube, Vimeo, redes sociais), VTT (padrão de vídeo web para players HTML5), SCC (Scenarist Closed Captions para a TV broadcast dos EUA) e TTML (dialeto de letras sincronizadas do Apple Music, o arquivo por linha que as gravadoras enviam ao Apple Music para ativar o destaque das letras estilo karaokê no app).

Question 2

O DeliverCC legenda diálogos e ad-libs, ou só a letra cantada?

Accepted Answer

Os dois. Cole tudo o que você quer legendar: a letra, os ad-libs e qualquer diálogo falado, e o DeliverCC alinha tudo. Um arquivo de legenda broadcast precisa conter cada palavra, cantada e falada, então legendar as partes faladas é o que deixa a sua entrega completa e em conformidade.

Como a ferramenta alinha o texto que você fornece, tudo o que você quer legendar precisa estar no que você cola. Um ad-lib que não está na sua folha de letra não vai aparecer, a menos que você o adicione.

Question 3

Qual é a diferença entre legendas de vídeo e letras sincronizadas do Apple Music?

Accepted Answer

Elas vão para dois lugares diferentes. As legendas de vídeo (SRT, VTT e SCC) acompanham o seu vídeo. Mostram o texto por cima da imagem, sincronizado com tudo o que é audível, e funcionam em qualquer lugar onde o vídeo é reproduzido: SRT e VTT para YouTube, Vimeo e redes sociais, e SCC para a TV broadcast dos EUA. As letras sincronizadas do Apple Music acompanham a música. São as letras que rolam e se destacam linha por linha no app do Apple Music enquanto a faixa toca. O mesmo texto sincronizado por baixo, dois destinos diferentes, e não são intercambiáveis. Um pinta as palavras sobre um vídeo, o outro alimenta a exibição das letras no app de streaming.

O TTML (Timed Text Markup Language) é um padrão W3C para texto sincronizado. O DeliverCC gera o dialeto de letras sincronizadas do Apple Music do TTML, o formato por linha que o Apple Music usa para as letras que se destacam no ritmo da reprodução. É o arquivo que a sua gravadora ou distribuidora envia para a Apple, via Transporter ou iTunes Connect, para ativar as letras sincronizadas de um lançamento. Não é um TTML de legenda de vídeo comum e não é uma legenda de vídeo. Para vídeo, use a saída SRT, VTT ou SCC.

Question 4

Posso usar o DeliverCC para as letras do Spotify?

Accepted Answer

Não como arquivo, porque o Spotify não aceita um. As letras sincronizadas do Spotify são gerenciadas inteiramente pela Musixmatch. O único jeito de adicioná-las é verificar uma conta de artista ou gravadora na Musixmatch e sincronizar as letras na ferramenta da Musixmatch, que então as repassa ao Spotify. Nenhuma ferramenta consegue entregar ao Spotify um arquivo de letra pronto.

O Apple Music é diferente: ele aceita um arquivo de letra TTML sincronizado enviado direto pelo detentor dos direitos ou pela distribuidora, que é o arquivo que o DeliverCC produz. Então o DeliverCC atende o destino que aceita um arquivo e deixa de fora aquele que exige trabalho manual numa ferramenta separada. Instagram, Amazon Music e Tidal passam pela Musixmatch do mesmo jeito que o Spotify.

Question 5

Quais idiomas o DeliverCC suporta?

Accepted Answer

O DeliverCC suporta vinte e um idiomas de alinhamento: inglês, espanhol, português, coreano, japonês, francês, alemão, italiano, árabe, dinamarquês, holandês, finlandês, hindi, indonésio, norueguês, polonês, russo, sueco, tailandês, turco e chinês. Cada idioma usa o melhor modelo de alinhamento disponível. Para idiomas de escrita não latina (coreano, japonês, árabe, hindi, tailandês, chinês), a letra precisa ser fornecida na escrita nativa da música, não em transliteração romanizada.

Question 6

Por que alinhamento forçado em vez de reconhecimento de fala?

Accepted Answer

Vozes musicais quebram o reconhecimento de fala. Dicção arrastada, ad-libs, harmonias, autotune, sons não lexicais, tudo isso piora a precisão da transcrição a ponto de o resultado não corresponder ao que foi realmente cantado.

O DeliverCC adota uma abordagem diferente. Você fornece a letra correta, a versão aprovada pelo artista, e o sistema alinha essa letra ao áudio em vez de adivinhar o que foi cantado. As legendas dizem exatamente o que a folha de letra diz, com uma precisão de timing por palavra que se mantém até nas performances vocais mais difíceis.

Question 7

Posso usar o DeliverCC para vídeos com letra?

Accepted Answer

Sim. O mesmo motor de alinhamento que sincroniza as suas legendas também exporta o texto da letra sincronizado para Premiere Pro, DaVinci Resolve, After Effects e Final Cut Pro, então você pula a etapa de colocar keyframe em cada palavra na mão. Você cria o visual, o DeliverCC cuida do timing.

Question 8

Quais editores o export para vídeo com letra suporta?

Accepted Answer

Premiere Pro (um SRT por palavra), DaVinci Resolve e Final Cut Pro (um FCPXML compartilhado) e After Effects (um script .jsx). LRC e Enhanced LRC também estão disponíveis para players de letra e karaokê.

Question 9

O export para vídeo com letra é um produto ou plano separado?

Accepted Answer

Não. Cada geração te dá todos os formatos, legendas e exports para editor juntos, com downloads ilimitados. Não existe um plano separado para vídeo com letra.

Question 10

O export para vídeo com letra é a mesma coisa que as letras sincronizadas do Apple Music?

Accepted Answer

Não. As letras sincronizadas do Apple Music são um arquivo TTML por linha para o app Music. O export para vídeo com letra é texto sincronizado por palavra que você leva para o seu editor para criar e animar. O DeliverCC produz os dois a partir do mesmo upload.

Question 11

Eu forneço a letra, ou o DeliverCC transcreve?

Accepted Answer

Você fornece a letra. O DeliverCC foi construído com a folha de letra como fonte da verdade, não uma transcrição. Isso corresponde ao workflow que a maioria das gravadoras já usa: as legendas saem alinhadas à letra oficial, não ao que uma IA acha que ouviu na gravação. O DeliverCC cuida do timing, você controla o que as palavras dizem.

Question 12

Quanto tempo leva uma geração?

Accepted Answer

Uma geração típica leva 30 a 60 segundos do clique em Gerar até as legendas aparecerem. A primeira requisição em um worker frio pode levar cerca de 90 segundos enquanto a infraestrutura sobe; as requisições seguintes em workers quentes são consistentemente mais rápidas. A maioria dos usuários vê tempos abaixo de 60 segundos no uso normal.

Question 13

Posso editar o alinhamento manualmente depois da geração?

Accepted Answer

Sim. Cada geração chega no editor de timeline com visualização de forma de onda, bordas de bloco arrastáveis, edição de texto bloco a bloco e desfazer/refazer completos. A maioria das músicas não precisa de nenhuma edição. Quando alguma edição é necessária (geralmente para ad-libs ou intros instrumentais), a correção leva segundos. As edições são incorporadas ao arquivo de legenda exportado, no formato que você escolher.

Question 14

Como o DeliverCC lida com ad-libs, vocais arrastados e producer tags?

Accepted Answer

O alinhamento forçado lida com ad-libs, producer tags e vocais arrastados melhor que ferramentas de transcrição. O DeliverCC se alinha à letra que você fornece: se a sua folha de letra inclui o ad-lib, ele será sincronizado automaticamente junto com o vocal. Se a sua folha de letra o omite (o que é normal para sons de preenchimento como "yeah" e "mmm"), as palavras ao redor ainda se alinham corretamente. Se você quiser adicionar ou remover um ad-lib depois da geração, o editor de timeline permite editar o texto de qualquer bloco e ajustar o timing manualmente.

Question 15

O que posso enviar, e existe um limite de tamanho?

Accepted Answer

O DeliverCC aceita os formatos de áudio padrão (MP3, WAV, FLAC, AAC, M4A, OGG) e vídeo (MP4, MOV, M4V, WebM, AVI, MKV). Os uploads são limitados a 500 MB e 15 minutos de duração. O DeliverCC extrai o áudio automaticamente dos uploads de vídeo. Para editores de videoclipe: exports de vídeo brutos podem ter vários gigabytes (acima do limite de 500 MB), então exportar um arquivo só de áudio do seu editor é o caminho mais rápido. Um MP3 de 5 minutos costuma ter menos de 10 MB.

Question 16

O que acontece com o meu áudio depois que eu gero as legendas?

Accepted Answer

Os arquivos de áudio são apagados automaticamente do armazenamento do DeliverCC cerca de 14 dias após o upload, uma janela que cobre a fase de revisão e ajuste do projeto.

Os arquivos de legenda gerados ficam na sua conta até você apagá-los. Nada do seu áudio nem da sua letra é usado para treinar qualquer modelo. A política de retenção completa está na política de privacidade.

Question 17

Como funciona o sistema de créditos?

Accepted Answer

Um crédito equivale a uma geração de legendas. Você recebe os quatro formatos de export com esse único crédito, gerados a partir dos mesmos dados de alinhamento.

Os planos mensais concedem créditos no início de cada ciclo de cobrança e são renovados todo mês: o Creator dá 5, o Studio 12, o Label 30. Os créditos Pay-as-you-go são comprados um a um e nunca expiram. Se acabarem no meio do mês, você pode comprar um crédito Pay-as-you-go ou subir de plano. Não há cobrança por excedente nem taxa por formato.

Formato	O que é	Onde usar
SRT	O formato de legenda universal. Texto simples, timecodes simples	YouTube, Vimeo, Facebook, Instagram, TikTok, a maioria dos editores de vídeo
VTT	Padrão de vídeo web. Formato WebVTT	Players de vídeo HTML5, embeds web
SCC	Scenarist Closed Captions. Padrão broadcast CEA-608	TV broadcast dos EUA (CBS, NBC, ABC, Fox)
TTML	Timed Text Markup Language. Dialeto de letras sincronizadas do Apple Music (por linha)	Letras sincronizadas das músicas no Apple Music. O arquivo que as gravadoras enviam pela distribuidora para ativar o destaque estilo karaokê no app do Apple Music

Como o DeliverCC funciona.

Técnica e formatos

Export para vídeo com letra

Workflow

Upload e formatos de arquivo

Confiança e questões práticas