자주 묻는 질문

DeliverCC 작동 방식.

자막 형식, 지원 언어, 워크플로, 요금 등. 찾는 질문이 없으면 이메일로 문의하세요: hello@delivercc.io.

기술 및 형식

DeliverCC는 어떤 자막 형식을 내보내고, 어떤 것을 써야 하나요?

DeliverCC는 한 번의 생성으로 네 가지 형식을 만듭니다. 각각이 무엇이고 어디에 쓰는지 정리했습니다:

형식무엇인지사용처
SRT범용 자막 형식. 일반 텍스트, 단순한 타임코드YouTube, Vimeo, Facebook, Instagram, TikTok, 대부분의 영상 편집 프로그램
VTT웹 영상 표준. WebVTT 형식HTML5 동영상 플레이어, 웹 임베드
SCCScenarist Closed Captions. CEA-608 방송 표준미국 방송 TV (CBS, NBC, ABC, Fox)
TTMLTimed Text Markup Language. Apple Music 싱크 가사 방언(줄 단위)Apple Music의 싱크 가사. 레이블이 배급사를 통해 보내 Apple Music 앱에서 가라오케 스타일 하이라이트를 켜는 파일
DeliverCC는 대사와 애드리브도 자막으로 넣나요, 아니면 노래 가사만 넣나요?

둘 다 됩니다. 자막으로 넣고 싶은 것을 모두 붙여넣으세요. 가사, 애드리브, 모든 대사를 넣으면 DeliverCC가 전부 정렬합니다. 방송용 자막 파일은 노래든 말이든 모든 단어를 담아야 하므로, 말하는 부분까지 자막으로 넣어야 납품이 완전하고 규정에 맞습니다.

이 도구는 여러분이 제공하는 텍스트를 정렬하므로, 자막으로 넣고 싶은 것은 붙여넣는 내용 안에 있어야 합니다. 가사 시트에 없는 애드리브는 직접 추가하지 않으면 나타나지 않습니다.

영상 자막과 Apple Music 싱크 가사는 어떻게 다른가요?

둘은 서로 다른 곳으로 갑니다. 영상 자막(SRT, VTT, SCC)은 영상과 함께 갑니다. 화면 위에 텍스트를 표시하고 들리는 모든 것에 맞춰 동기화되며, 영상이 재생되는 어디서나 작동합니다. SRT와 VTT는 YouTube, Vimeo, 소셜 미디어용, SCC는 미국 방송 TV용입니다. Apple Music 싱크 가사는 대신 노래와 함께 갑니다. 트랙이 재생되는 동안 Apple Music 앱에서 한 줄씩 흘러가며 하이라이트되는 가사입니다. 아래에 깔린 같은 타이밍 텍스트, 서로 다른 두 목적지, 그리고 둘은 서로 바꿔 쓸 수 없습니다. 하나는 영상 위에 단어를 그리고, 다른 하나는 스트리밍 앱의 가사 표시를 구동합니다.

TTML(Timed Text Markup Language)은 타이밍된 텍스트를 위한 W3C 표준입니다. DeliverCC는 TTML의 Apple Music 싱크 가사 방언을 생성합니다. 재생에 맞춰 가사가 하이라이트되도록 Apple Music이 사용하는 줄 단위 형식입니다. 레이블이나 배급사가 Transporter나 iTunes Connect를 통해 Apple에 제출해 발매작의 싱크 가사를 켜는 파일입니다. 일반적인 영상 자막용 TTML이 아니며 영상 자막도 아닙니다. 영상에는 SRT, VTT, SCC 출력을 쓰세요.

Spotify 가사에 DeliverCC를 쓸 수 있나요?

파일로는 안 됩니다. Spotify가 파일을 받지 않기 때문입니다. Spotify의 싱크 가사는 전적으로 Musixmatch가 관리합니다. 추가하는 유일한 방법은 Musixmatch에서 아티스트나 레이블 계정을 인증하고 Musixmatch 도구에서 가사를 싱크하는 것이며, 그러면 Musixmatch가 이를 Spotify에 전달합니다. 완성된 가사 파일을 Spotify에 넘길 수 있는 도구는 없습니다.

Apple Music은 다릅니다. 권리자나 배급사가 직접 제출하는 시간 동기화된 TTML 가사 파일을 받으며, 이것이 바로 DeliverCC가 만드는 파일입니다. 그래서 DeliverCC는 파일을 받는 목적지를 지원하고, 별도 도구에서 수동 작업이 필요한 쪽은 다루지 않습니다. Instagram, Amazon Music, Tidal도 Spotify와 같은 방식으로 Musixmatch를 거칩니다.

DeliverCC는 어떤 언어를 지원하나요?

주요 음악 시장 대부분을 아우르는 21개 정렬 언어:

영어, 스페인어, 포르투갈어, 한국어, 일본어, 프랑스어, 독일어, 이탈리아어, 아랍어, 덴마크어, 네덜란드어, 핀란드어, 힌디어, 인도네시아어, 노르웨이어, 폴란드어, 러시아어, 스웨덴어, 태국어, 터키어, 중국어.

각 언어는 해당 언어에 가장 적합한 정렬 모델을 사용합니다. 비라틴 문자 언어(한국어, 일본어, 아랍어, 힌디어, 태국어, 중국어)에서 알아둘 점: 가사를 로마자가 아니라 곡의 원래 문자로 붙여넣으세요. 힌디어 곡에서 "Tum ho meri zindagi"는 정렬되지 않습니다. "तुम हो मेरी ज़िन्दगी"는 정렬됩니다.

음성 인식 대신 강제 정렬을 쓰는 이유는?

음악 보컬은 음성 인식을 무너뜨립니다. 웅얼거리는 발음, 애드리브, 화음, 오토튠, 비언어적 소리, 이 모든 것이 받아쓰기 정확도를 떨어뜨려 결과가 실제로 부른 것과 맞지 않게 됩니다.

DeliverCC는 다른 방식을 씁니다. 여러분이 올바른 가사, 즉 아티스트가 승인한 버전을 제공하면, 시스템은 무엇을 불렀는지 추측하는 대신 그 가사를 오디오에 정렬합니다. 자막은 가사 시트에 적힌 그대로를 말하며, 가장 까다로운 보컬에서도 유지되는 단어 단위 타이밍 정확도를 갖습니다.

가사 영상 내보내기

가사 영상에 DeliverCC를 쓸 수 있나요?

네. 자막의 타이밍을 맞추는 것과 같은 정렬 엔진이 타이밍된 가사 텍스트를 Premiere Pro, DaVinci Resolve, After Effects, Final Cut Pro로도 내보내므로, 모든 단어에 일일이 키프레임을 찍는 작업을 건너뜁니다. 비주얼은 직접 디자인하고, 타이밍은 DeliverCC가 맡습니다.

가사 영상 내보내기는 어떤 편집 프로그램을 지원하나요?

Premiere Pro(단어 단위 SRT), DaVinci Resolve와 Final Cut Pro(공용 FCPXML), After Effects(.jsx 스크립트)입니다. LRC와 Enhanced LRC도 가사 및 가라오케 플레이어용으로 제공됩니다.

가사 영상 내보내기는 별도 제품이나 요금제인가요?

아니요. 모든 생성에서 자막과 편집 프로그램 내보내기를 모두 포함한 모든 형식을 무제한 다운로드로 받습니다. 가사 영상을 위한 별도 요금제는 없습니다.

가사 영상 내보내기는 Apple Music 싱크 가사와 같은 건가요?

아니요. Apple Music 싱크 가사는 Music 앱용 줄 단위 TTML 파일입니다. 가사 영상 내보내기는 편집 프로그램에 가져와 디자인하고 애니메이션을 적용하는 단어 단위 타이밍 텍스트입니다. DeliverCC는 같은 업로드에서 둘 다 만듭니다.

워크플로

가사는 제가 제공하나요, 아니면 DeliverCC가 받아쓰나요?

여러분이 제공합니다. DeliverCC는 받아쓰기가 아니라 가사 시트를 진실의 원천으로 삼아 설계되었습니다. 이는 대부분의 레이블이 이미 쓰는 워크플로와 일치합니다. 자막은 AI가 녹음에서 들었다고 생각하는 것이 아니라, 승인된 공식 가사에 맞춰 나갑니다. DeliverCC는 타이밍을 맡고, 단어가 무엇을 말할지는 여러분이 정합니다.

생성에는 얼마나 걸리나요?

일반적인 생성: 생성을 클릭하고 자막이 나타나기까지 30~60초입니다. 콜드 워커에서의 첫 요청은 더 오래 걸립니다(인프라가 켜지는 동안 약 90초). 웜 워커에서의 이후 요청은 일관되게 더 빠릅니다. 대부분의 사용자는 일반적인 사용에서 60초 미만을 경험합니다.

생성 후에 정렬을 수동으로 편집할 수 있나요?

네. 모든 생성은 파형 보기, 드래그 가능한 블록 경계, 블록별 텍스트 편집, 전체 실행 취소/다시 실행을 갖춘 타임라인 편집기로 들어옵니다. 대부분의 곡은 편집이 전혀 필요 없습니다. 편집이 필요할 때(보통 애드리브나 인트로 연주 부분)는 몇 초면 고칩니다. 편집 내용은 선택한 형식의 내보낸 자막 파일에 반영됩니다.

DeliverCC는 애드리브, 웅얼거리는 보컬, 프로듀서 태그를 어떻게 처리하나요?

강제 정렬은 이런 것들을 받아쓰기 도구보다 더 잘 처리합니다. 애드리브("yeah", "oh", "mmm"), 프로듀서 태그, 웅얼거리거나 화음을 넣은 보컬은 음성 인식에 의존하는 자막 도구를 모두 혼란시킵니다. DeliverCC는 여러분이 제공하는 가사에 정렬하므로:

  • 가사 시트에 애드리브가 포함되어 있으면 보컬과 함께 자동으로 타이밍됩니다.
  • 가사 시트에서 빠뜨리면("yeah"나 "mmm" 같은 추임새는 흔히 그렇습니다) 주변 단어는 그대로 올바르게 정렬됩니다. 애드리브만 자막에 들어가지 않습니다.

가사 시트에 없던 애드리브를 추가하거나 있던 것을 빼고 싶으면, 타임라인 편집기에서 어떤 블록의 텍스트든 편집하고 타이밍을 수동으로 조정할 수 있습니다.

업로드 및 파일 형식

무엇을 업로드할 수 있고, 용량 제한이 있나요?

DeliverCC는 표준 오디오 및 영상 형식을 받습니다:

  • 오디오: MP3, WAV, FLAC, AAC, M4A, OGG
  • 영상: MP4, MOV, M4V, WebM, AVI, MKV

업로드는 500 MB, 길이 15분으로 제한됩니다. DeliverCC가 영상 업로드에서 오디오를 자동으로 추출하므로 직접 변환할 필요가 없습니다.

뮤직비디오 편집자를 위한 팁: 원본 영상 내보내기 파일(MOV, ProRes 등)은 흔히 수 기가바이트로, 500 MB 업로드 제한을 훨씬 넘습니다. 가장 빠른 방법은 영상 편집 프로그램에서 오디오만 내보내 그 파일을 업로드하는 것입니다. 5분짜리 곡은 MP3로 보통 10 MB 미만이지만, 같은 곡을 원본 영상으로 하면 기가바이트가 될 수 있습니다. 생성은 두 경우 모두 같은 정렬을 실행하며, 긴 업로드 대기를 줄일 수 있습니다.

신뢰 및 실무 사항

자막을 생성한 후 제 오디오는 어떻게 되나요?

오디오 파일은 업로드 후 약 14일 뒤 DeliverCC 저장소에서 자동으로 삭제됩니다. 이는 프로젝트 검토와 수정 단계를 포함하는 기간입니다.

생성된 자막 파일은 직접 삭제하기 전까지 계정에 남습니다. 여러분의 오디오나 가사는 어떤 모델 학습에도 사용되지 않습니다. 전체 보관 정책은 개인정보 처리방침에 있습니다.

크레딧 시스템은 어떻게 작동하나요?

크레딧 하나는 자막 생성 한 번에 해당합니다. 그 하나의 크레딧으로 같은 정렬 데이터에서 생성된 네 가지 내보내기 형식을 모두 받습니다.

월간 요금제는 각 결제 주기 시작 시 크레딧을 지급하고 매월 초기화됩니다. Creator는 5개, Studio는 12개, Label은 30개입니다. Pay-as-you-go 크레딧은 개별 구매하며 만료되지 않습니다. 월 중간에 다 쓰면 Pay-as-you-go 크레딧을 구매하거나 상위 요금제로 업그레이드할 수 있습니다. 초과 요금이나 형식별 요금은 없습니다.

Have questions? Email hello@delivercc.io