HumanLabAI
Lab 목록
VOICE CLONE2026-06-18PRODUCTION READY

광고 BGM·내레이션, 음악 외주 없이 AI로 1시간 만에 끝내기

SunoElevenLabsLyria 2Veo 3.1Kling 2.6
광고 BGM·내레이션, 음악 외주 없이 AI로 1시간 만에 끝내기

제품 영상은 다 만들었는데 BGM 하나 못 깔아서 며칠째 멈춰 있는 셀러가 의외로 많습니다. 음원 사이트에서 적당한 곡 하나 고르려다 결제하고 보니 "유튜브 광고 사용은 별도 라이선스"라는 깨알 약관에 막히고, 외주 작곡은 한 곡에 수십만 원에 일주일 대기. 그런데 지금은 BGM 30초, 한국어 내레이션 한 단락이면 커피 한 잔 마실 시간에 둘 다 끝납니다. 핵심은 "AI가 만들어준다"가 아니라 저작권 안 걸리게, 발음 안 어색하게, 영상이랑 박자 맞게 뽑는 법을 아는 겁니다. 그 세 가지를 실무 순서대로 정리했습니다.

광고 BGM·내레이션, 음악 외주 없이 AI로 1시간 만에 끝내기

BGM부터: "장르 매칭"이 90%다

AI 음악 생성에서 결과 품질을 가르는 건 긴 프롬프트가 아니라 장르·무드·악기·BPM을 정확한 단어로 박아넣는 것입니다. "좋은 음악 만들어줘"는 100전 100패고, 영상 톤에 맞는 장르를 먼저 정한 뒤 그걸 명시해야 합니다. 광고 유형별로 자주 먹히는 매칭입니다.

영상 톤추천 장르/무드프롬프트에 넣을 키워드
뷰티·패션 (감성)Lo-fi / Dream popwarm, soft synth, 80 BPM, dreamy
테크·가전 (세련)Future bass / Minimalclean, electronic, punchy, 110 BPM
식음료·생활 (밝음)Acoustic pop / Funkupbeat, acoustic guitar, claps, happy
건강·B2B (신뢰)Corporate / Ambientcalm, piano, inspiring, steady
숏폼·UGC (텐션)Trap / Hip-hopenergetic, 808 bass, fast hi-hat

실무 팁 세 가지: ① 가사 없는 인스트루멘탈로 뽑아라(내레이션이 들어갈 자리를 가사가 잡아먹습니다). ② 길이를 영상보다 5초 길게 뽑아서 편집 여유를 남겨라. ③ 한 번에 2~3개 변형을 받아 A/B로 들어보고 고르면 적중률이 확 올라갑니다.

한국어 내레이션: 발음 어색함은 '표기'로 잡는다

AI 보이스의 한국어는 많이 좋아졌지만, 아직도 숫자·영어·전문용어에서 자주 미끄러집니다. "어색하다"는 대부분 모델 탓이 아니라 텍스트를 글자 그대로 읽어버려서 생깁니다. 입력 텍스트를 '소리 나는 대로' 바꿔주는 것만으로 대부분 해결됩니다.

  • 숫자는 한글로 풀어쓰기: "30% 할인" → "삼십 퍼센트 할인", "1+1" → "원 플러스 원". 모델이 "30"을 "삼십"으로 읽을지 "서른"으로 읽을지 헷갈릴 여지를 없앱니다.
  • 영어 브랜드/단어는 한글 음차: "AI" → "에이아이", "USB" → "유에스비", "VITAMIN C" → "비타민 씨".
  • 띄어쓰기와 쉼표로 호흡 제어: 강조하고 싶은 단어 앞뒤에 쉼표를 넣으면 또박또박 끊어 읽습니다. "이 제품은, 단 하나의 차이로, 완성됩니다."
  • 마침표/물음표를 정확히: 억양은 문장부호로 만들어집니다. 평서문 끝을 올리고 싶지 않으면 마침표, 질문 톤은 물음표를 분명히.

그래도 한 단어가 계속 이상하면 그 부분만 따로 생성해서 붙이세요. 30초 내레이션 전체를 다시 뽑는 것보다 문제 문장 하나만 재생성하는 게 훨씬 빠릅니다.

보이스 톤 고르기: '읽는 사람'을 먼저 정한다

같은 대본도 누가 읽느냐에 따라 전혀 다른 광고가 됩니다. 보이스를 고르기 전에 "이 영상의 화자는 누구인가"를 정하면 선택이 빨라집니다.

  • 차분한 중저음 남성/여성 — B2B, 건강기능식품, 신뢰가 핵심인 카테고리. 빠르지 않게, 또박또박.
  • 밝고 빠른 톤 — 숏폼, 생활용품, 가성비 어필. 텐션이 곧 전환율인 영상.
  • 친근한 ASMR형 저속 톤 — 뷰티, 감성 제품. 속삭이듯, 말 사이 간격을 넓게.

대부분의 보이스 합성 툴은 속도(speed)·안정성(stability)·감정 강도 슬라이더를 제공합니다. 광고 내레이션은 안정성을 살짝 높여(흔들림 방지) 시작하고, 너무 기계적이면 조금씩 낮추며 톤을 잡는 게 안전합니다.

영상이랑 박자 맞추기: 싱크의 기본기

BGM과 내레이션을 따로 뽑았으면 이제 영상에 얹을 차례입니다. 외주 없이도 무료 편집툴(캡컷, 다빈치 리졸브 등)에서 다음 순서만 지키면 됩니다.

  1. 내레이션을 기준선으로 깔고, 영상 컷을 말의 호흡에 맞춰 자릅니다. 음악이 아니라 '말'이 영상 길이를 결정합니다.
  2. BGM 볼륨은 -18dB 안팎으로 깔고, 내레이션이 나오는 구간은 BGM을 추가로 살짝 더 줄입니다(더킹). 자동 더킹 기능이 있으면 켜세요.
  3. 오프닝/엔딩은 BGM만 풀로 들리게 비워두면 영상이 훨씬 완성도 있어 보입니다.
  4. BGM이 영상보다 길면 끝부분을 페이드 아웃 1~2초로 자연스럽게 마무리합니다.

저작권: AI로 만들어도 '안전 체크'는 필수

가장 자주 받는 질문이 "AI로 만든 음악·목소리 광고에 써도 되나요?"입니다. 핵심만 짚으면 이렇습니다.

  • 생성형 AI BGM은 도구에 따라 상업적 사용 허용 범위가 다릅니다. 무료/체험 플랜은 상업 사용 불가인 경우가 흔하니, 광고에 쓸 거면 반드시 유료 플랜의 상업 사용·소유권 약관을 확인하세요. "이 곡을 광고에 써도 되는가, 소유권은 누구인가" 두 줄만 약관에서 찾으면 됩니다.
  • 유튜브 Content ID 충돌 주의. 일부 AI 음원은 다른 사람도 똑같이 받을 수 있어, 누군가 먼저 등록하면 내 영상에 클레임이 걸릴 수 있습니다. 가능하면 곡을 변형(편집·믹스)하고, 생성 기록(날짜·플랜)을 캡처해 두세요.
  • 목소리 클로닝은 동의가 생명입니다. 실제 사람 목소리를 학습시킬 거면 본인 동의가 반드시 필요하고, 연예인·타인 목소리 무단 복제는 명백히 위험합니다. 기본 제공 보이스를 쓰는 게 가장 안전합니다.
  • 실제 발매곡과 비슷하게 나왔다면 쓰지 마세요. "왠지 어디서 들어본 멜로디"는 분쟁의 씨앗입니다.

요약하면, AI로 만들었다는 사실보다 어떤 플랜의 어떤 약관으로 만들었느냐가 안전을 결정합니다. 광고용이면 처음부터 유료 상업 라이선스로 시작하는 게 가장 싸게 먹힙니다.

BGM·내레이션 외주에 묶여 영상이 멈춰 있다면, 위 체크리스트로 직접 한 편 만들어보세요. 더 정교한 장르 매칭이나 브랜드 전용 보이스 톤 세팅이 필요하면 그때 가볍게 문의 주셔도 됩니다.

관련 가이드

HumanLabAI ResearchAuthorized Personnel Only