
제품 사진 딱 1장으로 광고 영상 만드는 법 (촬영 0원)
스튜디오·모델·삼각대 없이 제품 사진 1장만으로 움직이는 광고 영상을 만드는 실제 파이프라인. 누끼→I2V 모션→BGM까지 단계별 정리하고, 어떤 AI 영상 모델이 제품 형태를 안 망가뜨리는지 명시했습니다.
기술 리포트 보기->
스마트스토어 상세페이지에 영상 하나 넣으려고 스튜디오 잡고, 모델 부르고, 조명 세팅하다 견적서 받고 포기한 적 있으신가요. 그런데 지금 셀러들이 쓰는 방식은 다릅니다. 제품 사진 딱 1장을 AI에 넣으면 제품이 회전하고, 빛이 흐르고, BGM이 깔린 6초짜리 광고 클립이 나옵니다. 촬영비 0원, 모델비 0원. 단, 아무 모델에나 넣으면 멀쩡하던 제품 라벨이 외계어로 바뀌고 뚜껑이 녹아내립니다. 이 글은 제품을 안 망가뜨리면서 사진 1장을 광고 영상으로 끝내는 실제 파이프라인을 단계별로 정리한 것입니다.
왜 "사진 1장"이 영상이 되는가 — I2V의 원리
핵심 기술은 I2V(Image-to-Video, 이미지→비디오)입니다. 텍스트로 영상을 처음부터 생성하는 T2V와 달리, I2V는 당신이 넣은 사진을 첫 프레임으로 고정하고 그 뒤 몇 초를 움직임으로 채웁니다. 즉 제품의 모양·색·로고는 당신 사진 그대로 유지되고, AI는 "그다음에 어떻게 움직일지"만 상상하는 거죠.
그래서 입력 사진의 품질이 결과의 80%를 결정합니다. 흐릿하거나 배경이 지저분한 사진을 넣으면 영상 내내 그 단점이 따라다닙니다. 좋은 소식은, 입력용 사진 한 장을 다듬는 것도 AI로 1분이면 된다는 점입니다.
전체 파이프라인 4단계 (입력 1장 → 완성 영상)
실제로 우리가 제품 광고를 뽑을 때 도는 순서는 이렇습니다. 각 단계는 길어야 1~3분입니다.
| 단계 | 하는 일 | 쓰는 도구 유형 | 소요 |
|---|---|---|---|
| 1. 누끼 + 보정 | 배경 제거, 깨끗한 배경 합성, 해상도 업 | 이미지 생성/편집 AI (nano-banana 류) | 1분 |
| 2. I2V 모션 | 다듬은 1장을 첫 프레임으로 6초 영상화 | I2V 영상 모델 (Kling 2.6) | 2~3분 |
| 3. 보이스/자막 | 나레이션·카피 음성, 자막 얹기 | TTS (ElevenLabs 류) | 1분 |
| 4. BGM + 합성 | 배경음악 깔고 컷 이어붙이기 | 음악 생성 (Suno 류) + 편집 | 2분 |
전부 합쳐 10분 안쪽. 익숙해지면 5분입니다.
1단계 — 누끼와 "입력용 한 장" 만들기
가지고 있는 제품 컷 중 정면이 잘 보이고 핀이 맞은 사진을 고릅니다. 그다음 이미지 편집 AI에게 시킵니다.
- 배경 제거(누끼) 후 단색 또는 깔끔한 그라데이션 배경으로 교체
- 그림자·반사 자연스럽게 추가 (제품이 공중에 떠 보이면 싸 보임)
- 로고·라벨 글자가 선명하게 보이도록 디테일 유지
- 가로 16:9 또는 세로 9:16으로 캔버스 정리 (어디에 올릴지 미리 결정)
여기서 가장 중요한 원칙: 이 사진은 "예쁜 사진"이 목적이 아니라 "AI가 움직이기 좋은 첫 프레임"이 목적입니다. 제품이 화면 가운데 충분히 크게, 잘릴 부분 없이 들어가 있어야 합니다. 제품이 프레임 끝에 걸려 있으면 모션 단계에서 형태가 깨질 확률이 높습니다.
2단계 — I2V 모션: 제품을 망가뜨리지 않는 모델 고르기
여기가 진짜 갈리는 지점입니다. 같은 사진을 넣어도 모델에 따라 결과가 천지차이입니다. 우리가 실제 제품 광고로 여러 모델을 돌려본 결론을 솔직하게 적습니다.
| 모델 | 제품 충실도 | 특징 | 제품 광고 추천 |
|---|---|---|---|
| Kling 2.6 (I2V) | ★★★★★ | 입력 프롬프트를 가장 충실히 따름, 제품 형태·라벨 보존 우수 | 가장 안정적 (1순위) |
| Seedance | ★★★★ | 모션 자연스럽고 빠름, 단순 회전·줌에 강함 | 보조용으로 양호 |
| Veo 계열 | ★★★ | 영상미는 좋으나 프롬프트를 무시하고 제품에 없던 기계 작동 장면을 지어냄 | 제품 광고엔 비추천 |
핵심 교훈: 영상미가 화려한 모델일수록 "창작 욕심"을 부려서 당신 제품을 멋대로 변형합니다. 멀쩡한 화장품 뚜껑이 열렸다 닫히거나, 라벨 글씨가 가짜 영어로 바뀌는 사고가 여기서 납니다. 제품 광고는 화려함보다 충실도입니다. 그래서 우리는 제품 I2V에 Kling 2.6을 1순위로 씁니다.
모션 프롬프트는 욕심내지 말고 단순하게. 이런 동사 1~2개면 충분합니다.
- "제품이 천천히 360도 회전한다" (정석)
- "카메라가 제품 쪽으로 천천히 줌인한다" (시선 집중)
- "부드러운 빛이 제품 표면을 왼쪽에서 오른쪽으로 훑는다" (고급스러움)
- "제품 뒤로 입자/물방울이 천천히 떠오른다" (음료·화장품)
긴 문장으로 온갖 묘사를 넣을수록 오히려 모션이 부자연스러워집니다. 짧고 명확한 동작 하나가 정답입니다.
3·4단계 — 보이스, BGM, 그리고 이어붙이기
영상 클립이 나왔으면 광고처럼 들리게 마감합니다.
- 나레이션/카피 보이스: TTS로 한 줄 카피를 깔면 단번에 "광고" 느낌. 한국어 자연스러운 음성이 잘 나옵니다. 자막을 같이 얹으면 무음으로 보는 SNS 환경에도 대응됩니다.
- BGM: 음악 생성 AI에 "고급스러운 미니멀 비트, 15초" 식으로 장르만 주면 저작권 걱정 없는 트랙이 나옵니다. 영상 전체에 BGM은 1개로 통일해야 깔끔합니다 (컷마다 음악 바뀌면 산만).
- 합성: 6초 클립이 짧으면 2~3개를 만들어 크로스페이드로 이어붙입니다. 회전 컷 → 줌인 컷 → 로고 컷 순서가 무난한 광고 문법입니다.
흔한 실수 체크리스트 (이것만 피해도 절반은 성공)
- 입력 사진이 저해상도 → 영상 전체가 뭉개짐. 먼저 업스케일.
- 제품이 프레임에 꽉 차거나 잘림 → 모션 시 형태 붕괴. 여백을 두자.
- 화려한 모델로 제품 I2V → 라벨·형태 변형 사고. 충실도 높은 모델로.
- 모션 프롬프트가 너무 김 → 어색한 움직임. 동작 1개만.
- BGM 여러 개·자막 없음 → 산만 + 무음 환경 무대응. BGM 1개 + 자막 필수.
- 한 번에 OK 기대 → 같은 설정으로 2~3회 돌려 가장 안 망가진 컷을 채택하는 게 정상 워크플로.
사진 1장을 광고 영상으로 바꾸는 이 과정 전체를 우리가 대신 돌려드리기도 합니다. 직접 해보다 막히면 편하게 물어보세요.












