쉬운세상

레시피 B — Pika API + CapCut 배치 파이프라인

22b-labs 2026. 4. 8. 09:30

여러 장의 이미지(패널)를 **빠르게 ‘움직이는 클립’**으로 만들고, 한국어 TTS/자막까지 한 번에 완성하는 실전 루트를 소개할게요.


1) Pika로 패널 → 영상 자동 생성 (API)

  • Pika는 이미지→모션(i2v)·텍스트→영상(t2v)을 API로 제공(주로 Fal.ai 경유). 큐에 작업을 던지고 완료되면 mp4를 받는 구조예요. (Fal.ai)
  • 예시(9:16, 30초, 여러 이미지 시퀀스):
    • 요청: POST /v1/...pika/v2.x/... 에 이미지 URL/파일, 프롬프트(“패널을 순차 장면으로 애니메이션”), duration, aspect 전송 → 결과 mp4 다운로드. (엔드포인트/스키마는 제공처 문서 참고) (Fal.ai)
  • 참고: 비공식·중개 API도 존재하므로 공식/파트너 문서를 우선 확인하세요. (Fal.ai)

샘플 입력 사양(현업용):

  • 패널 8장, 총 40초(각 4–6초 + 장면전환 2초)
  • 종횡비 9:16
  • 프롬프트: “animate panels as sequential scenes, smooth camera moves, gentle parallax”
  • 오디오: 아래 Gemini TTS mp3 붙이기
  • 캡션: 패널마다 1–2줄

⚠️ 상업 이용
Pika FAQ/약관을 보면 유료 플랜에서 상업 사용 허용이 명시되며(무료는 제한 가능), 최신 약관/요금제에 따라 달라질 수 있으니 배포 전 반드시 확인하세요. (Pika)


2) 한국어 TTS 붙이기 (Gemini TTS)

  • Google Gemini TTS는 다국어(한국어 포함) 단일/다중 화자, 스타일·속도·톤 제어를 지원합니다. REST로 mp3/wav 생성 → 편집기로 임포트. (Google AI for Developers)
  • Fal.ai 등에서도 Gemini TTS API 호출을 제공(간단한 예제와 프리셋 보이스). (Fal.ai)

3) CapCut(Web/데스크톱)으로 자막·스타일링·익스포트

  • 워크플로우: 새 프로젝트 → 영상 업로드 → Captions(자막) → Auto captions(자동 자막) → 언어(Korean) 선택 → 생성 → 폰트·프리셋 적용 → Export. (CapCut)
  • CapCut은 자동 자막 생성 후 Translate(번역)·스타일(프리셋/키워드 강조) 지원. 한국어 포함 다국어 워크플로우 가이드가 공식 리소스에 정리돼 있어요. (CapCut)
  • 자막 폰트: Nanum Gothic, Noto Sans KR 등 웹 안전·가독성 우수 폰트 추천. (다운로드·라이선스는 각 폰트 페이지 참고) (Google Fonts)

4) 한 번에 따라 하는 “레시피”

  1. Pika 호출
    • 패널 이미지 업로드(또는 URL)
    • 입력: {images:[p1..pN], prompt:'animate panels as sequential scenes', duration:40, aspect:'9:16'}
    • 결과 mp4 받기. (Fal.ai)
  2. Gemini TTS로 한국어 내레이션 생성(mp3). (Google AI for Developers)
  3. CapCut Web/데스크톱
    • New Project → 두 파일(mp4, mp3) 업로드
    • Captions → Auto captions → Korean → Generate
    • 폰트: Nanum Gothic / Noto Sans KR 선택 → 스타일 프리셋 적용
    • 트리밍/전환 조정 → Export(메타데이터/워터마크 확인). (CapCut)

5) 팁 & 체크리스트

  • 배치 생성: Pika는 큐/비동기 모델이라 여러 요청을 순차 처리하기 용이. 과금·레이트리밋은 제공처 문서 확인. (Fal.ai)
  • 상업 사용/저작권: 최신 Terms/FAQ를 프로젝트별로 재확인(특히 무료/유료 범위, 워터마크, 제3자 IP). (Pika)
  • 자막 가독성: 9:16 세로 화면은 2줄·20–28자 내 유지, 대비(배경박스/그림자) 확보. CapCut의 스타일 프리셋/키워드 강조 활용. (CapCut)