AI는 왜 영상 원본을 원하나: 크리에이터 IP의 산업적 재발견

23 Mar 2025


AI는 왜 영상 원본을 원하나: 크리에이터 IP의 산업적 재발견


AI 훈련용 데이터 시장이 급격히 성장하면서 영상 콘텐츠가 갖는 의미도 근본적으로 달라지고 있다. 지금까지 영상은 주로 시청자에게 보여주기 위한 결과물로 간주되어 왔지만, 인공지능이 발전하면서 그 영상이 담고 있는 비정형 정보 자체가 새로운 산업의 자원이 되고 있다. 움직임, 표정, 소리, 배경, 조도 같은 요소들이 AI에게는 현실을 이해하는 훈련 데이터로 작동하며, 그 과정에서 영상 원본의 가치가 재조명되고 있다.

AI 기업은 더 이상 공개된 콘텐츠를 무단으로 긁어오는 방식에만 의존할 수 없다. 기술이 고도화될수록 저작권 문제와 윤리적 기준이 강화되고 있으며, 특히 영상은 텍스트나 이미지보다 훨씬 복합적인 저작권 이해관계가 얽혀 있다. 이에 따라 이제 AI 훈련용 데이터는 정식 계약을 통해 구매하는 것이 표준이 되고 있고, 이 과정에서 크리에이터와 영상 제작사의 역할이 새롭게 떠오르고 있다.

미국에서는 문밸리, 트로베오 같은 스타트업이 크리에이터와 AI 기업을 연결하는 중개 플랫폼을 운영하며 수백만 시간 분량의 영상을 거래하고 있다. 이들이 집중하는 건 유튜브에 공개된 완성 영상이 아니라, 자막과 그래픽이 들어가기 전의 원본 촬영분이나 편집에서 제외된 B-roll 장면이다. 이른바 가공되지 않은 현실의 순간들이 AI에게는 더 효과적인 훈련 재료가 되기 때문이다. 예를 들어 문밸리는 독립 다큐멘터리 감독들로부터 다양한 기후와 환경에서 촬영된 고해상도 원본 영상을 확보해 기후 AI나 자율주행 AI를 개발하는 기업에 라이선싱한 것으로 알려졌다.

최근 블룸버그 보도에 따르면, 오픈AI, 구글, 문밸리 등은 크리에이터들로부터 사용되지 않은 원본 영상을 분당 1~4달러 수준에 구매하고 있으며, 4K 해상도나 드론 촬영본, 3D 애니메이션처럼 비정형적인 포맷은 더 높은 가치를 인정받는다. 트로베오의 CEO 마티 페시스는 지금까지 5백만 달러 이상을 크리에이터에게 지급했으며, 수백 명의 영상 창작자와 거래를 성사시켰다고 밝혔다. 미국 대형 에이전시 CAA는 “디지털 복제나 이미지 왜곡 방지 조항 등을 포함한 계약을 통해 크리에이터의 브랜드를 보호하는 것이 우선”이라고 강조하고 있다. 크리에이터들이 광고 외에 콘텐츠 자산을 통해 수익을 다변화할 수 있는 중요한 흐름이 본격화되고 있다는 점에서 주목된다.

크리에이터가 만든 영상의 가치도 달라지고 있다. 과거에는 영상의 조회 수나 구독자 수가 수익을 결정했지만, AI 기업은 이보다 훨씬 다른 기준을 적용한다. 얼마나 다양한 장면과 인물이 등장하는지, 어떤 카메라 구도와 조도가 활용됐는지, 배경에 어떤 소리가 들어있는지 같은 요소들이 평가 기준이 된다. 특정 지역의 일상, 다양한 날씨 속 풍경, 군중의 움직임처럼 인간이 눈여겨보지 않았던 장면들이 AI에게는 매우 높은 가치를 갖는다. 유튜브에서 생략되었던 영상 조각들이 지금은 새로운 수익원이 될 수 있다는 의미다.

이러한 변화는 콘텐츠 산업이 단순한 소비 중심 모델에서 산업 간 연결 구조로 재편되고 있음을 시사한다. 콘텐츠는 이제 시청자뿐 아니라 AI 기업이라는 새로운 수요자에게도 가치를 제공하게 되었고, 이로 인해 크리에이터가 소유한 영상 IP는 데이터 자산으로 기능하기 시작했다. 미국에서는 데이터 서플라이어라는 직군이 등장해 영상 데이터를 AI 학습 목적에 맞게 정제·관리하는 역할을 수행하고 있고, 일부 크리에이터들은 자신이 보유한 수천 시간 분량의 원본 영상을 분류해 패키지 형태로 판매하기도 한다.

국내에서도 전통적인 콘텐츠 제작사가 AI 데이터 생태계 구축에 참여하는 흐름이 나타나고 있다. MBC는 2024년 과학기술정보통신부와 한국지능정보사회진흥원이 주관한 ‘초거대AI 확산 생태계 조성 사업’에 참여해, 자사가 보유한 아카이브 자료를 기반으로 ‘대한민국 배경영상 상세 설명문 데이터’를 구축했다. 고화질 실사 배경 영상 300시간 이상을 수집하고, 장면별로 클립을 나누어 1만 개 이상의 AI 학습용 데이터셋을 만들었다. 각 클립에는 촬영 감독이 직접 작성한 상세 설명문이 덧붙여졌고, 이는 향후 멀티모달 AI 연구를 위한 정교한 텍스트-비디오 훈련 데이터로 활용될 예정이다. 콘텐츠가 단지 시청자에게 제공되는 영상을 넘어, AI 기술이 현실을 이해하는 기반 데이터로 전환되는 대표적 사례다.

하지만 이 시장에는 여전히 해결해야 할 과제들이 존재한다. 첫째는 저작권과 초상권 문제다. 영상에 등장하는 사람, 음악, 상표 등 제3자의 권리가 포함된 장면을 AI 훈련에 활용하려면 그에 대한 법적 정리가 필요하다. 둘째는 라이선싱 계약의 불투명성이다. 수익 배분 구조가 명확하지 않거나, 영상이 어떻게 쓰일지 충분히 설명되지 않는 경우, 크리에이터가 예상치 못한 위험에 노출될 수 있다. 셋째는 표준화된 계약 양식과 관리 시스템이 아직 부재하다는 점이다. 이로 인해 영상 제공자와 AI 기업 간의 협상이 개별적으로 이뤄지고 있으며, 그 결과로 가격과 조건의 편차가 크다.

이러한 상황에서 크리에이터와 제작사는 단순히 시장에 뛰어드는 것이 아니라, 자신이 보유한 영상의 상태를 점검하고, 계약 조건에 대한 이해를 갖춘 뒤 접근할 필요가 있다. 고해상도 원본 영상, 다양한 촬영 환경, 깨끗한 오디오가 갖춰진 자료는 AI 기업에 매력적인 자산이 될 수 있으며, 향후에는 이를 정기적으로 공급하는 방식의 수익 모델도 가능해질 것이다. 동시에 메타데이터 관리, 인물·음향 권리 정리, 계약서 검토 등의 준비가 병행되어야 콘텐츠가 안전하게 거래될 수 있다.

콘텐츠 산업은 지금 AI 기술과의 접점에서 새로운 형태의 비즈니스 모델을 실험하고 있다. 영상은 이제 더 이상 단순한 콘텐츠가 아니라, 기계가 세계를 학습하기 위한 핵심 자원이 되고 있다. 이 변화는 기술적 진보가 아니라 시선의 이동이다. 시청자만을 위한 영상이 아닌, AI가 배울 수 있는 세계의 단면으로 영상을 바라보는 것. 그것이 지금 크리에이터가 가질 수 있는 가장 실질적인 기회이며, 동시에 가장 큰 전환점이 될 수 있다.


관련 기사: https://www.bloomberg.com/news/articles/2025-01-10/youtubers-are-selling-their-unused-video-footage-to-ai-companies