AI 이미지의 새로운 활용법을 찾아서

*CIT에서 진행한 인터뷰를 옮겨 왔습니다.

Q. 안녕하세요, 간단한 본인 소개 부탁 드립니다.

안녕하세요, 박민아입니다. 시각디자인학과 UX Researcher 백그라운드를 가지고 생성형 AI 프로덕트 유저 리서치에서 시작하여, 현재AI 비주얼 디렉터로 다양한 작업을 하고 있습니다. 이번 컴패니언 데이를 기획하고 주최한 CIT에서 HCI/UX 분야 인재 양성 교육도 함께 진행하고 있어요.


Q. 굉장히 일찍부터 AI 이미지 작업과 강의를 해오신 것으로 알고 있어요.
요즘은 어떤 작업을 하고 계신가요?

2022년부터 미드저니(Midjourney)로 생성한 이미지가 총 86,000장이 넘어요. 미드저니에 계신 현업자분께서 “와 제 월급 주시는 분…”이라고 감사와 감탄을 하셨는데요. 그만큼 많은 AI 이미지 비주얼 실험을 해왔습니다. 초반에는 주로 VFX, XR/AR, 3D, 게임, 그래픽, 영상, 패션, 미디어 아트, 오브제 디자인 등 다양한 크리에이티브 유관 직군 현업자 대상 오프라인 워크숍을 운영해왔어요. 조직 내 반복 작업과 고민을 듣고 직군별 목표와 의도에 맞게 예제를 제작, 필요한 기능부터 감각적으로 익혀 창작에 접목해보는 실험적인 워크샵을 이어왔습니다. 형태가 기능을 따른다면, 기능은 목적(purpose)을 따라야 한다는 생각으로요.

현재는 영화/광고 업계에 AI 활용이 많이 늘었지만, 한때 AI를 썼다는 사실 자체만으로도 사회적 논란이 컸던 시기가 있었죠. 외부에 공개는 어렵지만 그 무렵 AI 덕분에 처음으로 엔딩 크레딧에 이름을 올리며 본격적으로 작업을 시작했던 때가 기억에 남습니다.

이미지의 경우, 스튜디오 컷보단 여러 인물이 제품을 사용하는 장면을 중심으로 한 AI 라이프스타일 컷 광고를 주로 제작해왔습니다. 기획 단계에서 정한 타겟 소구 포인트에 맞춰 상황, 인물, 무드, 소품 등을 세밀하게 연출합니다. 영상은 주로 연극/영화/공연 각본에 기반해 이미지와 영소스를 제작하는 방식으로 참여합니다. 컨셉 디벨롭먼트를 통해 캐릭터나 크리처의 외관을 디자인하고, 조명과 소품으로 구현이 어려운 무대의 시각 효과를 이미지와 영상을 통해 생성하며, 실사 촬영에 AI FX를 입히기도 합니다.

해온 작업들 대부분이 100% AI 결과물이 중심이 되는 창작보다는, 사람과 서사를 보조하는 AI 비주얼에 초점을 맞추고 있습니다. 요즘의 영상은 ‘무빙 이미지'로서 감각적인 이미지 연출이 선행되는 것이 중요하다 생각되어, 이런 강점을 살려 영상 작업도 늘려갈 계획에 있습니다.

추가로, 제가 프롬프트를 작성하고 생성형 AI 도구를 유기적으로 활용해 작업하는 프로세스를 바탕으로, 일관된 톤 앤 무드로의 이미지 콘텐츠를 효율적으로 제작할 수 있는 자체 솔루션도 개발 고도화 중에 있습니다. 방향성을 인정받아 최근 서울 AI 허브 멤버십 기업으로 선정되어, 앞으로 기술력과 퀄리티를 더욱 높여갈 예정입니다.


Q. 그동안 다양한 AI 도구를 활용하는 과정에서
주로 어떤 변화를 느끼셨나요?

2022년 4월, Open AI에서 개발한 이미지 생성형 AI 달리(DALL·E 2)를 웹사이트로 운영하고, 같은 해 7월 미드저니(Midjourney) 오픈 베타가 출시되는 등 학계에서 연구 레벨에 있던 생성형 AI 기술이 서비스 레벨에서 많은 사용자들에게 유의미하게 ‘쓰여지기 시작했던’ 때부터 지금까지 해마다 굵직한 변화와 발전을 느껴요. 프로덕트가 출시되고, 기능이 업데이트되고, 그에 맞는 창작자/현업자들의 활용법을 목격하게 되고, 때로는 그것이 하나의 유스 케이스로 견고하게 자리 잡죠.

‘혁신적인 경험'은 곧 그 경험을 하고 나면 이전으로 돌아가지 못하는 것을 의미한다 생각하는데요, UX 관점에서 이미지 생성형 AI 프로덕트(서비스)에 의해 사람들의 경험이 크게 변화했던 때를 이야기할 수 있을 것 같아요. 사람들은 Midjourney 덕분에 프롬프트라는 이전과는 완전히 다른 방식으로 이미지를 제작하는 경험을 하게 되었고, Stable Diffusion 기반 ComfyUI를 통해 이미지 제작 워크플로우를 직접 조립해 보는 경험을 하게 되었죠. 이때까지는 AI 이미지 생성이 약간은 얼리어답터의 영역에 있었다면, 이미지 제작을 업으로 하는 사람들에게 가장 핵심적인 도구인 Adobe에서 FireFly를 출시하고 Generative Fill 기능을 추가함에 따라, 말 많고 탈도 많던 AI가 기존의 창작 과정 안에 더욱 자연스럽게 녹아들었죠.

비슷한 시기 Krea, Flux, Ideogram 등 각각 차별점을 가진 이미지 생성 모델이 등장하기도 하고, 다량의 학습 데이터를 무기로 가진 Google의 Image FX를 통해 실사와 구분하기 어려운 수준의 AI 이미지를 마주하는 경험을 하죠. Google의 Imagen3 모델을 바탕으로 Whisk와 같이 피사체, 장면, 스타일만 넣으면 비전문가도 쉽게 결과물을 만들 수 있는 경험을 제공하는 프로덕트도 늘어났어요.

이후 한동안 이미지 생성 경험에서 주목할 만한 와우 포인트가 크게 없다가, 올해 3월 말, Open AI에서 ChatGPT와 대화를 통해 이미지 생성할 수 있는 기능을 대폭 업데이트 했고, 대화 턴테이킹을 통해 내 의도에 더욱 가까운 이미지를 창작하고 피드백을 줄 수 있는 경험을 하셨을 거에요. 프로덕트 관점에서의 개인적으로 느낀 이미지 생성 경험의 변곡점을 이렇게 짚어볼 수 있을 것 같습니다.


Q. AI 기술이 하루가 다르게 변하면서,
많은 분들이 불안감이나 조급함을 느끼시기도 해요.
이런 변화 속에서 어떤 마음가짐으로 변화의 흐름에 올라탈 수 있으셨나요?

사실 일찍이 기술을 활용했던 것에 비해, 크게 앞서서 변화의 흐름을 이끌어 온 것은 아니에요, 유명하지도 않고요. 가끔씩 소셜 미디어를 보다보면 휘몰아치는 새로운 소식과 유행에 종종 불안감이 고개를 드는 것은 저도 마찬가지입니다. AI 이미지와 영상을 보는 것 만으로도 지겨워서 매너리즘이 올 때도 많아요. 저작권 이슈, 환경 오염 등 어떤 면에서는 분명히 좋지 않게 기여하고 있어 모르는 척 외면할 수 없는 양면적인 부분도 많죠.

그럼에도 이러한 AI 키워드와 흐름 안에서 계속해 변화의 흐름에 올라타서 따라가고 있는 이유라고 한다면 (올라탔다기보다 옆에서 겨우 속도 맞춰 뛰어가는 것 같긴 한데요...?) AI가 화두가 되기 이전부터, 기술 그 자체보다도 기술이 사람과 어떻게 관계 맺고, 그 사람을 더 이롭게 해줄 수 있는지에 관심을 가졌기 때문이라고 생각이 드네요.

모두가 꼭 얼리 어답(adopt)터가 되어야 할 필요는 없다고 생각합니다. 다만 변화의 흐름 안에서 ‘나만 할 수 있는 것이 무엇일까?’를 고민하고 질문하며 새로운 시각을 가지고, 생각을 확장하고, 기술을 활용해 보면서 본질과 의미를 발견하고 나누는 것이 제가 해왔던 일들인 것 같습니다. 나아가 여러 사람들과 숲을 함께 보다 보면 변화의 커다란 방향을 약간은 짐작할 수 있게 되죠. 또, 그렇게 되면 불안감보다 기대감이 더 커지니까요.


Q. AI 시대, '새로운 일'을 꿈꾸는 분들께 하고 싶은 말씀이 있다면?

제가 워크샵에서 자주 드는 비유가 있어요. 바로 호모 에렉투스가 불을 ‘발견’했을 때, 요리나 난방,조명 등 오늘날 우리가 누리는 수많은 활용법 중 어느 것도 예측하지 못했을 거라는 이야기입니다. 기술도 마찬가지예요. 생성형 AI는 이전의 도구와 달리 쓰는 사람에 따라 그 가능성이 달라지는 도구입니다. 엄청난 잠재력을 가진 도구이기에 직접 실험하고 시도 해보는 과정을 거쳐야 비로소 이것을 제대로 다룰 수 있게 됩니다.

그래서 저는 ‘새로운 일'을 찾는 것보다, 자신이 원래 가지고 있던 ‘감각을 새롭게 발견’해보시길 권합니다. 여기서말하는 감각은 시각적인 센스만이 아니라 관찰력, 해석력, 상상력, 실행력, 표현력, 친화력 등 기술로쉽게 ‘딸깍' 대체할 수 없는 신체에 각인된 인간 고유의 역량을 말합니다.

우리 각자가 지금 가진 모든 기술과 도구를 하나씩 지워 나가면, 결국 무엇이 남을까요? 아무것도 없는 원시의 상태, 아주 먼 과거 혹은 미래에 던져져도 나에게 남아 있는 그것은 무엇일까요? 저는 그것이 ‘시각적인 것을 탐구하고 실험하고 전하는' 것 이 남더라고요. 그것이 저만의 방식이자 출발점이었습니다.

그래서 이 시대에는 오히려 모든 것이 ‘생성되기 전’의 자극과 레퍼런스를 더 많이 접하고, 감각을 스스로 갈고 닦는 것이 중요하다고 생각해요. 그 위에 AI는 우리의 능력을 증강시키는 좋은 도구가 되어줄 거라고 믿고요.

그 이후에, 새로운 일을 하며 AI 이미지 제작을 시작하게 되신다면, 제가 작업하며 정리한 ’이미지 생성형 AI 도구를 활용할 때 필요한 에티튜드 10가지’(단어 수집, 구체적인 디렉팅, 뉘앙스와 배경 지식, 유스케이스 실험, 자체 레퍼런스 제작, 프롬프트 구조화, 기획 감각과 이미지를 보는 안목, 다양성과 윤리 의식, 효율적인 시스템 구축, 인공지능과의 협업과 위임)를 가끔씩 떠올려 봐주셔도 좋겠습니다.

저의 경험이 작은 인사이트가 되어, 각자의 방식으로 새로운 가능성을 펼쳐나가시길 응원합니다. 감사합니다!