인터뷰
Ernest Piatrovich, ARTA의 Product Manager – 인터뷰 시리즈

Ernest Piatrovich는 AIBY Group의 Product Manager로서, 회사에서 최고의 AI 기반 앱 중 하나인 ARTA – 아이폰과 안드로이드용 AI 이미지 생성기를 이끌고 있습니다. 그의 전략적 비전과 창의적인 사고는 앱이 출시 직후 US 앱 스토어 상위 차트에서 2위를 달성하고, 전 세계에서 1,500만 다운로드를 돌파하며, 고유한 내부 파이프라인을 기반으로 최고의 성능을 발휘하는 AI 아바타를 제공하는 등 여러 성공을 거두었습니다.
ARTA – AI 아트 생성기를 아이디어 단계부터 지금까지 관리해 왔습니다. 초기에 대한 몇 가지 통찰력을 공유할 수 있나요?
물론입니다! 그 시절은 역동적이었습니다. 우리는 단지 일주일 만에 훌륭하게 만들어진 애플리케이션을 출시하여, 모바일에서 텍스트-이미지 생성 기능을 제공하는 최초의 소비자 앱 제작자 중 하나가 되었습니다. 우리의 목표는 사람들이 “주머니 속의 아티스트”를 갖도록 하는 대중 시장 제품을 구축하는 것이었습니다. 따라서 개념화 및 초기 개발 단계부터, 우리는 사용성과 확장성에 초점을 맞추었습니다. 그러나 시장에 적절한 시기에 진입했음에도 불구하고, 우리의 설치 볼륨을 충분한 수준으로 성장시키는 것은 우리의 훌륭한 미디어 구매 팀에도 불구하고 khá 어려웠습니다. 아바타 기능이 인기 있는지 3개월 후에 큰 부스트가 발생했습니다. 볼륨은 우리의 니치에서 중간 정도로 빠르게 증가했으며, 그 때부터 우리의 과제는 그것을 유지하고 증가시키는 것이었습니다.
당시 출시한 원래 기술 스택은 무엇이며, 이 기간 동안 아트 생성과 관련된 몇 가지 도전은 무엇입니까?
우리는 Stability.ai의 공식 API를 사용하여 Stable Diffusion 1.3을 기반으로 출시했습니다. 당시의 생성 품질과 지금의 생성 품질은 밤과 낮의 차이입니다. 우리가 처음 시작했을 때, 우리의 QA 관리자들은 이미지의 미적 가치 또는 특정 개념 및 기능의 표현에 대한 불일치와 관련된 문제를 빈번하게 보고했습니다. 그러나 그것은 당시 Stable Diffusion의 표준이었습니다. 지금은 생성 출력이 모든 측면에서 훨씬 더 좋아졌습니다. 스타일적 재현, 구성 일관성, 시각적 충실도, 세부 수준 등이 포함됩니다.
앱 출시 직후, 우리는 Amazon에서 서버를 임대하여 지원했는데, 이것이相当한 도전이 되었습니다. 충분한 자금이 있음에도 불구하고, 필요한 때에 사용 가능한 A100이 없을 수 있으며, 몇 일 동안 기다려야 할 수 있습니다. 따라서, 우리는 자동 스케일링 없이, 모든 초과 트래픽을 우리의 파트너 API로 리디렉션해야 했습니다.
이 모든 것을 유지하는 것은 여전히相当한 도전입니다. 매월마다 한쪽 끝이나 다른 쪽에서 작은 문제가 발생합니다. 예를 들어, 우리는 생성 품질에 일시적인 문제를 가끔遇遇할 때, 제공자가 서버를 업데이트하거나 가중치를 테스트하거나 생성 출력에 영향을 미치는 다른 변경을 구현할 때입니다. 이러한 오류는 1시간에서 반나절까지 지속될 수 있으며, 예측이나 추적이 어렵습니다. 일반적으로 우리의 지원 부서가 사용자 보고를 받을 때, API 제공자는 이미 문제를 해결했습니다. 그러나 이것은 우리의 사용자에게는 심각한 문제입니다. 따라서, 우리는 현재 여러 제공업체와 우리의 서버를 결합하여 특별한 생성을 허용하는 시스템을 구축하고 있습니다.
제품 관리자로서, ARTA를 출시 직후 최고 순위에 올려놓는 데 결정적인 전략적 결정은 무엇입니까?
ARTA의 초기 상승은 소셜 미디어에서 처음으로 인기 있는 아바타 기능을 구현한 결정의 결과였습니다. 우리는 이 기능의 성장하는 관심을 빠르게 인식했습니다. 우리의 전체 팀, 제품, 마케팅, 개발은 모두 같은 길을 걷고 있었고, 그 성공에 대한 비전을 가지고 있었습니다. 우리는 또한 시장에 진입하는 시간이 중요하다는 것을 인정했습니다. 따라서, 우리는 첫날부터 이 기능을 실현하기 위해 모든 자원을 اختصاص하였고, 다른 작업보다 우선순위를 두었습니다.
우리의 마감 기한은 AI 아바타가 인기 정점에 도달하기 전에 출시하는 것이었기 때문에, 우리는 第三方 솔루션을 사용하여 앱을 맞춤 설정하기로 결정했습니다. 아바타가 모바일에서 인기를 끌기 시작했을 때, 기술은 이미 웹에서 일부 시간 동안 उपलब있었으며, API도 있었습니다. 팀의 집중된 노력 덕분에, 우리의 첫 번째 작동 버전은 단 5일 만에 앱 스토어에 출시되어, 매우 경쟁력 있는 아바타 출력을 제공했습니다. 이것은 우리가 미국 상위 차트에서 2위를 달성하고, 1주일 동안 미국에서 두 번째로 많이 다운로드되는 앱으로 유지하는 데 도움이 되었습니다.
최근 ARTA의 AI 아바타 생성 기능을 업그레이드했습니다. 이에 대한 몇 가지 세부 사항을 공유할 수 있나요?
AI 모델은 훈련 중에 일반적인 얼굴 특징을 추가하여 아바타가 원본 사진과 다르게 보이게 만들 수 있습니다. 따라서, 우리는 우리 자신의 아바타 서비스를 만들기로 결정했습니다. 우리는 오랫동안 第三方 API를 사용했지만,重大한 개선은 없었습니다. 서버를 전환하여, 우리는 사용자의 실제 얼굴과 아바타 출력의 유사성을 더 잘 유지할 수 있는 더 최적의 훈련 기술을 설정할 수 있었습니다.虽然私は詳細を 공개할 수 없습니다, 그러나 이것은 SDXL 설정, LORAs, 얼굴 강화기와 같은 특정 조합으로 가능했습니다. 우리는 아직 다른 곳에서 더 나은 결과를 보지 못했습니다.
새로운 서버로, 우리는 각 아바타 팩에 대한 고정 비용에서 월간 서버 비용으로 전환하여, 별도의 인앱 구매가 아닌 주간 구독을 통해 아바타를 제공할 수 있습니다. 이것은 사용자가 주간에 다섯 개의 아바타 팩을 생성하거나 진행 중에 입력 사진을 변경하는 경우 더 만족스러운 경험을 제공하며, 훨씬 더 저렴합니다. 위에 언급한 모든 것을 고려하면, 우리의 아바타 제공은 현재 시장에서 최고의 가격-성능 비율을 보유하고 있습니다. 현실적인 아바타를 생성할 수 있는 앱이 있지만, ARTA는 정확한 얼굴 인식과 함께 다양한 밝고 색彩적인 출력 변형을 제공하는 점에서 두드러집니다.
팀은 앱의 기능을 어떻게 다른 방식으로 개선했나요?
우리는 일반적인 사용 사례인 텍스트-이미지 생성, 이미지 변환, inpainting과 같은 경우에 第三方 API를 사용하는 것이 더 효율적이라고 결론지었습니다. 이러한 접근 방식은 이러한 기능을 우리의 서버 인프라에 통합하는 방법을弄清楚하는 데 시간을 보내지 않도록 해줍니다. 또한, 새로운 기능이 기대대로 성과를 내지 못하여 제거해야 하는 상황에서 비용을 줄여줍니다. AI 이미지 생성 산업은 빠르게 발전하고 있으며, 우리의 목표와 일치하는 다양한 전용 서비스가 उपलब있으므로, 우리는 이러한 서비스를 탐색하고渐渐적으로 채택하고 있습니다.
동시에, ARTA의 요구는 종종 고유한 발견을 필요로 합니다. 第三方 API가 존재하지 않거나 또는 만족스러운 출력 품질을 제공하지 않는 경우, 우리는 내부 서비스를 전문화하고, 우리의 목표를 달성하기 위해自主적인 솔루션을 개발합니다. 예를 들어, AI 아바타를 업그레이드하는 것 외에도, 우리의 ML 및 프롬프트 엔지니어는 앱의 AI 필터(셀피) 기능을 위한 새로운 파이프라인을 개발했습니다. 우리는 또한 우리의 即将 출시되는 AI 베이비 기능을 위한 고유한 알고리즘을 개발했습니다. 두 사람의 사진을 결합하여 그들의 아이가 어떻게 보일지 볼 수 있는 생성 기능입니다. 제품 관리자로서의私の世界의 인식에 따르면,私は最初에その成功을 의심했습니다. 그러나 마케팅 인사이트를 확인하는 것은 콘텐츠 관련 사례에서 특히 유용합니다.
사용자는 ARTA의 예술적 과정에 영향을 줄 수 있나요? 그렇다면, 사용자는 AI 생성 예술 작품을 사용자 지정하기 위해 어떤 도구와 옵션이 उपलब있나요?
우리는 생성과 관련된 복잡한 측면을 모두 처리하여, 사용자에게 기술적인 과부하 없이 간단한 예술적 경험을 제공하려고 합니다. 따라서, 사용자가 출력에 영향을 미치는 주요 방법은 프롬프트를 통해입니다. 우리는 모델에 전송될 정확한 단어 요청을 표시하고, 필요한 경우만 프롬프트를 구성하는 데 도움을 제공합니다.
우리는 각 통합 모델에 대한 최상의 기본 설정을 선택하여, 사용자가 결과를 최대화하기 위해 그것들을 조정할 필요가 없도록 합니다. 일반적으로, 최적의 생성 출력을 생성하므로, 그것들을 조정할 필요는 없습니다. 그러나, 사용자가 실험하고 싶다면, 고급 모드는 단 하나의 탭 거리에 있으며, 일부 더 깊은 매개변수는 설정 섹션에 있습니다.
곧, 우리는 시드 매개변수를 추가하여, 사용자가 동일한 이미지를 재생성해야 하는 경우, 완전한 제어를 허용할 계획입니다. 또한, 우리는 종횡비 목록을 확장할 계획입니다. 우리는 또한 일반 생성에 컨트롤넷을 추가하는 것을 고려하고 있습니다. 그것들은 이미 서버 측에서 지원되며, 우리는 AI 필터와 스케치를 생성하는 데 사용하지만, 아직 사용자에게 제공되지 않았습니다.
전통적인 예술 시장에 ARTA와 같은 AI의 영향을 어떻게 인식하나요? AI 아트 생성을 예술 산업의 혼란 또는 강화로 보나요?
私は강화로 보는 편입니다. 생성 가능한 AI는 예술적 과정에 새로운 기회를 제공하며, 상당히 시간을 단축시킵니다. 디지털 아티스트, 디자이너, 일러스트레이터 및 기타 시각적 콘텐츠 생성자를 위한 다양한 작업을 지원합니다. 궁극적으로, 이러한 발전을 활용하는 우리의 능력은 우리의 상상력만으로 제한됩니다.
예를 들어,私はPC 게임을 만드는 취미가 있습니다. 최근에私はARTA를 사용하여 기술과 아이템에 대한 아이콘 세트를 생성했습니다.私はAdobe Illustrator를 사용하여自ら 설계할 수 있지만, 이미지 생성기를 사용하여 거의 즉시 필요한 것을 얻을 수 있었습니다.私の妻는 리터처-사진가입니다. Photoshop의 생성 가능한 필을 통해 그녀는 훨씬 더 빠르게 작업할 수 있으며, 더 많은 자유 시간이나 더 많은 리터칭 주문(그녀가 결정할 경우)을 가질 수 있습니다.
잘 만들어진 AI 생성 이미지들은 전문가의 작품과 구별할 수 없을 정도로 보일 수 있습니다. 그러나私の意見에 따르면, AI는真正한 전문가를 대체할 수 없습니다. 어떻게든 훈련된 신경망이라도, 그것들이 생성하는 모든 것은 이미 인간에 의해 만들어진 데이터에 기반합니다. 따라서,真正한 혁신적인 아이디어는 오직 사람들에 의해 생산될 수 있습니다. 전통적인 의미의 예술은 여전히 인간이 만든 작품과 관련이 있지만, AI 아트는 모든 사람에게, 예술적 배경에 관계없이, 새로운 경험을 초대하는 예상되는 스핀오프입니다.
이미지 품질을 개선하는 것 외에, AI 이미지 생성의 미래는 어디로 향할까요?
이미지 품질과 함께, 생성의 속도도 증가할 것입니다. 자동으로 더 비용 효율적인 출력으로 이어집니다.
私は곧, 동일한 캐릭터를 다른 환경과 위치에서 생성하는 쉬운 방법이 있을 것으로 생각합니다. 따라서, 우리는 코믹스, 어린이 책, 게임 그래픽스 등에서 AI의 상승을 볼 것입니다. 인테리어 디자인과 광고 크리에이티브 생산은 이미 생성 가능한 AI를 적극적으로 활용하고 있는 분야입니다. 그러나 기술이 계속 발전함에 따라, 앞으로 더 많은 것이 있습니다.
강력한 GPU가 생성에 필요한 만큼, 이러한 기술은 오랜 시간 동안 AI와 함께 발전할 것입니다. 우리는 아직 여정의 시작에 불과합니다. 아마도 새로운 Apple의 시대는 Nvidia가 될 것입니다. IT 산업에 있는 모든 사람, 또는 적어도, 새로운 비디오 카드 출시를 기다리는 모든 사람이, 이전에 iPhone을 기다렸던 것처럼, 기다릴 것입니다.
AI 이미지 생성기는, 새로운 개념이나 기술의 발전으로, 계속해서 재미 있고 흥미로운 경험을 제공할 것입니다. 예를 들어, AI 베이비 생성에 대한 관심이 현재 증가하고 있습니다. 최근의 기술은 Stable Diffusion을 기반으로 하여, 두 사람의 특징을 결합하여 그들의 생물학적 자녀의 잠재적인 외모를 보여주는 인상적인 출력을 보여주었습니다. 결과는 몇 년 전 호로스코프 사이트에서 उपलब했던 것보다 훨씬 더 뛰어납니다. 사람들은 다시 시도해 볼 의향이 있습니다.
생성 가능한 AI에서 무엇을 기대할 수 있나요?
비디오 생성의 인기 波는 지평선에 있습니다. 기술이 충분한 수준에 도달했을 때, 반드시 사람들의 얼굴 표정과 제스처를 사용하여 비디오 아바타를 생성하는 신경망을 훈련하는 시도가 있을 것입니다. 가능하다면, 고유한 사용자 목소리와 함께입니다.
AI 오디오는 음악 산업을 위한 새로운 시대를 열어주는 또 하나의重大한 발전입니다. 이 기술은 텍스트 입력만으로 노래를 작곡하는驚異的な 기회를 제공하며, 다양한 유형의 비디오 콘텐츠에 대한 맞춤형 비스탁 사운드트랙을 생성하는 데 탁월한 도구입니다. 전반적으로, 이러한 기술이 매우 재미있게 들립니다. 예를 들어, Terms of Use를 랩이나 낭만적인 음调으로 부르는 것입니다.
감사합니다. 더 많은 정보를 배우거나 이미지 생성을 원하는 독자는 ARTA를 방문하시기 바랍니다.












