stub Danny Postma, założyciel HeadshotPro – seria wywiadów – Unite.AI
Kontakt z nami

Wywiady

Danny Postma, założyciel HeadshotPro – seria wywiadów

mm
Zaktualizowano on

Danny Postma jest niezależnym hakerem i jest znany jako seryjny przedsiębiorca, jest także założycielem HeadshotPro. HeadshotPro generuje zdjęcia głowy AI, które mają na celu uchwycenie najbardziej fotogenicznych cech użytkownika i odtworzenie ich na wybranym przez użytkownika tle, z doskonałym oświetleniem twarzy, którego ustawienie dla prawdziwego fotografa zajęłoby wiele godzin nawet w najbardziej idealnych warunkach.

Jesteś znany jako seryjny przedsiębiorca. Jaka była Twoja pierwsza firma, którą założyłeś?

Landingfolio było moim pierwszym większym projektem. Zacząłem w 2015 roku, mając 21 lat. Pracowałem wówczas jako niezależny specjalista ds. optymalizacji konwersji i zmagałem się z tworzeniem skutecznych projektów stron docelowych dla moich klientów. Jako projekt poboczny mający na celu rozwiązanie tego problemu stworzyłem Landingfolio, galerię projektów prezentującą najfajniejsze projekty stron docelowych w Internecie.

Nie wiedziałem wtedy, jak programować, więc zbudowałem go za pomocą WordPressa. To było o wiele łatwiejsze, niż się spodziewałem. Strona istnieje do dziś i odwiedza ją tysiące osób, jednak ciężko na niej zarobić, dlatego zdecydowałam się zająć innymi projektami.

Kiedy po raz pierwszy zetknąłeś się ze światem sztucznej inteligencji?

Po raz pierwszy zetknąłem się ze światem AI trochę przez przypadek. Podczas pracy nad moim produktem Headlime, który początkowo nie był narzędziem opartym na sztucznej inteligencji, znajomy zapoznał mnie z GPT-3. Zaintrygowały mnie możliwości GPT-3, więc zdecydowałem się skontaktować bezpośrednio z Gregiem Brockmanem, dyrektorem technicznym OpenAI, i poprosić o dostęp. Na szczęście udało mi się uzyskać dostęp w ramach pierwszej grupy użytkowników.

Jaki był Twój pierwszy biznes związany ze sztuczną inteligencją?

To wprowadzenie do GPT-3 zapoczątkowało moją podróż do AI. Było to w pewnym sensie nieoczekiwane przejście z produktu niezawierającego sztucznej inteligencji na produkt oparty na sztucznej inteligencji. 

Pracując nad Landingfolio, napisałem interaktywną książkę zawierającą 200 nagłówków, w której można było łatwo wprowadzić pewne zmienne, aby dostosować nagłówki do własnego przypadku użycia. Zdałem sobie sprawę, że byłoby to naprawdę dobre narzędzie programowe, więc przekształciłem je w naprawdę prosty program do kopiowania, który dokonał wymiany za Ciebie i nazwałem go Headlime. 

Mniej więcej w tym samym czasie wypuszczono GPT-3 i jak wspomniałem powyżej, dostęp uzyskałem bardzo wcześnie. Eksperymentowałem z pozwoleniem GPT-3 na pisanie szablonów dla Headlime — byłem zdumiony jego zdolnością do generowania kopii. Doprowadziło to do kluczowego momentu, w którym zdałem sobie sprawę z potencjału przekształcenia Headlime w narzędzie do copywritingu oparte na sztucznej inteligencji. 

Miałem trochę szczęścia, że ​​pracowałem już nad narzędziem do copywritingu, kiedy pojawiła się sztuczna inteligencja do copywritingu, taka jak GPT-3. Byłem jedną z pierwszych osób, które wdrożyły GPT-3 w środowisku produkcyjnym Kopiuj.AI i kilka innych narzędzi.

Czy mógłbyś podzielić się historią powstania HeadshotPro?

Kiedy we wrześniu 2022 r. uruchomiono stabilną sztuczną inteligencję dyfuzyjną, otworzyło się to przede mną nowe możliwości. Początkowo myślałem o stworzeniu witryny ze zdjęciami stockowymi i opracowałem coś o nazwie Stock AI. Jednak jakość nie spełniała oczekiwań, w związku z czym duże firmy, takie jak Getty Images, znane z rozległych zasobów prawnych zapewniających ochronę praw do wizerunku, obawiały się potencjalnych problemów prawnych.

Ta obawa skłoniła mnie do zmiany kierunku działania. Zobaczyłem, że Dreambooth uruchamia usługę sztucznej inteligencji, która może przekształcać twarze, i zdałem sobie sprawę, że pracuję nad czymś całkiem podobnym. Szybko opracowałem i wprowadziłem na rynek swój produkt w ciągu 30 godzin, pokonując konkurencję na rynku. ProfilPicture.AI, eksplodowała na Twitterze, generując znaczną sprzedaż w ciągu zaledwie tygodnia. Był to produkt, który można było łatwo udostępniać i miałem szczęście, że zająłem dobre miejsce w wynikach wyszukiwania zdjęć profilowych w Google.

Jednak gdy początkowe emocje opadły, a sprzedaż zaczęła spadać, wiedziałem, że muszę ponownie się zmienić. Wtedy zacząłem współpracę z Davidem, przyjacielem programistą. Oboje pracowaliśmy nad projektami związanymi ze sztuczną inteligencją, a ja opracowałem model w języku Python, który umożliwiał manipulowanie zdjęciami w różnych pozach. Ten rozwój skłonił mnie do skupienia się na tworzeniu zdjęć w głowę przy użyciu sztucznej inteligencji.

Uruchomiłem jednocześnie Deep Agency i HeadshotPro. Choć Deep Agency przyciągnęła duże zainteresowanie prasy, nie przełożyło się to na sprzedaż. Z drugiej strony HeadshotPro od razu stał się hitem. Widząc zapotrzebowanie na strzały w głowę generowane przez sztuczną inteligencję, zdecydowałem się bardziej skupić na HeadshotPro. Był to nieoczekiwany zwrot, ale pokazuje, jak ważne jest zachowanie elastyczności i reagowanie na to, co mówi rynek.

Jakie są różne algorytmy uczenia maszynowego i generatywnej sztucznej inteligencji używane w backendzie?

HeadshotPro może na pierwszy rzut oka wyglądać prosto, ale w zapleczu działa ogromny potok, który pozwala tworzyć świetne zdjęcia w głowę. Większość naszych konkurentów używa wyłącznie Stable Diffusion, modelu generowania obrazu o otwartym kodzie źródłowym, w połączeniu z Wymarzona budka, który trenuje na własnych zdjęciach. 

Nie tak to robimy.

Wdrażamy dziesiątki dodatkowych modeli programistycznych typu open source i niestandardowych, aby zapewnić 10-krotnie wyższą jakość wyjściową. Już cały rok pracujemy nad własnymi, niestandardowymi modelami. Jesteśmy coraz bliżej konsekwentnego generowania zdjęć AI, które będą nie do odróżnienia od prawdziwych zdjęć.

Innym modelem open source, którego używamy, jest LLaVa, duży asystent językowy i wzrokowy, za pomocą którego możesz wyświetlać pytania dotyczące obrazów. Używamy tego na przykład do filtrowania błędnych plików przesłanych przez użytkowników lub usuwania generacji headshotów, które są NSFW. Innym modelem, z którego korzystamy, jest Twórca kodu, co pomaga usuwać artefakty AI z twarzy i przekształcać je w bardziej realistyczne.

Zacząłeś HeadshotPro jako jednoosobowy przedsiębiorca. Jakie są niektóre wyzwania związane z przejściem do budowania zespołu?

Przejście od jednoosobowej działalności do zbudowania zespołu dla HeadshotPro było znaczącym wyzwaniem i podróżą w kierunku rozwoju osobistego i zawodowego. Jednym z głównych wyzwań, przed którymi stanąłem, był strach przed zatrudnieniem. Początkowo wahałem się, czy powiększyć zespół ze względu na niepewność związaną z zarządzaniem ludźmi. Ten strach doprowadził mnie do samodzielnej automatyzacji tak bardzo, jak tylko mogłem, szczególnie w czasach przed sztuczną inteligencją.

Jednak w miarę rozwoju HeadshotPro zdałem sobie sprawę, że nie jestem już w stanie sam zarządzać wszystkim. Do wyboru była sprzedaż firmy, kontynuowanie działalności solo lub zbudowanie zespołu. Ostatecznie zdecydowałem, że budowanie zespołu będzie właściwym rozwiązaniem, jeśli chcę skalować biznes, bez względu na to, jak przerażające było to.

Decyzja ta oznaczała znaczącą zmianę mojej tożsamości jako osoby prowadzącej jednoosobową działalność gospodarczą i zmusiła mnie do przyznania, że ​​nie znam odpowiedzi na wszystkie pytania. Zrozumiałem, że budowanie zespołu będzie wymagało innego sposobu myślenia i zmieni cele, jakie postawiłem przed swoją firmą. Nie chodziło już tylko o prowadzenie biznesu; chodziło o poprowadzenie zespołu ludzi, aby wspólnie coś zbudowali.

Ta zmiana wywołała mieszaninę podekscytowania i strachu. Już od pierwszej rozmowy byłem otwarty na temat mojego braku doświadczenia ze wszystkimi potencjalnymi członkami zespołu, stawiając oczekiwanie, że jest to dla mnie nowe terytorium i na drodze mogą pojawić się wyboje. Zacząłem od wykonawców i osób pracujących na pół etatu, którzy mieli już innych klientów, tworząc siatkę bezpieczeństwa, jednocześnie ucząc się podstaw zarządzania zespołem.

Patrząc wstecz, powinienem był założyć zespół znacznie wcześniej. Mam teraz mały zespół niesamowicie inteligentnych i oddanych ludzi, którzy robią rzeczy, których sam nigdy bym nie zrobił. Dzielenie się swoimi zwycięstwami jest również znacznie mniej samotne i dużo przyjemniejsze. 

Generatory strzałów w głowę AI stają się coraz bardziej popularne. Jak wyróżnić HeadshotPro w zatłoczonej przestrzeni?

Jakość zdjęć to nasz główny wyróżnik na tle innych generatorów strzałów w głowę AI. Nasi konkurenci polegają na modelach open source, które, szczerze mówiąc, po prostu nie są wystarczająco dobre, aby uzyskać realistyczne generacje zdjęć. Wierzymy, że codziennie ulepszając zdjęcia głowy o wyższej jakości, w ciągu roku nasze zdjęcia będą nie do odróżnienia od prawdziwych zdjęć, co jeszcze bardziej zwiększy przepaść między nami a innymi, mniej poważnymi generatorami strzałów w głowę AI.

Wreszcie skupiamy się wyłącznie na profesjonalnych zdjęciach głowy. Większość naszych konkurentów porusza się poziomo, oferując takie rzeczy, jak zdjęcia randkowe i urocze awatary, starając się stać pełnoprawnym studiem fotograficznym. Chociaż wyraźnie istnieje na to rynek, nasz zespół osobiście postrzega te odskoki od profesjonalnych strzałów w głowę jako odwrócenie uwagi. Naszym jedynym celem jest tworzenie najwyższej jakości profesjonalnych zdjęć głowy AI. Nie sądzę, że nasi konkurenci podzielają ten pojedynczy cel.

W jaki sposób Twój zespół może ulepszyć lub zoptymalizować korzystanie z HeadshotPro?

Może to zabrzmi banalnie, ale naprawdę mamy obsesję na punkcie jakości naszych wyników. Naszym celem końcowym jest generowanie zdjęć głowy AI, których nie da się odróżnić od prawdziwych zdjęć. Jeśli model będzie poprawiał się o 1% każdego dnia, nie ma powodu, dla którego nie moglibyśmy osiągnąć tego celu lub naprawdę się do niego zbliżyć do końca tego roku.

Oprócz iteracyjnej poprawy jakości, pracujemy nad ulepszeniem generowania odzieży. Uważamy, że usługi „wirtualnej przymierzania” zaczną wzbudzać większe zainteresowanie w 2024 r. i mamy nadzieję wykorzystać tę technologię do zapewniania lepszych wyników naszym klientom korporacyjnym, którzy często wymagają takich rzeczy, jak dopasowanie garniturów do zdjęć głowy swoich pracowników.

Oczywiście doświadczenie użytkownika jest zawsze coraz lepsze. W tej chwili potrzebujemy 15–17 zdjęć przesłanych przez użytkowników, ponieważ to dla nas magiczna liczba w maksymalizacji jakości. Pracujemy nad alternatywnymi metodami, aby ułatwić życie naszym klientom, nie pogarszając przy tym jakości zdjęć, nad którą tak ciężko pracujemy.

Jakie są inne produkty AI, nad którymi pracujesz lub rozważasz wprowadzenie na rynek?

Zbudowałem mnóstwo małych produktów AI:

  • AI tatuaży: Generator tatuaży zasilany sztuczną inteligencją.
  • Alice: Zabawny eksperyment sztucznej inteligencji w mediach społecznościowych, pokazujący, jak sztuczna inteligencja może wygenerować zupełnie nowe koncepcje i pomysły, których wcześniej nie widziano.(https://www.thismodeldoesnotexist.co/)
  • Zdjęcie profilowe AI: Generator zdjęć profilowych, podobny do (znacznie) mniej profesjonalnej wersji HeadshotPro.
  • Głęboka Agencja: Wynajmij wirtualne modele wygenerowane przez sztuczną inteligencję.
  • Morf mema: Zamień się w swoje ulubione memy.

Jest tam mnóstwo fajnych gier, ale tak naprawdę jestem w trakcie sprzedaży większości z nich, żeby w pełni skupić się na HeadshotPro. Projekty te nie wzbudziły mojego większego zainteresowania, odkąd HeadshotPro wystartowało.

Dziękuję za wspaniały wywiad. Czytelnicy chcący dowiedzieć się więcej powinni odwiedzić nas HeadshotPro.

Partner-założyciel unite.AI i członek Rada Technologiczna Forbesa, Antoine jest futurysta który jest pasjonatem przyszłości sztucznej inteligencji i robotyki.

Jest także Założycielem Securities.io, witryna internetowa skupiająca się na inwestowaniu w przełomowe technologie.