stub Danny Postma, Fundatur ta' HeadshotPro - Serje ta' Intervisti - Unite.AI
Kuntatt magħna

intervisti

Danny Postma, Fundatur ta' HeadshotPro – Serje ta' Intervisti

mm
Aġġornata on

Danny Postma huwa hacker indie u huwa magħruf li huwa intraprenditur serjali, huwa wkoll il-Fundatur ta 'HeadshotPro. HeadshotPro jiġġenera headshots AI li huma ddisinjati biex jaqbdu lill-utenti l-aktar kwalitajiet fotoġeniċi u jirriproduċuhom fuq sfond tal-utenti li jagħżlu, b'dawl perfett tal-wiċċ li jieħu sigħat biex fotografu reali jitwaqqaf anke taħt l-iktar kundizzjonijiet perfetti.

Int magħruf li tkun intraprenditur tas-serje, x'kien l-ewwel negozju li bdejt?

Landingfolio kien l-ewwel proġett ewlieni tiegħi. Bdejt fl-2015 meta kelli 21. F'dak iż-żmien kont qed naħdem bħala Speċjalista fl-Ottimizzazzjoni tal-Konverżjoni freelance u kont qed niġġieled biex noħloq disinji ta' landing page effettivi għall-klijenti tiegħi. Ħloqt Landingfolio, gallerija tad-disinn li turi l-aktar disinji ta’ landing page fuq l-internet, bħala proġett sekondarju biex nindirizza dan.

Ma kontx naf kif nipprogramma dak iż-żmien, għalhekk bnejtha billi tuża WordPress. Dan kien ħafna aktar faċli milli stennejt. Il-websajt għadha teżisti sal-lum u tikseb eluf ta 'viżitaturi, iżda huwa diffiċli li monetize, għalhekk iddeċidejt li ngħaddi għal proġetti oħra.

Meta dħalt għall-ewwel darba fid-dinja tal-IA?

L-ewwel sirt mgħaddas fid-dinja tal-IA kemmxejn b'kumbinazzjoni. Waqt li kienet qed taħdem fuq il-prodott tiegħi Headlime, li inizjalment kien għodda mhux AI, ħabib introduċietni għal GPT-3. Kont intrigat bil-kapaċitajiet ta' GPT-3, għalhekk iddeċidejt li nilħaq direttament ma' Greg Brockman, is-CTO ta' OpenAI, biex nitlob aċċess. Fortunatament, stajt nikseb aċċess bħala parti mill-ewwel lott ta 'utenti.

X'kien l-ewwel negozju tiegħek AI?

Din l-introduzzjoni għal GPT-3 mmarkat il-bidu tal-vjaġġ tiegħi fl-AI. Kienet tip ta 'tranżizzjoni serendipitous minn prodott mhux AI għal wieħed ibbażat fuq AI. 

Waqt li kont qed naħdem fuq Landingfolio, ktibt ktieb interattiv ta’ 200 aħbarijiet, fejn tista’ faċilment ddaħħal ċerti varjabbli biex it-titli jkunu personalizzati biex jaqblu mal-każ tal-użu tiegħek. Irrealizzajt li din fil-fatt tkun għodda ta 'softwer tassew tajba, għalhekk biddelha fi spinner tal-kopja tassew sempliċi li għamel is-sostituzzjoni għalik u sejħilha Headlime. 

Madwar l-istess ħin, ġie mniedi GPT-3 u kif imsemmi hawn fuq, sibt aċċess verament kmieni. I esperimentajt bil-kiri GPT-3 jikteb il-mudelli għal Headlime—I kien mistagħġeb bil-kapaċità tiegħu li jiġġenera kopja. Dan wassal għal mument kruċjali fejn indunajt il-potenzjal li nbiddel Headlime f’għodda ta’ kitba li taħdem bl-AI. 

Kienet daqsxejn xxurtjata li kont diġà qed naħdem fuq għodda ta 'kitba meta AI ta' kitba bħal GPT-3 daħal fl-istampa. Jien kont wieħed mill-ewwel nies li implimenta GPT-3 f'ambjent ta 'produzzjoni, flimkien Kopja.AI u ftit għodod oħra.

Tista 'taqsam l-istorja tal-ġenesi wara HeadshotPro?

Meta tnediet AI ta 'diffużjoni stabbli f'Settembru 2022, fetħet possibbiltajiet ġodda għalija. Inizjalment, ħsibt dwar il-ħolqien ta 'websajt tar-ritratti tal-istokk u żviluppajt xi ħaġa msejħa Stock AI. Madankollu, il-kwalità ma kinitx qed tilħaq l-aspettattivi, u kien hemm tħassib dwar kwistjonijiet legali potenzjali minn kumpaniji kbar bħal Getty Images, magħrufa għar-riżorsi legali estensivi tagħhom biex jipproteġu d-drittijiet tal-immaġni tagħhom.

Dan it-tħassib wassalni biex nipern. Rajt Dreambooth kien qed iniedi servizz AI li jista’ jittrasforma l-uċuħ, u rrealizzajt li kont qed naħdem fuq xi ħaġa pjuttost simili. Malajr żviluppajt u nediet il-prodott tiegħi fi żmien 30 siegħa, u għelbet lil kompetitur fis-suq. ProfilePicture.AI, sploda fuq Twitter, li ġġenera bejgħ sinifikanti f’ġimgħa biss. Kien prodott li jista 'jinqasam ħafna, u kelli x-xorti li nikklassifika tajjeb fit-tfittxijiet tal-Google għal stampi tal-profil.

Madankollu, hekk kif l-eċċitament inizjali naqas u l-bejgħ beda jonqos, kont naf li kelli nerġa’ nipern. Dakinhar bdejt nikkollabora ma’ David, ħabib żviluppatur. It-tnejn konna naħdmu fuq proġetti relatati mal-AI, u żviluppajt mudell Python li jista’ jimmanipula ritratti f’pożi differenti. Dan l-iżvilupp wassalni biex niffoka fuq il-ħolqien ta 'headshots bl-użu tal-AI.

Nediet Deep Agency u HeadshotPro fl-istess ħin. Filwaqt li Deep Agency ġabret ħafna attenzjoni mill-istampa, ma ssarrafx f'bejgħ. Min-naħa l-oħra, HeadshotPro kien hit immedjat. Meta nara d-domanda għal headshots iġġenerati mill-AI, iddeċidejt li niffoka aktar fuq HeadshotPro. Kien pern mhux mistenni, iżda juri l-importanza li tibqa’ flessibbli u tirreaġixxi għal dak li qed jgħidlek is-suq.

X'inhuma xi wħud mill-algoritmi differenti ta' tagħlim tal-magni u AI Ġenerattiva li jintużaw fil-backend?

HeadshotPro jista 'jidher sempliċi mal-ewwel daqqa t'għajn, iżda għandna pipeline massiv għaddej fil-backend biex joħroġ headshots kbar. Ħafna mill-kompetituri tagħna jużaw biss Stable Diffusion, mudell ta 'ġenerazzjoni ta' immaġni open-source, flimkien ma ' dreambooth, li titħarreġ fuq ir-ritratti tiegħek. 

Hekk mhux kif nagħmlu l-affarijiet.

Aħna niskjeraw għexieren ta 'sors miftuħin addizzjonali u mudelli ta' żvilupp personalizzati għal 10x il-kwalità tal-output. Ilna naħdmu għal sena sħiħa issa fuq il-mudelli tad-dwana tagħna stess. Qed nersqu tassew viċin li niġġeneraw b'mod konsistenti ritratti AI li ma jistgħux jintgħarfu minn ritratti reali.

Mudell ieħor open-source li nużaw huwa LLaVa, Assistent Kbir tal-Lingwa u l-Viżjoni li tista’ tħeġġeġ biex tistaqsi mistoqsijiet dwar l-immaġini. Aħna nużaw dan, pereżempju, biex niffiltraw uploads ħżiena tal-utenti jew ineħħu ġenerazzjonijiet headshot li huma NSFW. Mudell ieħor li nużaw huwa Codeformer, li jgħin biex jitneħħew l-artifatti AI mill-uċuħ u jibdilhom f'oħrajn aktar realistiċi.

Bdejt HeadshotPro bħala solopreneur, x'inhuma xi wħud mill-isfidi fit-tranżizzjoni għall-bini ta 'tim?

It-tranżizzjoni milli tkun solopreneur għall-bini ta 'tim għal HeadshotPro kienet sfida sinifikanti u vjaġġ ta' tkabbir personali u professjonali. Waħda mill-isfidi primarji li ffaċċjajt kienet il-biża’ li nimpjega. Inizjalment, kont lura milli nkabbar it-tim minħabba l-inċertezzi involuti fil-ġestjoni tan-nies. Din il-biża’ wasslitni biex nawtomatizza kemm stajt waħdi, speċjalment fiż-żminijiet ta’ qabel l-AI.

Madankollu, hekk kif HeadshotPro kiber, indunajt li ma stajtx niġġestixxi kollox waħdi. L-għażliet kienu jew li tbigħ in-negozju, tkompli bħala solopreneur, jew tibni tim. Fl-aħħar iddeċidejt li l-bini ta’ tim kien il-ħaġa tajba li nagħmel jekk ridt nkabbar in-negozju, irrispettivament minn kemm kien tal-biża’.

Din id-deċiżjoni mmarkat bidla sinifikanti mill-identità tiegħi bħala solopreneur u ġiegħlitni nirrikonoxxi li ma kellix it-tweġibiet kollha. Fhimt li l-bini ta’ tim kien jeħtieġ mentalità differenti u kien se jibdel l-għanijiet li kelli għan-negozju tiegħi. Ma kienx biss dwar it-tmexxija ta 'negozju aktar; kien dwar it-tmexxija ta’ tim ta’ nies biex flimkien nibnu xi ħaġa.

Din il-bidla ġabet taħlita ta’ eċċitament u biża’. Kont miftuħ dwar in-nuqqas ta 'esperjenza tiegħi mal-membri potenzjali kollha tat-tim mill-ewwel intervista, u stabbilixxiet l-aspettattiva li dan kien territorju ġdid għalija u jista' jkun hemm ħotob tul it-triq. Bdejt b'kuntratturi u nies part-time li diġà kellhom klijenti oħra, ħoloq xibka ta' sigurtà waqt li tgħallimt il-ħbula tal-ġestjoni tat-tim.

Meta nħares lura, kelli bdejt tim ħafna aktar kmieni. Issa għandi tim żgħir ta’ nies intelliġenti u dedikati inkredibbli u jagħmlu affarijiet li qatt ma stajt nagħmel jien stess. Huwa wkoll ferm inqas solitarju u ħafna aktar pjaċevoli li taqsam ir-rebħiet tiegħek flimkien. 

Ġeneraturi headshot AI qed isiru aktar popolari, kif tiddifferenzja HeadshotPro fi spazju iffullar?

Il-kwalità tar-ritratti hija d-differenzjatur primarju tagħna minn ġeneraturi oħra ta 'headshot AI. Il-kompetituri tagħna jiddependu fuq mudelli open-source—li, biex inkunu sinċieri, sempliċement mhumiex tajbin biżżejjed għal ġenerazzjonijiet ta’ ritratti realistiċi. Billi nagħmlu iterazzjonijiet ta 'kuljum lejn headshots ta' kwalità ogħla, nemmnu li fi żmien sena l-headshots tagħna ma jkunux jistgħu jintgħarfu minn ritratti reali, u jkompli jżid id-distakk bejnietna u ġeneraturi oħra inqas serji ta 'headshots AI.

Fl-aħħarnett, aħna niffukaw esklussivament fuq headshots professjonali. Il-biċċa l-kbira tal-kompetituri tagħna qed jiċċaqilqu orizzontalment, joffru affarijiet bħal ritratti ta' dating u avatars ħelu, qed jaħdmu biex isiru photostudio sħiħ. Filwaqt li jidher ċar li hemm suq għal dan, it-tim tagħna personalment jara dawn id-dawriet lil hinn minn headshots professjonali bħala distrazzjoni. L-uniku fokus tagħna huwa li noħolqu l-ogħla kwalità, headshots AI professjonali. Ma nħossx li l-kompetituri tagħna jaqsmu din il-fokus uniku.

X'inhuma xi modi kif it-tim tiegħek qed itejjeb jew jottimizza l-esperjenza HeadshotPro?

Jista 'ħoss cliché, iżda aħna verament ossessjonati bil-kwalità tar-riżultati tagħna. Il-ġenerazzjoni ta' headshots AI li ma jistgħux jiġu distinti minn ritratti reali huwa l-għan aħħari tagħna. Jekk il-mudell jitjieb b'1% kuljum, m'hemm l-ebda raġuni għaliex ma nistgħux nilħqu dak l-għan, jew nersqu tassew qrib tiegħu, sa tmiem din is-sena.

Minbarra titjib iterattiv fil-kwalità, qed naħdmu fuq it-titjib tal-ġenerazzjoni tal-ħwejjeġ. Aħna nħossu li s-servizzi ta' “prova virtwali” se jibdew iqajmu aktar interess fl-2024, u nittamaw li nsiru dik it-teknoloġija biex iwasslu riżultati aħjar għall-klijenti korporattivi tagħna li spiss jitolbu affarijiet bħal ilbiesi li jaqblu għall-headshots tal-impjegat tagħhom.

Imbagħad, ovvjament, l-esperjenza tal-utent tagħna dejjem qed titjieb. Dritt issa neħtieġu 15-17-il ritratti tal-input tal-utent, għax dak kien in-numru magic għalina biex timmassimizza l-kwalità. Qed naħdmu fuq metodi alternattivi biex nagħmlu l-affarijiet ftit aktar faċli għall-klijenti tagħna, mingħajr ma nikkomprometti l-kwalità tar-ritratti li naħdmu ħafna biex inżommu.

X'inhuma xi prodotti oħra tal-AI li qed taħdem fuqhom jew qed tikkunsidra li tniedi?

Bnejt ton ta' prodotti żgħar AI:

  • Tatwaġġi AI: Ġeneratur tat-tatwaġġ li jaħdem bl-AI.
  • Alice: Esperiment divertenti tal-midja soċjali tal-AI, li juri kif l-AI tista' tiġġenera kunċett u ideat kompletament ġodda li ma dehrux qabel.(https://www.thismodeldoesnotexist.co/)
  • Stampa tal-Profil AI: Ġeneratur ta 'stampa tal-profil, bħal verżjoni (ħafna) inqas professjonali ta' HeadshotPro.
  • Aġenzija profonda: Kiri mudelli virtwali ġenerati mill-AI.
  • Meme Morph: Dawwar lilek innifsek fil-memes favoriti tiegħek.

Hemm ħafna ta 'gost hemm, imma jien fil-fatt fil-proċess li nbiegħ ħafna minn dawn il-prodotti biex niffoka bis-sħiħ fuq HeadshotPro. Dawn il-proġetti ma ħadux ħafna attenzjoni minni peress li HeadshotPro telaq.

Grazzi għall-intervista mill-aqwa, il-qarrejja li jixtiequ jitgħallmu aktar għandhom iżuru HeadshotPro.

Sieħeb fundatur ta' unit.AI & membru tal- Kunsill tat-Teknoloġija Forbes, Antoine huwa a futurist li huwa passjonat dwar il-futur tal-AI u r-robotika.

Huwa wkoll il-Fundatur ta Titoli.io, websajt li tiffoka fuq l-investiment fit-teknoloġija li tfixkel.