Haastattelut
Anand Kannappan, Patronus AI:n toimitusjohtaja ja perustaja – Haastattelusarja

Anand Kannappan on Patronus AI:n perustaja ja toimitusjohtaja, joka on teollisuuden ensimmäinen automaattinen tekoälyarviointi- ja turvallisuusjärjestelmä, jonka avulla yritykset voivat havaita suurten kielen mallien (LLM) virheitä laajassa mittakaavassa. Aikaisemmin Anand johti Meta Reality Labsin tekoälyselitys- ja edistyneiden kokeiden pyrkimyksiä.
Mikä alun perin veti sinut tietokoneiden pariin?
Lapsena olin aina kiinnostunut tekniikasta ja siitä, miten sitä voitiin käyttää ratkaisemaan todellisia ongelmia. Ajatus siitä, että voisin luoda jotain alusta asti vain tietokoneen ja koodin avulla, kiehtoi minua. Kun tutustin tietokoneisiin syvemmin, tajusin, kuinka valtavasti potentiaalia ne tarjoavat innovaatioille ja muutoksille eri aloilla. Tämä halu innovoida ja tehdä eroa oli se, mikä alun perin veti minut tietokoneiden pariin.
Voitko kertoa Patronus AI:n syntytarinan?
Patronus AI:n syntytarina on varsin mielenkiintoinen. Kun OpenAI julkaisi ChatGPT:n, se muodostui nopeimmin kasvavaksi kuluttajatuotteeksi, keräten yli 100 miljoonaa käyttäjää vain kahdessa kuukaudessa. Tämä massiivinen omaksuminen korosti generatiivisen tekoälyn potentiaalia, mutta se myös toi esiin yritysten epäröinnin käyttää tekoälyä nopeasti. Monet yritykset olivat huolissaan tekoälyn mahdollisista virheistä ja ennalta arvaamattomasta käyttäytymisestä.
Rebecca ja minä olemme tunteneet toisiamme vuosia, ollessamme opiskelleet tietokoneiden kanssa Chicagon yliopistossa. Metassa me molemmat kohtasimme haasteita tekoälytulosten arvioinnissa ja tulkinnassa – Rebecca tutkimuksen näkökulmasta ja minä soveltamisen näkökulmasta. Kun ChatGPT ilmoitettiin, me molemmat näimme LLM:n muuntavan potentiaalia, mutta ymmärsimme myös yritysten varovaisuuden.
Äänestyskäyttö tapahtui, kun veljeni investment-pankki, Piper Sandler, päätti kieltää OpenAI:n sisäisen käytön. Tämä sai meidät tajutemaan, että vaikka tekoäly oli edennyt merkittävästi, yritysten omaksumisessa oli edelleen aukko luotettavuuden ja turvallisuuden vuoksi. Perustimme Patronus AI:n tämän aukon täyttämiseksi ja lisäämään yritysten luottamusta generatiiviseen tekoälyyn tarjoamalla arviointi- ja turvallisuuskerroksen LLM:lle.
Voitko kuvata Patronus AI:n alustan ydintoimintoja LLM:n arvioinnissa ja turvallisuudessa?
Meidän tehtävämme on parantaa yritysten luottamusta generatiiviseen tekoälyyn. Olemme kehittäneet teollisuuden ensimmäisen automaattisen arviointi- ja turvallisuusalustan nimenomaan LLM:lle. Alustamme auttaa yrityksiä havaitsemaan virheitä LLM-tuloksissa laajassa mittakaavassa, mahdollistaen heidän turvallisen ja luotettavan tekoälytuotteiden käytön.
Alustamme automatisoi useita avainprosesseja:
- Arviointi: Arvioimme mallin suorituskykyä todellisissa tilanteissa, keskittyen tärkeisiin kriteereihin, kuten harhaanjohtaviin ja turvallisuuteen.
- Testien luominen: Luomme automaattisesti vastustuskykyisiä testisarjoja laajassa mittakaavassa arvioidaksemme mallin kykyjä.
- Vertailu: Vertaamme eri malleja auttaaksemme asiakkaita tunnistamaan parhaimman ratkaisun heidän tiettyihin tarpeisiinsa.
Yritykset suosivat usein useita arviointeja sopeutuakseen kehittyviin malleihin, tietoihin ja käyttäjien tarpeisiin. Alustamme toimii luotettavana kolmannen osapuolen arvioijana, tarjoamalla puolueetonta näkemystä, joka on verrattavissa Moody’siin tekoälytilassa. Alkuvuoden kumppaneihimme kuuluvat johtavat tekoälyyritykset, kuten MongoDB, Databricks, Cohere ja Nomic AI, ja olemme keskusteluissa useiden tunnettujen yritysten kanssa perinteisillä aloilla kokeillaksemme alustaa.
Mitä virheitä tai “harhaanjohtavia” Patronus AI:n Lynx-malli havaitsee LLM-tuloksissa, ja miten se ratkaisee nämä ongelmat yrityksille?
LLM:t ovat todella voimakkaita työkaluja, mutta niiden todennäköisyysperusta tekee niistä alttiita “harhaanjohtaville virheille” tai virheille, joissa malli tuottaa epätarkkaa tai irrelevanttia tietoa. Nämä harhaanjohtavat virheet ovat ongelmallisia, erityisesti korkean panoksen liiketoimintaympäristöissä, joissa tarkkuus on kriittinen.
Perinteisesti yritykset ovat luottaneet manuaaliseen tarkasteluun LLM-tuloksien arvioinnissa, prosessi, joka ei ole ainoastaan aikaa vievä, vaan myös mittakaavaongelmainen. Tätä varten Patronus AI kehitti Lynx-mallin, joka parantaa alustamme kykyä automatisoida harhaanjohtavien virheiden havaitsemista. Lynx, joka on integroitu alustamme, tarjoaa kattavan testikattavuuden ja vakuuttavan suorituskyvyn, keskittyen kriittisten virheiden tunnistamiseen, jotka voivat vaikuttaa merkittävästi liiketoiminnan operaatioihin, kuten virheellisiin taloudellisiin laskelmiin tai virheisiin oikeudellisten asiakirjojen tarkastelussa.
Lynxin avulla lievennämme manuaalisen arvioinnin rajoituksia automaattisella vastustuskykyisellä testauksella, tutkimalla laajaa spektriä potentiaalisia epäonnistumisen skenaarioita. Tämä mahdollistaa ongelmien havaitsemisen, jotka voivat jääda ihmisten arvioijien huomaamatta, tarjoten yrityksille parannettua luotettavuutta ja varmuutta tekoälyn käytölle kriittisissä sovelluksissa.
FinanceBench on teollisuuden ensimmäinen vertailu LLM-suorituskyvyn arvioimiseksi rahoituskysymyksissä. Mitkä haasteet rahoitusalalla johtivat FinanceBenchin kehittämiseen?
FinanceBench kehitettiin rahoitusalalla koettujen ainutlaatuisten haasteiden vuoksi, kun otettiin käyttöön LLM:t. Rahoitossopimukset vaativat korkeaa tarkkuutta ja luotettavuutta, sillä virheet voivat johtaa merkittäviin taloudellisiin tappioihin tai sääntelyongelmiin. Vaikka LLM:t lupaavat suuren potentiaalin suurten määrien rahoitustietojen käsittelyssä, tutkimuksemme osoitti, että jopa johtavat mallit kuten GPT-4 ja Llama 2 kamppailivat rahoituskysymyksissä, usein epäonnistuen hakemisessa tarkkaa tietoa.
FinanceBench luotiin kattavaksi vertailuksi LLM-suorituskyvyn arvioimiseksi rahoituskonteksteissa. Se sisältää 10 000 kysymys-vastausparia, jotka perustuvat julkisesti saatavilla oleviin rahoituskirjallisuuteen, kattaen alueita kuten numeerinen päättely, tietojen hakeminen, looginen päättely ja maailman tietäminen. Tarjoamalla tämän vertailun, tavoitteenamme on auttaa yrityksiä ymmärtämään nykyisten mallien rajoituksia ja tunnistamaan parantamistarpeita.
Alkuvaiheen analyysi paljasti, että monet LLM:t eivät täytä rahoitossopimusten vaatimia korkeita standardeja, korostaa tarvetta lisälle hienostunnolle ja kohdennetulle arvioinnille. FinanceBenchin avulla tarjoamme arvokkaan työkalun yrityksille arvioida ja parantaa LLM-suorituskykyä rahoitusalalla.
Tutkimuksenne korosti, että johtavat tekoälymallit, erityisesti OpenAI:n GPT-4, tuottivat tekijänoikeudella suojattua sisältöä merkittävillä tasolla, kun niille annettiin kysymyksiä suosituista kirjoista. Mitä pitkän aikavälin seurauksia nämä löydökset ovat tekoälyn kehitykselle ja laajemmalle teknologia-alalle, erityisesti tekoäly- ja tekijänoikeuslakien ympärillä käydyissä keskusteluissa?
Tekoälymallien tuottama tekijänoikeudella suojattu sisältö on monimutkainen ja painava huolenaihe tekoälyteollisuudessa. Tutkimuksemme osoitti, että mallit kuten GPT-4, kun niille annettiin suosittujen kirjojen katkelmia, usein toistivat tekijänoikeudella suojattua materiaalia. Tämä herättää tärkeitä kysymyksiä immateriaalioikeuksista ja tekoälysisällön oikeudellisista seurauksista.
Pitkällä aikavälillä nämä löydökset korostavat tarvetta selkeämmille ohjeille ja säännöksille tekoäly- ja tekijänoikeuksien ympärillä. Teollisuuden on työstettävä tekoälymallien kehittämistä, jotka kunnioittavat immateriaalioikeuksia säilyttäen luovia kykyjään. Tämä voi vaatia koulutusaineistojen hienostumista tekijänoikeudella suojatun materiaalin poisjättämiseksi tai mekanismien kehittämistä, jotka havaitsevat ja estävät suojatun sisällön toistamisen.
Laajempi teknologia-alan on osallistuttava jatkuviin keskusteluihin oikeudellisten asiantuntijoiden, viranomaisten ja sidosryhmien kanssa luodakseen kehyksen, joka tasapainottaa innovaation ja olemassa olevien lakien kunnioittamisen. Tekoälyn jatkuessa kehittymään on tärkeää käsitellä näitä haasteita proaktiivisesti varmistaaksemme vastuullisen ja eettisen tekoälykehityksen.
Johtavien LLM-mallien tuottaman tekijänoikeudella suojatun sisällön hämmästyttävän korkean tuotannon valossa, mitä toimia tekoälykehittäjien ja koko alan on otettava näiden huolenaiheiden ratkaisemiseksi? Miten Patronus AI aikoo osallistua vastuullisten ja laillisesti vaatimustenmukaisien tekoälymallien luomiseen näiden löydösten valossa?
Tekoälymallien tuottaman tekijänoikeudella suojatun sisällön ongelman ratkaiseminen vaatii monipuolista lähestymistapaa. Tekoälykehittäjien ja koko alan on priorisoida avoimuus ja vastuu tekoälymallien kehittämisessä. Tämä sisältää:
- Parannettu aineiston valinta: Varmistamalla, että koulutusaineistot on huolellisesti valittu välttämään tekijänoikeudella suojattua materiaalia, ellei asianmukaisia lisenssejä ole hankittu.
- Havaintomekanismien kehittäminen: Kehittämällä järjestelmiä, jotka voivat tunnistaa, kun tekoälymalli tuottaa mahdollisesti tekijänoikeudella suojattua sisältöä, ja tarjoamalla käyttäjille vaihtoehtoja muuttaa tai poistaa tällaista sisältöä.
- Alan standardien perustaminen: Yhteistyössä oikeudellisten asiantuntijoiden ja alan sidosryhmien kanssa luodakseen ohjeet ja standardit tekoälykehitykselle, jotka kunnioittavat immateriaalioikeuksia.
Patronus AI:lla olemme sitoutuneita osallistumaan vastuulliseen tekoälykehitykseen keskittyymällä arviointiin ja vaatimustenmukaisuuteen. Alustamme sisältää tuotteita kuten EnterprisePII, jotka auttavat yrityksiä havaitsemaan ja hallitsemaan potentiaalisia yksityisyyden suojeluun liittyviä ongelmia tekoälytuloksissa. Tarjoamalla nämä ratkaisut, tavoitteenamme on antaa yrityksille mahdollisuus käyttää tekoälyä vastuullisesti ja eettisesti minimoiden oikeudelliset riskit.
EnterprisePII- ja FinanceBench-työkalujen avulla, mitä muutoksia odotat siinä, miten yritykset käyttävät tekoälyä, erityisesti herkillä aloilla kuten rahoituksessa ja henkilökohtaisissa tiedoissa?
Nämä työkalut antavat yrityksille mahdollisuuden arvioida ja hallita tekoälytuloksia tehokkaammin, erityisesti herkillä aloilla kuten rahoituksessa ja henkilökohtaisissa tiedoissa.
Rahoitusalalla FinanceBench mahdollistaa yrityksille arvioida LLM-suorituskykyä korkealla tarkkuudella, varmistaen, että mallit täyttävät rahoitossopimusten tiukat vaatimukset. Tämä antaa yrityksille mahdollisuuden hyödyntää tekoälyä tehtävissä kuten data-analyysissä ja päätöksenteossa suuremmalla luottamuksella ja luotettavuudella.
Vastaavasti työkalut kuten EnterprisePII auttavat yrityksiä navigoimaan tietosuojan monimutkaisuuksissa. Tarjoamalla näkemyksiä potentiaalisista riskeistä ja tarjoamalla ratkaisuja niiden lieventämiseksi, nämä työkalut mahdollistavat yrityksille turvallisen ja vastuullisen tekoälyn käytön.
Kaiken kaikkiaan nämä työkalut ovat avaamassa tien tiedostetumman ja strategisemman lähestymistavan tekoälyn omaksumiseen, auttaen yrityksiä hyödyntämään tekoälyn hyödyt vähentäen samalla liittyviä riskejä.
Miten Patronus AI työskentelee yritysten kanssa integroidakseen nämä työkalut olemassa oleviin LLM-käyttöön ja työnkulkuun?
Patronus AI:lla ymmärrämme integraation tärkeyden, kun on kyse tekoälyn omaksumisesta. Työskentelemme läheisesti asiakkaiden kanssa varmistaaksemme, että työkalumme voidaan helposti integroida olemassa oleviin LLM-järjestelmiin ja työnkulkuun. Tämä sisältää asiakkaiden tarjoamisen:
- Räätälöidyt integraatiosuunnitelmat: Yhteistyössä jokaisen asiakkaan kanssa kehitämme räätälöityjä integraatiosuunnitelmia, jotka ovat linjassa heidän tiettyjen tarpeidensa ja tavoitteidensa kanssa.
- Kattava tuki: Tiimimme tarjoaa jatkuvaa tukea koko integraatioprosessin ajan, tarjoten ohjausta ja apua varmistaaksemme sulavan siirtymisen.
- Koulutus ja koulutusohjelmat: Tarjoamme koulutussessioita ja koulutusresursseja auttaaksemme asiakkaita ymmärtämään ja käyttämään työkalujamme täysimääräisesti, antaen heille mahdollisuuden hyödyntää tekoälyinvestointejaan parhaalla tavalla.
Miten neuvot tekoälykehittäjille ja yrityksille, jotka aikovat käyttää tekoälyä, ottaen huomioon tekoälytulosten turvallisuuden, tarkkuuden ja vaatimustenmukaisuuden monimutkaisuudet?
Tekoälytulosten turvallisuuden, tarkkuuden ja vaatimustenmukaisuuden monimutkaisuudet esittävät merkittäviä haasteita. Tekoälykehittäjille on tärkeää priorisoida avoimuus ja vastuu kehitysprosessissa.
Yksi perustava asia on koulutusaineiston laatu. Kehittäjien on varmistettava, että koulutusaineistot on huolellisesti valittu välttämään tekijänoikeudella suojattua materiaalia, ellei asianmukaisia lisenssejä ole hankittu. Tämä auttaa välttämään potentiaalisia oikeudellisia ongelmia ja varmistaa, että tekoäly tuottaa luotettavia tuloksia. Lisäksi on tärkeää käsitellä bias ja oikeudenmukaisuus. Aktiivisesti työskentelemällä tunnistamaan ja lieventämään biasia ja kehittämällä monipuolisia ja edustavia koulutusaineistoja, kehittäjät voivat vähentää biasia ja varmistaa oikeudenmukaiset tulokset kaikille käyttäjille.
Robustit arviointimenetelmät ovat olennaisia. Käyttämällä tiukkoja testejä ja hyödyntämällä vertailuja kuten FinanceBench, voidaan arvioida tekoälymallien suorituskykyä ja luotettavuutta, varmistaen, että ne täyttävät tiettyjen sovellusten vaatimukset. Lisäksi eettiset huomioonotot on asetettava etusijalle. Osallistumalla eettisiin ohjeisiin ja kehyksiin varmistetaan, että tekoälyjärjestelmiä kehitetään vastuullisesti ja niiden kehitys on linjassa yhteiskunnan arvojen kanssa.
Yrityksille, jotka aikovat hyödyntää tekoälyä, on tärkeää ymmärtää tekoälyn kykyjä. On tärkeää asettaa realistisia odotuksia ja varmistaa, että tekoälyä käytetään tehokkaasti organisaatiossa. Sulava integraatio ja tuki ovat myös olennaisia. Työskentelemällä luotettavien kumppanien kanssa yritykset voivat integroida tekoälyratkaisuja olemassa oleviin työnkulkuun ja varmistaa, että tiimit ovat koulutettuina ja tuettuina hyödyntämään tekoälyä tehokkaasti.
Vaatimustenmukaisuus ja turvallisuus on priorisoitava, keskittyen sääntelyyn ja tietosuojalakeihin. Työkalut kuten EnterprisePII voivat auttaa seuraamaan ja hallitsemaan potentiaalisia riskejä. Jatkuva seuranta ja säännöllinen arviointi tekoälyn suorituskyvystä on myös välttämätöntä ylläpitämään tarkkuutta ja luotettavuutta, mahdollistaen tarvittaessa sopeutumisen.
Kiitos haastattelusta, lukijoille, jotka haluavat oppia lisää, suosittelemme vierailemaan Patronus AI:ssa.












