Connect with us

Finansiering

Gentrace SÀkrar 8 MUSD i Serie A för att Revolutionera Testning av Generativ AI

mm

Gentrace, en banbrytande plattform för testning och övervakning av generativa AI-applikationer, har meddelat att man har slutfört en serie A-finansiering på 8 miljoner dollar som lett av Matrix Partners, med bidrag från Headline och K9 Ventures. Denna finansieringsmilstolpe, som bringar företagets totala finansiering till 14 miljoner dollar, sammanfaller med lanseringen av dess flaggskeppverktyg, Experiments—en branschledande lösning som är utformad för att göra large language model (LLM) testning mer tillgänglig, samarbetsinriktad och effektiv över hela organisationen.

Den globala pushen för att integrera generativ AI i olika branscher — från utbildning till e-handel — har skapat ett kritiskt behov av verktyg som säkerställer att AI-system är tillförlitliga, säkra och anpassade till användarnas behov. Men de flesta befintliga lösningar är fragmenterade, tungt tekniska och begränsade till ingenjörsteam. Gentrace syftar till att riva dessa barriärer med en plattform som främjar samarbete över funktioner, vilket möjliggör för intressenter från produktchefer till kvalitetssäkring (QA) specialister att spela en aktiv roll i att finslipa AI-applikationer.

“Generativ AI har introducerat otroliga möjligheter, men dess komplexitet avskräcker ofta omfattande experiment och tillförlitlig utveckling,” sade Doug Safreno, VD och medgrundare av Gentrace. “Med Gentrace bygger vi inte bara ett verktyg, utan en ram som möjliggör för organisationer att utveckla pålitliga, högpresterande AI-system samarbetsinriktat och effektivt.”

Att Hantera Utmaningarna med Generativ AI-utveckling

Generativ AI:s uppgång har varit meteorisk, men så har också utmaningarna kring dess distribution. Modeller som GPT (Generative Pre-trained Transformer) kräver omfattande testning för att validera deras svar, identifiera fel och säkerställa säkerhet i realvärldens applikationer. Enligt marknadsanalytiker förväntas den generativa AI-tekniksektorn växa till 38,7 miljarder dollar år 2030, med en årlig tillväxttakt (CAGR) på 34,2 %. Denna tillväxt understryker det brådskande behovet av bättre testnings- och övervakningsverktyg.

Historiskt har AI-testning förlitat sig på manuella arbetsflöden, kalkylblad eller ingenjörscentrerade plattformar som inte kan skalas effektivt för företagskrav. Dessa metoder skapar också silos, vilket förhindrar att team utanför ingenjörer — såsom produktchefer eller compliance-officerare — aktivt bidrar till utvärderingsprocesser. Gentrace-plattformen hanterar dessa problem genom en trepelarsapproach:

  1. Syftesbyggda Testmiljöer
    Gentrace tillåter organisationer att simulera realvärldsscenarier, vilket möjliggör för AI-modeller att utvärderas under förhållanden som speglar faktisk användning. Detta säkerställer att utvecklare kan identifiera edgefall, säkerhetsproblem och andra risker innan distribution.
  2. Omfattande Prestandaanalytik
    Detaljerade insikter i LLM-prestanda, såsom framgångsfrekvenser, felrater och svarstider, tillåter team att identifiera trender och kontinuerligt förbättra modellkvalitet.
  3. Samarbete över Funktioner genom Experiments
    Det nyligen lanserade Experiments-verktyget möjliggör för produktteam, ämnesexperter och QA-specialister att direkt testa och utvärdera AI-utdata utan att behöva kodexperter. Genom att stödja arbetsflöden som integrerar med verktyg som OpenAI, Pinecone och Rivet säkerställer Experiments en smidig antagande över hela organisationen.

Vad Särskiljer Gentrace?

Gentrace:s Experiments-verktyg är utformat för att demokratisera AI-testning. Traditionella verktyg kräver ofta teknisk expertis, vilket lämnar icke-ingenjörsteam utanför kritiska utvärderingsprocesser. I kontrast tillåter Gentrace:s inga-kod-gränssnitt användare att testa AI-system intuitivt. Nyckelfunktioner i Experiments inkluderar:

  • Direkt Testning av AI-utdata: Användare kan interagera med LLM-utdata direkt inom plattformen, vilket gör det lättare att utvärdera realvärldens prestanda.
  • “Vad-händer-om”-scenarier: Team kan förutse potentiella felmoder genom att köra hypotetiska tester som simulerar olika indataförhållanden eller edgefall.
  • Förhandsgranska Distributionresultat: Innan distribution av ändringar kan team bedöma hur uppdateringar kommer att påverka prestanda och stabilitet.
  • Stöd för Multimodala Utdata: Gentrace utvärderar inte bara textbaserade utdata utan också multimodala resultat, såsom bild-till-text eller videobearbetningspipelines, vilket gör det till ett mångsidigt verktyg för avancerade AI-applikationer.

Dessa funktioner tillåter organisationer att gå från reaktiv felsökning till proaktiv utveckling, vilket i slutändan minskar distributionsrisker och förbättrar användartillfredsställelse.

Effektiva Resultat från Branschledare

Gentrace:s innovativa tillvägagångssätt har redan fått genomslag bland tidiga antagare, inklusive Webflow, Quizlet och en Fortune 100 detaljhandlare. Dessa företag har rapporterat omvälvande resultat:

  • Quizlet: Ökade testgenomströmningen med 40 gånger, minskade utvärderingscykler från timmar till mindre än en minut.
  • Webflow: Förbättrade samarbetet mellan ingenjörs- och produktteam, vilket möjliggjorde snabbare justering av AI-funktioner.

“Gentrace gör LLM-utvärdering till en samarbetsprocess. Det är en kritisk del av vår AI-teknikstack för att leverera funktioner som resoneras med våra användare,” sade Bryant Chou, medgrundare och chefsarkitekt på Webflow.

Madeline Gilbert, personal Machine Learning Engineer på Quizlet, betonade plattformens flexibilitet: “Gentrace tillät oss att implementera anpassade utvärderingar anpassade till våra specifika behov. Det har drastiskt förbättrat vår förmåga att förutsäga effekten av ändringar i våra AI-modeller.”

En Visionär Grundarlag

Gentrace:s ledningsteam kombinerar expertis inom AI, DevOps och programvaruinfrastruktur:

  • Doug Safreno (VD): Tidigare medgrundare av StacksWare, en företagsövervakningsplattform som förvärvades av VMware.
  • Vivek Nair (CTO): Byggde skalbara testinfrastrukturer på Uber och Dropbox.
  • Daniel Liem (COO): Erfarenhet av att driva operativ excellens i högt tillväxtföretag.

Teamet har också attraherat rådgivare och ängelinvesterare från ledande företag, inklusive Figma, Linear och Asana, vilket ytterligare validerar deras uppdrag och marknadsposition.

Skalning för Framtiden

Med de nyligen uppburna medlen planerar Gentrace att expandera sitt ingenjörsteam, produktteam och marknadsföringsteam för att stödja den växande efterfrågan från företag. Utvecklingsvägen inkluderar avancerade funktioner som tröskelbaserat experiment (automatiserar identifieringen av prestandatrösklar) och autooptimering (dynamiskt förbättrar modeller baserat på utvärderingsdata).

Dessutom är Gentrace engagerat i att förbättra sin regelefterlevnad och säkerhetsfunktioner. Företaget har nyligen uppnått ISO 27001-certifiering, vilket speglar dess engagemang för att skydda kunddata.

Gentrace i den Större AI-ekosystemet

Plattformens senaste uppdateringar understryker dess engagemang för kontinuerlig innovation:

  • Lokala Utvärderingar och Datasets: Tillåter team att använda proprietära eller känsliga data säkert inom sin egen infrastruktur.
  • Jämförande Utvärderare: Stöder huvudmot-huvud-testning för att identifiera den bäst presterande modellen eller pipeline.
  • Produktionsövervakning: Tillhandahåller realtidsinsikter i hur modeller presterar efter distribution, vilket hjälper team att upptäcka problem innan de eskalerar.

Partnerstöd och Marknadsvalidering

Matrix Partners’ Kojo Osei underströk plattformens värde: “Generativ AI kommer bara att förverkliga sin potential om organisationer kan lita på dess utdata. Gentrace sätter en ny standard för AI-tillförlitlighet och användbarhet.”

Jett Fein, Partner på Headline, tillade: “Gentrace:s förmåga att sömlöst integrera i komplexa företagsarbetsflöden gör det oumbärligt för organisationer som distribuerar AI i stor skala.”

Att Forma Framtiden för Generativ AI

Medan generativ AI fortsätter att omdefiniera branscher kommer verktyg som Gentrace att vara avgörande för att säkerställa dess säkra och effektiva implementering. Genom att möjliggöra för olika team att bidra till testning och utveckling främjar Gentrace en kultur av samarbete och ansvar i AI.

Antoine Àr en visionÀr ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och frÀmja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhÀllet som elektricitet, och fÄngas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, Àr han dedikerad till att utforska hur dessa innovationer kommer att forma vÄr vÀrld. Dessutom Àr han grundare av Securities.io, en plattform som fokuserar pÄ att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.