Liity verkostomme!

Tekoäly

Kehittäjien esteet madaltuvat, koska OpenAI yksinkertaistaa tekoälyagentin luomista

mm
(Lähde: OpenAI)

OpenAI on äskettäin julkaissut a sarja uusia kehittäjätyökaluja tarkoituksena on helpottaa luomista AI-agentit jotka voivat suorittaa monimutkaisia ​​tehtäviä itsenäisesti. Viime viikolla julkistettu päivitys esittelee Responses API:n, avoimen lähdekoodin Agents SDK:n ja sisäänrakennetut työkalut verkkohakuun, tiedostohakuun ja tietokoneohjaukseen – kaikki suunniteltu virtaviivaistamaan tekoälyjärjestelmien vuorovaikutusta todellisen maailman tietojen ja sovellusten kanssa.

OpenAI kuvailee näitä agentteja "järjestelmiksi, jotka suorittavat tehtäviä itsenäisesti käyttäjien puolesta", mikä tarkoittaa, että ne voivat suorittaa monivaiheisia prosesseja – kuten aiheen tutkimista tai tietokannan päivittämistä – vähäisellä ihmisen ohjauksella. Yhtiön tavoitteena on alentaa estettä kehittäjille ja yrityksille tehokkaiden tekoälyohjattujen avustajien käyttöönotolle, mikä laajentaa edistyneiden tekoälyominaisuuksien saatavuutta.

Responses API: Agentin vuorovaikutusten yksinkertaistaminen

OpenAI:n ilmoituksen ytimessä on uusi Responses API, joka toimii yhtenäisenä käyttöliittymänä tekoälyagenttien rakentamiseen. Tämä API yhdistää OpenAI:n Chat Completions API:n keskustelukyvyt aiemman Assistant API:n työkaluja käyttävän toiminnon avulla. Käytännössä tämä tarkoittaa, että yksi API-kutsu voi nyt käsitellä monimutkaisia, monivaiheisia tehtäviä, joihin saattaa liittyä eri työkalujen tai tietolähteiden kutsumista.

OpenAI sanoo, että Responses API on luotu yksinkertaistamaan agenttien kehitystä vähentämällä mukautetun koodin ja nopean puuhastelun tarvetta. "Responses API on suunniteltu kehittäjille, jotka haluavat helposti yhdistää OpenAI-malleja ja sisäänrakennettuja työkaluja sovelluksiinsa ilman monimutkaisuutta integroida useita sovellusliittymiä tai ulkoisia toimittajia." yhtiö selitti ilmoituksessaan blogikirjoituksessaan. Aikaisemmin kehittäjien piti usein järjestää useita API-kutsuja ja laatia yksityiskohtaisia ​​kehotteita saadakseen tekoälyagentin tekemään jotain hyödyllistä, mikä oli haastavaa ja aikaa vievää. Uuden API:n avulla agentti voi esimerkiksi käydä keskustelua käyttäjän kanssa, etsiä tietoja verkkohaun kautta ja kirjoittaa sitten yhteenvedon – kaikki yhdessä työnkulussa.

Erityisesti Responses API on kaikkien kehittäjien saatavilla ilman lisäkustannuksia tavallisten käyttömaksujen lisäksi. Se on myös taaksepäin yhteensopiva: OpenAI vahvisti jatkavansa suositun Chat Completions API:n tukemista yksinkertaisissa käyttötapauksissa, kun taas vanhempi Assistant API poistetaan käytöstä vuoden 2026 puoliväliin mennessä, kun sen ominaisuudet liitetään Responses API:hen.

Avoimen lähdekoodin agenttien SDK virtaviivaistaa työnkulun organisointia

Julkaisu sisältää myös Agents SDK:n, työkalupakin yhden tai jopa useamman vuorovaikutuksessa olevan tekoälyagentin työnkulkujen hallintaan. OpenAI on tehnyt tästä SDK:sta avoimen lähdekoodin, minkä ansiosta kehittäjät ja yritykset voivat tarkastaa koodin ja jopa integroida muita kuin OpenAI-malleja agenttijärjestelmiinsä. Tämä joustavuus tarkoittaa, että yritys voi koordinoida agenttia, joka käyttää OpenAI:n GPT-4:ää toisen agentin kanssa, joka käyttää erilaista tekoälymallia, kaikki samassa kehyksessä.

Agents SDK keskittyy työnkulun organisointiin – lähinnä seuraamaan, mitä agentti tekee ja miten se jakaa tehtäviä. Se tarjoaa sisäänrakennettuja mekanismeja esimerkiksi:

  • Konfiguroitavat agentit: AI-agenttien määrittäminen ennalta määritetyillä rooleilla tai ohjeilla tiettyjä tehtäviä varten.
  • Älykkäät vaihdot: tehtävien siirtäminen useiden agenttien tai prosessien välillä kontekstin perusteella (esimerkiksi yksi agentti kerää tietoja, sitten toinen agentti analysoi sitä).
  • Suojakaiteet turvallisuuden vuoksi: varmistaa, että agentti pysyy tiettyjen rajojen sisällä syötteen vahvistus- ja sisällönvalvontatyökaluilla ei-toivottujen tulosteiden estämiseksi.
  • Jäljitys ja havaittavuus: työkalut agentin toimien seurantaan ja virheenkorjaukseen vaiheittain, mikä auttaa kehittäjiä ymmärtämään päätöksiä ja parantamaan suorituskykyä.

OpenAI:n mukaan tämä työkalupakki voi yksinkertaistaa monimutkaisia ​​käyttötapauksia, kuten asiakastukibotteja, monivaiheisia tutkimusassistentteja, sisällön luomisen työnkulkuja, koodintarkistusagentteja tai myynnin etsintäautomaatiota. Avoimen lähdekoodin SDK:n avulla OpenAI kannustaa myös yhteisön osallistumista ja käyttöönottoa yritysympäristöissä, joissa läpinäkyvyys ja kyky isännöidä komponentteja ovat usein tärkeitä. Varhaiset käyttäjät mukaan lukien yritykset, kuten Coinbase ja Laatikko ovat jo kokeilleet Agents SDK:n rakentamista AI-pohjainen tutkimus ja tiedonpoistotyökalut.

Uusia työkaluja agenttien rakentamiseen API:n avulla

Sisäänrakennetut työkalut parantavat tekoälyn toimivuutta

Tekoälyagenttien toiminnallisuuden lisäämiseksi käyttövalmiiksi OpenAI:n Responses API sisältää kolme sisäänrakennettua työkalua, jotka yhdistävät tekoälyn ulkopuoliseen dataan ja toimintoihin. Nämä työkalut laajentavat merkittävästi agentin mahdollisuuksia ja ulottuvat tekstin luomista pidemmälle. 

Käyttöönoton yhteydessä saatavilla olevat sisäänrakennetut työkalut ovat:

  • Verkkohaku: Antaa tekoälyagentin tehdä reaaliaikaisia ​​verkkohakuja ja hakea ajan tasalla olevaa tietoa sekä viitatut lähteet. Tämä tarkoittaa, että agentti voi vastata kysymyksiin käyttämällä viimeisimpiä uutisia tai faktoja Internetistä ja tarjota viitteitä avoimuuden vuoksi. Tämä työkalu on hyödyllinen rakennusagenteille, kuten tutkimusavustajille, ostosoppaille tai matkasuunnittelijoille, jotka tarvitsevat reaaliaikaista tietoa.
  • Tiedostohaku: Antaa agentin seuloa nopeasti läpi suuria kokoelmia kehittäjän toimittamia asiakirjoja tai tietoja löytääkseen asiaankuuluvia tietoja. Tämä on pohjimmiltaan yksityinen tietokannan kyselytyökalu – agentti voi käyttää sitä asiakastuen kysymyksiin vastaamiseen etsimällä käytäntödokumentteja tai avustaakseen juridisessa tutkimuksessa hakemalla osia tiedostokirjastosta. Tätä työkalua voidaan käyttää sellaisissa tilanteissa, kuten asiakaspalvelubotit tai yrityksen sisäiset avustajat, joiden on viitattava omistusoikeuteen.
  • Tietokoneen käyttö: Uusi ominaisuus (tällä hetkellä tutkimuksen esikatselussa), jonka avulla tekoälyagentti voi suorittaa toimintoja tietokoneella ikään kuin se olisi konetta käyttävä ihminen. Tämä OpenAI:n CUA-mallilla toimiva työkalu muuntaa tekoälyn tarkoitukset näppäimistön ja hiiren toimiksi ohjelmistojen, verkkosivustojen tai muiden digitaalisten käyttöliittymien navigoimiseksi. Pohjimmiltaan se mahdollistaa sellaisten tehtävien automatisoinnin, joissa ei ole helppoa APIa – esimerkiksi tietojen syöttämisen vanhaan järjestelmään, verkkosovelluksen klikkaamisen testausta varten tai tietojen tarkistamisen graafisesta käyttöliittymästä.

Integroimalla nämä työkalut tekoälyagentit voivat paitsi ajatella ongelman läpi, myös toimia – onko kyseessä tiedon etsiminen, tietyn datan hakeminen tai digitaalisen ympäristön manipulointi. Tämä laajentaa huomattavasti agentin toimintoja ja tekee siitä paljon hyödyllisemmän tosielämän sovelluksissa. 

OpenAI visioi, että kehittäjät yhdistävät näitä työkaluja tarpeen mukaan; Agentti voi esimerkiksi käyttää verkkohakua julkisten tietojen keräämiseen ja tiedostohakua sisäisten tietojen keräämiseen ja käyttää sitten yhdistettyä tietoa raportin laatimiseen tai tehtävän suorittamiseen. Kaikki tämä voidaan ohjata Responses API:n kautta yhtenäisellä tavalla sen sijaan, että se vaatisi erillisiä palveluita tai manuaalista integrointia.

Laajemmat vaikutukset tekoälyn käyttöönotolle ja saavutettavuudelle

Analyytikot sanovat, että tämä julkaisu voi nopeuttaa tekoälyagenttien käyttöönottoa eri toimialoilla alentamalla teknisiä esteitä. Yrityksille näiden uusien työkalujen vetovoima on kyky automatisoida ja skaalata prosesseja ilman laajaa mukautettua kehitystä. 

Tekoälyagentit voivat nyt mahdollisesti hoitaa rutiinitehtävät, kuten tiedonhaku, lomakkeiden käsittely tai sovellusten välinen tietojen syöttäminen, jotka ovat saattaneet vaatia merkittävää koodausta tai useita ohjelmistojärjestelmiä. Sisäänrakennettujen hakutyökalujen avulla yritykset voivat esimerkiksi liittää tekoälyn tietokantoihinsa tai verkkoon lähes välittömästi, ja tietokonetyökalu tarjoaa tavan liittyä vanhoihin sovelluksiin, joissa ei ole API:ta. Samaan aikaan Agents SDK:n avoimen lähdekoodin luonne antaa yrityksille enemmän hallintaa, jolloin ne voivat integroida nämä tekoälyagentit olemassa olevaan infrastruktuuriinsa ja jopa käyttää erilaisia ​​tekoälymalleja tarpeen mukaan.

OpenAI:n siirto on osa laajempaa kilpailua, jonka tavoitteena on antaa kehittäjille agenttien rakentamiskyky. Kilpailevat teknologiayritykset ja startupit ovat ottaneet käyttöön omia tekoälyagenttialustojaan, ja OpenAI:n kattava työkalupakki saattaa auttaa erottumaan joukosta. Itse asiassa ajoitus tulee keskellä maailmanlaajuista kiinnostusta autonomisia tekoälyagentteja kohtaan – esimerkiksi kiinalainen startup Monica sai äskettäin huomion agenttillaan. Manus, väittäen, että se voisi ylittää OpenAI:n oman prototyyppiagentin tietyissä tehtävissä. OpenAI näyttää vastaavan kilpailupaineeseen avoimella lähdekoodilla alustansa tärkeimmät osat ja tarjoamalla sisäänrakennettuja työkaluja ja samalla edistävän tekoälyn laajempaa käyttöönottoa.

Esteettömyysnäkökulmasta nämä työkalut voivat demokratisoida sitä, kuka voi rakentaa edistyneitä tekoälyjärjestelmiä. Pienemmät yritykset ja jopa yksittäiset kehittäjät saattavat nyt pitää mahdollisena luoda tekoälypohjainen avustaja tai työnkulku ilman suurta tutkimusryhmää. Integroitu lähestymistapa (jossa yksi API-kutsu voi käsitellä useita vaiheita) ja esimerkkien saatavuus OpenAI:n dokumentaatiossa alentaa uusien tulokkaiden pääsyä esteitä. OpenAI tarjoaa myös havainnointirajapinnan kehittäjille, joilla he voivat jäljittää ja tarkastaa, mitä agentti tekee, mikä on ratkaisevan tärkeää virheenkorjauksessa ja luottamuksen rakentamisessa tekoälytulosteisiin. Tämän käytettävyyteen ja turvallisuuteen keskittymisen (kaiteet ja valvonta) odotetaan kannustavan useampia yrityksiä kokeilemaan tekoälyagentteja tietäen, että heillä on valvonta ja valvonta.

Tekoälyagenteista voi tulla yhtä yleisiä ja välttämättömiä kuin Internet-läsnäolo. OpenAI:n uusimmat työkalut, jotka tekevät agenttikehityksestä helpommin lähestyttävän, voivat auttaa muuttamaan tämän vision todeksi antamalla paljon laajemmalle kehittäjä- ja organisaatioyhteisölle mahdollisuuden rakentaa omia agenttejaan.

Alex McFarland on tekoälytoimittaja ja kirjailija, joka tutkii tekoälyn viimeisintä kehitystä. Hän on tehnyt yhteistyötä lukuisten AI-startup-yritysten ja -julkaisujen kanssa maailmanlaajuisesti.