Kontakt med oss

Kunstig intelligens

Hva er multitenancy i vektordatabaser?

mm

Når du laster opp og administrerer dataene dine på GitHub, slik at ingen andre kan se dem med mindre du gjør dem offentlige, deler du fysisk infrastruktur med andre brukere. Det er fordi GitHub bruker multitenancy som et kostnadseffektivt og enklere å administrere alternativ til å tilordne en separat database til hver bruker.

Det blir imidlertid en sikkerhetsrisiko å dele den samme infrastrukturen når alle brukere kan se hverandres data. Multitenancy løser dette problemet ved å partisjonere brukerdata logisk samtidig som de kan kjøre på de samme ressursene.

Denne artikkelen utforsker multitenancy i vektordatabaser, dens fordeler, begrensninger og brukstilfeller i den virkelige verden.

Hvordan fungerer multitenancy i vektordatabaser?

Multitenancy er en tilnærming der flere leietakere, dvs. brukere, deler samme database, men lagrer dataene sine i et isolert miljø.

Et isolert miljø skapes ved å bruke unike legitimasjoner for hver leietaker for å sikre dataene deres. Som et resultat kan hver leietaker lagre, administrere og endre dataene sine i sitt isolerte miljø. Imidlertid har selskapet tilgang til å administrere og kontrollere leietakers ressurser og begrensninger.

Eksempelillustrasjon av en samling med to leietakere med isolert tilgang til samme database. Bildekilde: Kvadrant

Vektordatabaser bruker indeksering som en søketeknikk som organiserer vektorer basert på likhet. Indekseringsstrategien påvirker partisjoneringen av leietakerdata. For tiden brukes to indekseringsstrategier i multitenant vektordatabaser.

La oss diskutere begge indekseringsstrategiene i multitenant vektordatabaser:

  1. Delt indeksering: Alle leietakere deler den samme indeksen med unik legitimasjon som partisjonerer dataene. Denne metoden er minneeffektiv. Det krever imidlertid robuste sikkerhets- og tilgangskontrollmekanismer for å beskytte leietakerdata.
  2. Per-leietaker-indeksering: Hver leietaker har en egen indeks i per-leietaker-indeksering. Dette gir full tilgangskontroll og forbedret søkeytelse. Denne metoden er imidlertid ressurskrevende.

Noen vector databaser i likhet med Kvadrant og Milvus tilby multitenant-arkitektur for å tillate ekstra tilpasning og skalerbarhet for brukere med begge indekseringsstrategiene.

Fordeler med multitenancy i vektordatabaser

Multitenancy i vektordatabaser gir mange fordeler for selskaper som krever isolerte databaseforekomster for flere brukere. Noen av fordelene inkluderer:

1. Kostnadsreduksjon

Bruk av færre ressurser for flere brukere resulterer i reduserte infrastrukturkostnader.

2. Skalerbarhet

Multitenancy tillater behovsbasert ressursdeling. Dette betyr at leietakere med større krav til lagring får flere ressurser og omvendt.

3. tilpasning

Et eget miljø lar leietakere konfigurere det basert på deres behov, inkludert databaseskjema, plugins, beregninger og dashbord. Konfigurasjoner er private for leietakere, og leietakere kan endre dem etter hvert som kravene deres endres.

4. Håndterbarhet

En enkelt database for alle leietakere tillater sentralisert ressursstyring, konfigurasjon og overvåking i stedet for å overvåke alle leietakere separat. Mens et selskap kan administrere alle leietakere på ett sted, har leietakere kontrollen til å administrere dataene sine innenfor sine isolerte miljøer.

Begrensninger for multitenancy i vektordatabaser

Som enhver annen arkitektonisk tilnærming, har multitenancy noen begrensninger. Å vurdere disse begrensningene er viktig for nøye beslutningstaking. De vanligste begrensningene inkluderer:

1. Ytterligere kompleksiteter

Å administrere flere leietakere på én enkelt ressurs krever ekstra konfigurasjon. Dette inkluderer introduksjon av leietakere, tilgangskontroll, brukerautentisering og autorisasjon. Mangel på kunnskap og støtte kan føre til uønskede utfall som utilsiktet datadeling eller ressursoverhead.

For å løse dette sikrer nøye planlegging og databasestøtte et sikkert brukermiljø.

2. Sikkerhetsproblemer

Skadelig tilgang, utilsiktede feilkonfigurasjoner eller sårbarheter i underliggende infrastruktur kan føre til delte data mellom leietakere. Som rekkverk kan implementering av nøye design, gjennomføring av regelmessige revisjoner og inkorporering av flerlags sikkerhetstiltak styrke den generelle sikkerheten.

3. Ytelse Flaskehalser

Høyere ressursbruk av en leietaker kan redusere ytelsen til andre. Delt indeksering påvirker spesifikt søkeytelsen på grunn av kjøretidstillatelseskontroller for å matche tilgangslisten. Ressursstyring og kontroll, regelmessige oppdateringer og opplæring av leietakere er viktig for å redusere ytelsesproblemer.

4. Systembrudd

Planlagt vedlikehold, maskinvarefeil og programvarefeil påvirker alle leietakere når de deler en lignende infrastruktur. Dette fører til data, omdømme og økonomiske tap. Regelmessig risikovurdering, kvalitetssikring av infrastruktur og rettidig backup kan minimere den negative effekten av systembrudd.

Bruk tilfeller av Multitenancy

Multitanency er nyttig i ulike applikasjoner, fra anbefalingssystemer for e-handel til opplæring av store maskinlæringsmodeller (ML) i bedrifter. Noen av de vanligste brukstilfellene inkluderer:

1. Anbefalingssystemer

Tenk deg en e-handelsplattform der brukere kan registrere seg og lagre shoppingpreferansene sine. Et multitenant-oppsett vil tillate personlige produktanbefalinger til hver bruker.

På e-handelsplattformen kan alle leietakere sette sine kriterier, slik at anbefalingssystem sender personlige produktanbefalinger til sluttbrukere.

2. Bedriftsapplikasjoner

Store programvareapplikasjoner som betjener flere ansatte og kunder bruker samme database for alle brukere. Alle brukere kan laste opp og administrere dataene sine samtidig som de beskyttes mot andre. For eksempel lar Dropbox og HubSpot alle brukere dele de samme ressursene, men holde dataene deres beskyttet mot hverandre.

3. Oppdagelse av avvik og svindel

Multitenancy tillater utvikling av robuste svindeloppdagelsessystemer samtidig som individuelle data holdes sikre. Bedrifter trener svindeloppdagelsesmodeller på sine anonymiserte data og sender kun den opplærte modellen over den sentraliserte databasen. Dette lar dem holde dataene sine sikre samtidig som de bidrar til å utvikle svindeldeteksjonssystemer.

For eksempel, systemer for oppdagelse av kredittkortsvindel ML for forbedret personvern og effektivitet.

Når du skal bruke og når du ikke skal bruke multitenancy

Flere faktorer bidrar til beslutningen om å bytte til multitenancy, inkludert leietakers ytelse, isolasjonskrav og sikkerhetshensyn. La oss diskutere når og når vi ikke skal bruke multitenancy i detalj nedenfor.

Når skal du bruke multitenancy

Følgende indikatorer gjør multitenancy en god passform:

  1. Flere leietakere trenger separate miljøer.
  2. Leietakere kan akseptere ytelsesavveininger.
  3. Kostnadsreduksjon er din prioritet.
  4. Sentralisert leietakeradministrasjon forbedrer driften din.

Når du ikke skal bruke multitenancy

Begrensninger av multitenancy gjør at det ikke passer godt for alle situasjoner. En multitenant vektordatabase passer ikke for deg hvis du har følgende krav:

  1. Leietakere eier svært sensitive data med strenge sikkerhetskrav.
  2. Et begrenset antall leietakere med lav vekst.
  3. Leietakere krever dedikerte miljøer og kan ikke tolerere ytelsesforringelse.
  4. Begrenset multitenant ekspertise og evne til å håndtere økende kompleksitet.

Multitenancy introduserer ekstra skalerbarhet og administrerbarhet til vektordatabasene. Hvis konfigurert riktig, sparer multitenancy betydelige kostnader og ressurser for en organisasjon.

Interessert i mer AI-relatert innhold? Holde kontakt med unite.ai.