Refresh

This website www.unite.ai/nl/wat-is-multitenancy-in-vectordatabases/ is currently offline. Cloudflare's Always Online™ shows a snapshot of this web page from the Internet Archive's Wayback Machine. To check for the live version, click Refresh.

stomp Wat is multitenancy in vectordatabases? - Verenig AI
Verbind je met ons

Artificial Intelligence

Wat is multitenancy in vectordatabases?

mm

gepubliceerd

 on

Wanneer u uw gegevens op GitHub uploadt en beheert die niemand anders kan zien, tenzij u deze openbaar maakt, deelt u de fysieke infrastructuur met andere gebruikers. Dat komt omdat GitHub multitenancy gebruikt als een kosteneffectief en eenvoudiger te beheren alternatief voor het toewijzen van een afzonderlijke database aan elke gebruiker.

Het delen van dezelfde infrastructuur wordt echter een veiligheidsrisico wanneer alle gebruikers elkaars gegevens kunnen bekijken. Multitenancy lost dit probleem op door gebruikersgegevens logisch te partitioneren, terwijl ze op dezelfde bronnen kunnen worden uitgevoerd.

In dit artikel worden multitenancy in vectordatabases, de voordelen, beperkingen en gebruiksscenario's in de praktijk onderzocht.

Hoe werkt multitenancy in vectordatabases?

Multitenancy is een aanpak waarbij meerdere tenants, dat wil zeggen gebruikers, dezelfde database delen, maar hun gegevens in een geïsoleerde omgeving opslaan.

Er wordt een geïsoleerde omgeving gecreëerd met unieke inloggegevens voor elke tenant om zijn gegevens te beveiligen. Als gevolg hiervan kan elke huurder zijn gegevens in zijn geïsoleerde omgeving opslaan, beheren en wijzigen. Het bedrijf heeft echter wel toegang tot het beheren en controleren van tenantbronnen en -beperkingen.

Voorbeeldillustratie van een verzameling met twee tenants met geïsoleerde toegang tot dezelfde database. Afbeeldingsbron: Kwadrant

Vectordatabases gebruiken indexering als een zoektechniek die vectoren ordent op basis van gelijkenis. De indexeringsstrategie heeft invloed op de partitionering van tenantgegevens. Momenteel worden er twee indexeringsstrategieën gebruikt in vectordatabases met meerdere tenants.

Laten we beide indexeringsstrategieën in vectordatabases met meerdere tenants bespreken:

  1. Gedeelde indexering: alle tenants delen dezelfde index met unieke referenties die de gegevens verdelen. Deze methode is geheugenefficiënt. Het vereist echter robuuste beveiligings- en toegangscontrolemechanismen om huurdergegevens te beschermen.
  2. Indexering per huurder: Elke huurder heeft een afzonderlijke index voor indexering per huurder. Dit maakt volledige toegangscontrole en verbeterde zoekprestaties mogelijk. Deze methode is echter arbeidsintensief.

Sommige vector-databases als Kwadrant en Milvus bieden multitenant-architectuur om extra maatwerk en schaalbaarheid mogelijk te maken voor gebruikers met beide indexeringsstrategieën.

Voordelen van multitenancy in vectordatabases

Multitenancy in vectordatabases biedt talloze voordelen voor bedrijven die geïsoleerde database-instances voor meerdere gebruikers nodig hebben. Enkele van de voordelen zijn onder meer:

1. Kostenbesparing

Het gebruik van minder bronnen voor meer gebruikers resulteert in lagere infrastructuurkosten.

2. Schaalbaarheid

Multitenancy maakt het delen van bronnen op basis van behoeften mogelijk. Dit betekent dat huurders met meer opslagvereisten meer bronnen krijgen en omgekeerd.

3. Maatwerk

Een aparte omgeving stelt huurders in staat deze te configureren op basis van hun behoeften, inclusief databaseschema, plug-ins, statistieken en dashboards. Configuraties zijn privé voor tenants en tenants kunnen deze wijzigen wanneer hun vereisten veranderen.

4. Beheersbaarheid

Eén database voor alle tenants maakt dit mogelijk gecentraliseerd hulpbronnenbeheer, configuratie en monitoring in plaats van alle tenants afzonderlijk te monitoren. Hoewel een bedrijf alle tenants op één plek kan beheren, hebben tenants de controle om hun gegevens binnen hun geïsoleerde omgevingen te beheren.

Beperkingen van multitenancy in vectordatabases

Net als elke andere architectuurbenadering heeft multitenancy enkele beperkingen. Het in overweging nemen van deze beperkingen is belangrijk voor een zorgvuldige besluitvorming. De meest voorkomende beperkingen zijn onder meer:

1. Aanvullende complexiteiten

Voor het beheren van meerdere tenants op één resource is extra configuratie vereist. Dit omvat het onboarden van huurders, toegangscontrole, gebruikersauthenticatie en autorisatie. Gebrek aan kennis en ondersteuning kan leiden tot ongewenste resultaten, zoals het per ongeluk delen van gegevens of overhead van middelen.

Om dit aan te pakken zorgen een zorgvuldige planning en databaseondersteuning voor een veilige gebruikersomgeving.

2. Beveiligingsproblemen

Schadelijke toegang, onbedoelde verkeerde configuraties of kwetsbaarheden in de onderliggende infrastructuur kunnen leiden tot gedeelde gegevens tussen tenants. Als vangrail kunnen het implementeren van een zorgvuldig ontwerp, het uitvoeren van regelmatige audits en het opnemen van meerlaagse beveiligingsmaatregelen de algehele beveiliging versterken.

3. Prestatieknelpunten

Een hoger gebruik van resources door een tenant kan de prestaties van anderen vertragen. Gedeelde indexering heeft specifiek invloed op de zoekprestaties als gevolg van runtime-toestemmingscontroles om overeen te komen met de toegangslijst. Beheer en controle van resources, regelmatige updates en educatie van huurders zijn belangrijk om prestatieproblemen te verminderen.

4. Systeemstoring

Gepland onderhoud, hardwarestoringen en softwarefouten zijn van invloed op alle tenants wanneer ze een vergelijkbare infrastructuur delen. Dit leidt tot gegevens-, reputatie- en financiële verliezen. Regelmatige risicobeoordeling, kwaliteitsborging van de infrastructuur en tijdige back-up kunnen de negatieve impact van systeemstoringen minimaliseren.

Gebruiksscenario's van Multitenancy

Multitanency is nuttig in verschillende toepassingen, van aanbevelingssystemen voor e-commerce tot het trainen van grote machine learning-modellen (ML) in bedrijven. Enkele van de meest voorkomende gebruiksscenario's zijn:

1. Aanbevelingssystemen

Stel je een e-commerceplatform voor waar gebruikers zich kunnen aanmelden en hun winkelvoorkeuren kunnen opslaan. Een multitenantopstelling maakt gepersonaliseerde productaanbevelingen voor elke gebruiker mogelijk.

Op het e-commerceplatform kunnen alle huurders hun criteria instellen, zodat de aanbevelingssysteem: stuurt gepersonaliseerde productaanbevelingen naar eindgebruikers.

2. Enterprise applicaties

Grote softwareapplicaties die meerdere medewerkers en klanten bedienen, gebruiken voor alle gebruikers dezelfde database. Alle gebruikers kunnen hun gegevens uploaden en beheren en deze tegelijkertijd beschermen tegen anderen. Met Dropbox en HubSpot kunnen alle gebruikers bijvoorbeeld dezelfde bronnen delen, maar hun gegevens tegen elkaar beschermen.

3. Anomalie- en fraudedetectie

Multitenancy maakt de ontwikkeling van robuust mogelijk systemen voor fraudedetectie terwijl individuele gegevens veilig blijven. Bedrijven trainen modellen voor fraudedetectie op basis van hun geanonimiseerde gegevens en sturen alleen het getrainde model naar de gecentraliseerde database. Hierdoor kunnen ze hun gegevens veilig houden en tegelijkertijd bijdragen aan de ontwikkeling van fraudedetectiesystemen.

Bijvoorbeeld detectiesystemen voor creditcardfraude gebruiken ML voor verbeterde privacy en efficiëntie.

Wanneer wel en wanneer niet gebruiken? Multitenancy

Meerdere factoren dragen bij aan de beslissing om over te stappen op multitenancy, waaronder de prestaties van tenants, isolatievereisten en beveiligingsproblemen. Laten we hieronder in detail bespreken wanneer u wel en wanneer u multitenancy niet kunt gebruiken.

Wanneer moet u multitenancy gebruiken?

De volgende indicatoren maken multitenancy tot een goede match:

  1. Meerdere tenants hebben aparte omgevingen nodig.
  2. Huurders kunnen prestatieafwegingen accepteren.
  3. Kostenreductie is uw prioriteit.
  4. Gecentraliseerd huurderbeheer verbetert uw activiteiten.

Wanneer u geen multitenancy gebruikt

De beperkingen van multitenancy zorgen ervoor dat het niet geschikt is voor alle situaties. Een vectordatabase met meerdere tenants is niet geschikt voor u als u aan de volgende vereisten voldoet:

  1. Huurders bezitten zeer gevoelige gegevens met strikte beveiligingseisen.
  2. Een beperkt aantal huurders met een langzame groei.
  3. Tenants hebben speciale omgevingen nodig en kunnen prestatieverlies niet tolereren.
  4. Beperkte multitenant-expertise en mogelijkheden om met de toenemende complexiteit om te gaan.

Multitenancy introduceert extra schaalbaarheid en beheerbaarheid voor de vectordatabases. Indien correct geconfigureerd, bespaart multitenancy aanzienlijke kosten en middelen voor een organisatie.

Geïnteresseerd in meer AI-gerelateerde inhoud? Contact houden met verenigen.ai.