AI-työkalut 101

Suurten kielimallien (LLM) seuranta MLflow:n avulla: täydellinen opas

Julkaistu Elokuu 5, 2024

Aayush Mittal Mittal

Large Language Models (LLM) -mallien monimutkaisuuden ja mittakaavan kasvaessa niiden suorituskyvyn, kokeilujen ja käyttöönottojen seuraaminen on entistä haastavampaa. Tässä tulee esiin MLflow – se tarjoaa kattavan alustan koneoppimismallien koko elinkaaren hallintaan, mukaan lukien LLM:t.

Tässä perusteellisessa oppaassa tutkimme, miten MLflow'ta voidaan hyödyntää LLM-ohjelmien seurannassa, arvioinnissa ja käyttöönotossa. Käsittelemme kaikkea ympäristön määrittämisestä edistyneisiin arviointitekniikoihin, ja matkan varrella on runsaasti koodiesimerkkejä ja parhaita käytäntöjä.

MLflow:n toiminnallisuus suurissa kielimalleissa (LLM)

MLvirtaus on tullut keskeiseksi työkaluksi koneoppimis- ja datatieteen yhteisössä, erityisesti koneoppimismallien elinkaaren hallinnassa. Suurten kielimallien (LLM) osalta MLflow tarjoaa vankan työkalupaketin, joka virtaviivaistaa merkittävästi näiden mallien kehittämisen, seurannan, arvioinnin ja käyttöönoton prosessia. Tässä on yleiskatsaus siitä, miten MLflow toimii LLM-tilassa ja mitä etuja se tarjoaa insinööreille ja datatieteilijöille.

LLM-vuorovaikutusten seuranta ja hallinta

MLflown LLM-seurantajärjestelmä on sen olemassa olevien seurantaominaisuuksien parannus, joka on räätälöity LLM:ien ainutlaatuisiin tarpeisiin. Se mahdollistaa mallien vuorovaikutusten kattavan seurannan, mukaan lukien seuraavat keskeiset näkökohdat:

parametrit: Kirjaa avain-arvo-parit, jotka yksityiskohtaisesti LLM:n syöttöparametrit, kuten mallikohtaiset parametrit, kuten top_k ja temperatureTämä tarjoaa kontekstin ja konfiguraation kullekin ajolle varmistaen, että kaikki mallin konfiguraation osa-alueet tallennetaan.
Metrics: Kvantitatiivinen mitta, joka antaa käsityksen LLM:n suorituskyvystä ja tarkkuudesta. Näitä voidaan päivittää dynaamisesti ajon edetessä, mikä tarjoaa reaaliaikaisia tai prosessin jälkeisiä näkemyksiä.
Ennusteet: Sieppaa LLM:lle lähetetyt syötteet ja vastaavat ulostulot, jotka tallennetaan artefakteina jäsenneltyyn muotoon, jotta ne on helppo hakea ja analysoida.
EsineetEnnusteiden lisäksi MLflow voi tallentaa erilaisia tulostiedostoja, kuten visualisointeja, sarjoitettuja malleja ja strukturoituja datatiedostoja, mikä mahdollistaa mallin suorituskyvyn yksityiskohtaisen dokumentoinnin ja analysoinnin.

Tämä jäsennelty lähestymistapa varmistaa, että kaikki vuorovaikutus LLM:n kanssa tallennetaan huolellisesti, mikä tarjoaa kattavan linjan ja laadun seurannan tekstiä luoville malleille.

LLM:ien arviointi

LLM-yritysten arviointi on ainutlaatuisia haasteita niiden luovan luonteen ja yhtenäisen totuuden puutteen vuoksi. MLflow yksinkertaistaa tätä erityisillä arviointityökaluilla, jotka on suunniteltu LLM:ille. Keskeisiä ominaisuuksia ovat:

Monipuolinen mallin arviointi: Tukee erityyppisten LLM:ien arviointia, olipa kyseessä MLflow pyfunc -malli, rekisteröityyn MLflow-malliin osoittava URI tai mikä tahansa mallianne edustava Python-kutsuttava tiedosto.
Kattavat mittarit: Tarjoaa joukon mittareita, jotka on räätälöity LLM-arviointiin, mukaan lukien sekä SaaS-malleista riippuvat mittarit (esim. vastauksen osuvuus) että toimintopohjaiset mittaukset (esim. ROUGE, Flesch Kincaid).
Ennalta määritetyt mittarikokoelmat: Käyttötapauksesta riippuen, kuten kysymykseen vastaaminen tai tekstin yhteenveto, MLflow tarjoaa ennalta määritettyjä mittareita arviointiprosessin yksinkertaistamiseksi.
Muokatun mittarin luominen: Antaa käyttäjien määrittää ja ottaa käyttöön mukautettuja mittareita, jotka sopivat erityisiin arviointitarpeisiin, mikä parantaa mallin arvioinnin joustavuutta ja syvyyttä.
Arviointi staattisilla tietojoukoilla: Mahdollistaa staattisten tietojoukkojen arvioinnin ilman mallin määrittämistä, mikä on hyödyllistä nopeassa arvioinnissa ilman mallin päättelyn suorittamista uudelleen.

Käyttöönotto ja integrointi

MLflow tukee myös LLM:ien saumatonta käyttöönottoa ja integrointia:

MLflow Deployments Server: Toimii yhtenäisenä käyttöliittymänä vuorovaikutuksessa useiden LLM-palveluntarjoajien kanssa. Se yksinkertaistaa integraatioita, hallitsee tunnistetietoja turvallisesti ja tarjoaa yhtenäisen API-kokemuksen. Tämä palvelin tukee useita suosittujen SaaS-toimittajien perusmalleja sekä itseisännöityjä malleja.
Yhtenäinen päätepiste: Helpottaa helppoa vaihtamista palveluntarjoajien välillä ilman koodin muutoksia, minimoi seisokkeja ja lisää joustavuutta.
Integroitu tulosnäkymä: Tarjoaa kattavat arviointitulokset, joihin pääsee suoraan koodista tai MLflow-käyttöliittymän kautta yksityiskohtaista analyysiä varten.

MLflow on kattava valikoima työkaluja ja integraatioita, mikä tekee siitä korvaamattoman hyödyn kehittyneiden NLP-mallien parissa työskenteleville insinööreille ja datatieteilijöille.

Ympäristösi luominen

Ennen kuin syvennymme LLM-ohjelmien seurantaan MLflow'n avulla, määritetään kehitysympäristömme. Meidän on asennettava MLflow ja useita muita keskeisiä kirjastoja:

pip install mlflow&gt;=2.8.1
pip install openai
pip install chromadb==0.4.15
pip install langchain==0.0.348
pip install tiktoken
pip install 'mlflow[genai]'
pip install databricks-sdk --upgrade

Asennuksen jälkeen on hyvä käytäntö käynnistää Python-ympäristö uudelleen varmistaaksesi, että kaikki kirjastot latautuvat oikein. Jupyter-muistikirjassa voit käyttää:

import mlflow
import chromadb

print(f"MLflow version: {mlflow.__version__}")
print(f"ChromaDB version: {chromadb.__version__}")

Tämä vahvistaa käyttämiemme avainkirjastojen versiot.

MLflow'n LLM-seurantaominaisuuksien ymmärtäminen

MLflow'n LLM-seurantajärjestelmä hyödyntää olemassa olevia seurantaominaisuuksia ja lisää ominaisuuksia, jotka on erityisesti suunniteltu LLM-ohjelmien ainutlaatuisia puolia varten. Tarkastellaanpa sen keskeisiä komponentteja:

Ajoja ja kokeiluja

MLflow:ssa "ajo" edustaa mallikoodisi yhtä suoritusta, kun taas "koe" on kokoelma toisiinsa liittyviä ajoja. LLM:issä ajo voi edustaa yhtä kyselyä tai mallin käsittelemien kehotteiden erää.

Tärkeimmät seurantakomponentit

parametrit: Nämä ovat LLM:n tulomäärityksiä, kuten lämpötila, top_k tai max_tokens. Voit kirjata nämä käyttämällä mlflow.log_param() or mlflow.log_params().
MetricsLLM-tutkimuksesi suorituskyvyn määrälliset mittarit, kuten tarkkuus, latenssi tai mukautetut pisteet. Käytä mlflow.log_metric() or mlflow.log_metrics() seurata näitä.
EnnusteetLLM-mallien kohdalla on ratkaisevan tärkeää kirjata lokiin sekä syötekehotteet että mallin tuotokset. MLflow tallentaa nämä artefaktteina CSV-muodossa käyttäen mlflow.log_table().
Esineet: Kaikki lisätiedostot tai -tiedot, jotka liittyvät LLM-ajoon, kuten mallien tarkistuspisteet, visualisoinnit tai tietojoukon näytteet. Käyttää mlflow.log_artifact() säilyttää näitä.

Katsotaanpa perusesimerkkiä LLM-ajon kirjaamisesta:

Tässä esimerkissä esitetään lokiparametrit, mittarit ja syöttö/tulostus taulukon artefaktina.

import mlflow
import openai

def query_llm(prompt, max_tokens=100):
    response = openai.Completion.create(
        engine="text-davinci-002",
        prompt=prompt,
        max_tokens=max_tokens
    )
    return response.choices[0].text.strip()

with mlflow.start_run():
    prompt = "Explain the concept of machine learning in simple terms."
    
    # Log parameters
    mlflow.log_param("model", "text-davinci-002")
    mlflow.log_param("max_tokens", 100)
    
    # Query the LLM and log the result
    result = query_llm(prompt)
    mlflow.log_metric("response_length", len(result))
    
    # Log the prompt and response
    mlflow.log_table("prompt_responses", {"prompt": [prompt], "response": [result]})
    
    print(f"Response: {result}")

LLM:ien käyttöönotto MLflow:n avulla

MLflow tarjoaa tehokkaita ominaisuuksia LLM-mallien käyttöönottoon, mikä helpottaa malliesi tarjoamista tuotantoympäristöissä. Katsotaanpa, miten LLM otetaan käyttöön MLflow'n käyttöönotto-ominaisuuksien avulla.

Päätepisteen luominen

Ensin luomme päätepisteen LLM:llemme käyttämällä MLflow'n käyttöönottoasiakasohjelmaa:

import mlflow
from mlflow.deployments import get_deploy_client

# Initialize the deployment client
client = get_deploy_client("databricks")

# Define the endpoint configuration
endpoint_name = "llm-endpoint"
endpoint_config = {
    "served_entities": [{
        "name": "gpt-model",
        "external_model": {
            "name": "gpt-3.5-turbo",
            "provider": "openai",
            "task": "llm/v1/completions",
            "openai_config": {
                "openai_api_type": "azure",
                "openai_api_key": "{{secrets/scope/openai_api_key}}",
                "openai_api_base": "{{secrets/scope/openai_api_base}}",
                "openai_deployment_name": "gpt-35-turbo",
                "openai_api_version": "2023-05-15",
            },
        },
    }],
}

# Create the endpoint
client.create_endpoint(name=endpoint_name, config=endpoint_config)

Tämä koodi määrittää päätepisteen GPT-3.5-turbo-mallille käyttämällä Azure OpenAI:ta. Huomaa Databricks-salaisuuksien käyttö suojatussa API-avainten hallinnassa.

Päätepisteen testaus

Kun päätepiste on luotu, voimme testata sitä:

<div class="relative flex flex-col rounded-lg">

response = client.predict(
endpoint=endpoint_name,
inputs={"prompt": "Explain the concept of neural networks briefly.","max_tokens": 100,},)

print(response)

Tämä lähettää kehotteen käyttöönotettuun malliimme ja palauttaa luodun vastauksen.

LLM:ien arviointi MLflow:lla

Arviointi on ratkaisevan tärkeää LLM:n suorituskyvyn ja käyttäytymisen ymmärtämiseksi. MLflow tarjoaa kattavat työkalut LLM:ien arviointiin, mukaan lukien sekä sisäänrakennetut että mukautetut mittaukset.

LLM:n valmistelu arviointia varten

Voit arvioida LLM:si kanssa mlflow.evaluate(), mallisi on oltava jossakin seuraavista muodoista:

An mlflow.pyfunc.PyFuncModel ilmentymä tai lokiin kirjattuun MLflow-malliin osoittava URI.
Python-funktio, joka ottaa merkkijonon syötteitä ja tulostaa yhden merkkijonon.
MLflow Deployments -päätepisteen URI.
Asettaa model=None ja sisällyttää mallin tulokset arviointitietoihin.

Katsotaanpa esimerkkiä, jossa käytetään lokikirjattua MLflow-mallia:

import mlflow
import openai

with mlflow.start_run():
    system_prompt = "Answer the following question concisely."
    logged_model_info = mlflow.openai.log_model(
        model="gpt-3.5-turbo",
        task=openai.chat.completions,
        artifact_path="model",
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": "{question}"},
        ],
    )

# Prepare evaluation data
eval_data = pd.DataFrame({
    "question": ["What is machine learning?", "Explain neural networks."],
    "ground_truth": [
        "Machine learning is a subset of AI that enables systems to learn and improve from experience without explicit programming.",
        "Neural networks are computing systems inspired by biological neural networks, consisting of interconnected nodes that process and transmit information."
    ]
})

# Evaluate the model
results = mlflow.evaluate(
    logged_model_info.model_uri,
    eval_data,
    targets="ground_truth",
    model_type="question-answering",
)

print(f"Evaluation metrics: {results.metrics}")

Tässä esimerkissä kirjataan OpenAI-malli lokiin, valmistelee arviointitiedot ja arvioidaan sitten malli MLflow'n sisäänrakennettujen mittareiden avulla kysymysten vastaustehtäviä varten.

Muokatut arviointitiedot

MLflow'n avulla voit määrittää mukautettuja mittareita LLM-arviointia varten. Tässä on esimerkki mukautetun mittarin luomisesta vastausten ammattimaisuuden arvioimiseksi:

from mlflow.metrics.genai import EvaluationExample, make_genai_metric

professionalism = make_genai_metric(
    name="professionalism",
    definition="Measure of formal and appropriate communication style.",
    grading_prompt=(
        "Score the professionalism of the answer on a scale of 0-4:\n"
        "0: Extremely casual or inappropriate\n"
        "1: Casual but respectful\n"
        "2: Moderately formal\n"
        "3: Professional and appropriate\n"
        "4: Highly formal and expertly crafted"
    ),
    examples=[
        EvaluationExample(
            input="What is MLflow?",
            output="MLflow is like your friendly neighborhood toolkit for managing ML projects. It's super cool!",
            score=1,
            justification="The response is casual and uses informal language."
        ),
        EvaluationExample(
            input="What is MLflow?",
            output="MLflow is an open-source platform for the machine learning lifecycle, including experimentation, reproducibility, and deployment.",
            score=4,
            justification="The response is formal, concise, and professionally worded."
        )
    ],
    model="openai:/gpt-3.5-turbo-16k",
    parameters={"temperature": 0.0},
    aggregations=["mean", "variance"],
    greater_is_better=True,
)

# Use the custom metric in evaluation
results = mlflow.evaluate(
    logged_model_info.model_uri,
    eval_data,
    targets="ground_truth",
    model_type="question-answering",
    extra_metrics=[professionalism]
)

print(f"Professionalism score: {results.metrics['professionalism_mean']}")

Tämä mukautettu mittari käyttää GPT-3.5-turboa vastausten ammattimaisuuden arvioimiseen, mikä osoittaa, kuinka voit hyödyntää LLM:itä itse arvioinnissa.

Kehittyneet LLM-arviointitekniikat

LLM-tieteiden kehittyessä myös niiden arviointitekniikat kehittyvät. Tutustutaanpa joihinkin edistyneisiin arviointimenetelmiin MLflow'n avulla.

Retrieval-Augmented Generation (RAG) -arviointi

RAG-järjestelmät yhdistävät hakupohjaisten ja generatiivisten mallien tehon. RAG-järjestelmien arviointi edellyttää sekä haku- että generointikomponenttien arviointia. Näin voit määrittää RAG-järjestelmän ja arvioida sitä MLflow'n avulla:

from langchain.document_loaders import WebBaseLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# Load and preprocess documents
loader = WebBaseLoader(["https://mlflow.org/docs/latest/index.html"])
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# Create vector store
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)

# Create RAG chain
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(),
    return_source_documents=True
)

# Evaluation function
def evaluate_rag(question):
    result = qa_chain({"query": question})
    return result["result"], [doc.page_content for doc in result["source_documents"]]

# Prepare evaluation data
eval_questions = [
    "What is MLflow?",
    "How does MLflow handle experiment tracking?",
    "What are the main components of MLflow?"
]

# Evaluate using MLflow
with mlflow.start_run():
    for question in eval_questions:
        answer, sources = evaluate_rag(question)
        
        mlflow.log_param(f"question", question)
        mlflow.log_metric("num_sources", len(sources))
        mlflow.log_text(answer, f"answer_{question}.txt")
        
        for i, source in enumerate(sources):
            mlflow.log_text(source, f"source_{question}_{i}.txt")

    # Log custom metrics
    mlflow.log_metric("avg_sources_per_question", sum(len(evaluate_rag(q)[1]) for q in eval_questions) / len(eval_questions))

Tämä esimerkki määrittää RAG-järjestelmän LangChainilla ja Chromalla ja arvioi sen sitten kirjaamalla kysymykset, vastaukset, haetut lähteet ja mukautetut tiedot MLflow:hon.

Chunking strategian arviointi

Asiakirjojen ryhmittelytapa voi vaikuttaa merkittävästi RAG:n suorituskykyyn. MLflow voi auttaa sinua arvioimaan erilaisia paloittelustrategioita:

import mlflow
from langchain.text_splitter import CharacterTextSplitter, TokenTextSplitter

def evaluate_chunking_strategy(documents, chunk_size, chunk_overlap, splitter_class):
    splitter = splitter_class(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
    chunks = splitter.split_documents(documents)
    
    with mlflow.start_run():
        mlflow.log_param("chunk_size", chunk_size)
        mlflow.log_param("chunk_overlap", chunk_overlap)
        mlflow.log_param("splitter_class", splitter_class.__name__)
        
        mlflow.log_metric("num_chunks", len(chunks))
        mlflow.log_metric("avg_chunk_length", sum(len(chunk.page_content) for chunk in chunks) / len(chunks))
        
        # Evaluate retrieval performance (simplified)
        correct_retrievals = sum(1 for _ in range(100) if simulate_retrieval(chunks))
        mlflow.log_metric("retrieval_accuracy", correct_retrievals / 100)

# Evaluate different strategies
for chunk_size in [500, 1000, 1500]:
    for chunk_overlap in [0, 50, 100]:
        for splitter_class in [CharacterTextSplitter, TokenTextSplitter]:
            evaluate_chunking_strategy(documents, chunk_size, chunk_overlap, splitter_class)

# Compare results
best_run = mlflow.search_runs(order_by=["metrics.retrieval_accuracy DESC"]).iloc[0]
print(f"Best chunking strategy: {best_run['params.splitter_class']} with size {best_run['params.chunk_size']} and overlap {best_run['params.chunk_overlap']}")

Tämä komentosarja arvioi eri osien kokojen, päällekkäisyyksien ja jakomenetelmien yhdistelmiä ja kirjaa tulokset MLflow-tiedostoon vertailun helpottamiseksi.

LLM-arviointitulosten visualisointi

MLflow tarjoaa erilaisia tapoja visualisoida LLM-arvioinnin tulokset. Tässä on joitain tekniikoita:

MLflow-käyttöliittymän käyttäminen

Arviointien suorittamisen jälkeen voit käyttää MLflow-käyttöliittymää tulosten visualisointiin:

Käynnistä MLflow-käyttöliittymä: mlflow ui
Avaa verkkoselain ja siirry kohtaan http://localhost:5000
Valitse kokeilusi ja suorita, jotta voit tarkastella mittareita, parametreja ja artefakteja

Mukautetut visualisoinnit

Voit luoda mukautettuja visualisointeja arviointituloksista käyttämällä kirjastoja, kuten Matplotlib tai Plotly, ja kirjata ne sitten artefakteina:

 
import matplotlib.pyplot as plt
import mlflow

def plot_metric_comparison(metric_name, run_ids):
    plt.figure(figsize=(10, 6))
    for run_id in run_ids:
        run = mlflow.get_run(run_id)
        metric_values = mlflow.get_metric_history(run_id, metric_name)
        plt.plot([m.step for m in metric_values], [m.value for m in metric_values], label=run.data.tags.get("mlflow.runName", run_id))
    
    plt.title(f"Comparison of {metric_name}")
    plt.xlabel("Step")
    plt.ylabel(metric_name)
    plt.legend()
    
    # Save and log the plot
    plt.savefig(f"{metric_name}_comparison.png")
    mlflow.log_artifact(f"{metric_name}_comparison.png")

# Usage
with mlflow.start_run():
    plot_metric_comparison("answer_relevance", ["run_id_1", "run_id_2", "run_id_3"])

Tämä toiminto luo viivakaavion, jossa verrataan tiettyä metriikkaa useiden ajon aikana, ja kirjaa sen artefaktina.

Vaihtoehtoja avoimen lähdekoodin MLflow:lle

Avoimen lähdekoodin ja hallitut MLOps-alustat

https://valohai.com/managed-vs-open-source-mlops/

Avoimelle lähdekoodille on monia vaihtoehtoja MLvirtaus koneoppimisen työnkulkujen hallintaan, joista jokainen tarjoaa ainutlaatuisia ominaisuuksia ja integraatioita.

Databricksin hallinnoima MLflow

Hallinnoi MLflow, isännöi Tietokannat, tarjoaa avoimen lähdekoodin MLflow'n ydintoiminnot, mutta lisäetuja, kuten saumattoman integroinnin Databricksin ekosysteemiin, edistyneet tietoturvaominaisuudet ja hallitun infrastruktuurin. Tämä tekee siitä erinomaisen valinnan organisaatioille, jotka tarvitsevat vankkaa tietoturvaa ja skaalautuvuutta.

Azure-koneoppiminen

Azure-koneoppiminen tarjoaa kokonaisvaltaisen koneoppimisratkaisun Microsoftin Azure-pilvialustalla. Se on yhteensopiva MLflow-komponenttien, kuten mallirekisterin ja kokeiluseurannan, kanssa, vaikka se ei perustukaan MLflow'hun.

Omat ML-alustat

Useat yritykset tarjoavat hallittuja ML-tuotteita erilaisilla ominaisuuksilla:

neptune.ai: Keskittyy kokeiden seurantaan ja mallien hallintaan.
Painot ja painotukset: Tarjoaa laajan kokeilun seurannan, tietojoukon versioinnin ja yhteistyötyökalut.
Komeetta ML: Tarjoaa kokeiden seurannan, mallituotannon seurannan ja tietojen kirjaamisen.
Valohai: Erikoistunut koneoppimisputkistoihin ja orkestrointiin.

meta virtaus

meta virtausNetflixin kehittämä avoimen lähdekoodin kehys, joka on suunniteltu järjestämään datatyönkulkuja ja ML-putkistoja. Vaikka se on erinomainen suurten käyttöönottojen hallinnassa, siitä puuttuu kattavat kokeilujen seuranta- ja mallinhallintaominaisuudet verrattuna MLflow:hon.

Amazon SageMaker ja Googlen Vertex AI

molemmat Amazon Sage Maker ja Googlen Vertex AI tarjoavat päästä päähän MLOps-ratkaisuja, jotka on integroitu omiin pilvialustaan. Nämä palvelut tarjoavat vankkoja työkaluja koneoppimismallien rakentamiseen, koulutukseen ja käyttöönottoon mittakaavassa.

Yksityiskohtainen vertailu

Hallittu MLflow vs. avoimen lähdekoodin MLflow

Databricksin hallinnoima MLflow tarjoaa useita etuja avoimeen lähdekoodiin verrattuna, mukaan lukien:

Asennus ja käyttöönotto: Saumaton integrointi Databricksin kanssa vähentää asennusaikaa ja vaivaa.
skaalautuvuus: Pystyy käsittelemään suuria koneoppimiskuormia helposti.
Turvallisuus ja hallinta: Käyttövalmiit suojausominaisuudet, kuten roolipohjainen pääsynhallinta (RBAC) ja tietojen salaus.
Integraatio: Syvä integrointi Databricksin palveluihin, mikä parantaa yhteentoimivuutta ja toimivuutta.
Tietojen tallennus ja varmuuskopiointi: Automaattiset varmuuskopiointistrategiat varmistavat tietojen turvallisuuden ja luotettavuuden.
Hinta: Käyttäjät maksavat alustasta, tallennustilasta ja laskentaresursseista.
Tuki ja ylläpito: Databricksin tarjoama omistettu tuki ja ylläpito.

Yhteenveto

Suurten kielimallien seuranta MLflow:lla tarjoaa vankan kehyksen LLM-kehityksen, arvioinnin ja käyttöönoton monimutkaisuuden hallintaan. Noudattamalla parhaita käytäntöjä ja hyödyntämällä tässä oppaassa esitettyjä edistyneitä ominaisuuksia voit luoda organisoidumpia, toistettavia ja oivaltavampia LLM-kokeita.

Muista, että LLM-ala kehittyy nopeasti ja uusia arviointi- ja seurantatekniikoita ilmaantuu jatkuvasti. Pysy ajan tasalla uusimpien MLflow-julkaisujen ja LLM-tutkimuksen kanssa, jotta voit jatkuvasti tarkentaa seuranta- ja arviointiprosessejasi.

Kun sovellat näitä tekniikoita projekteissasi, kehität syvempää ymmärrystä oikeustieteen maisteriesi käyttäytymisestä ja suorituskyvystä, mikä johtaa tehokkaampiin ja luotettavampiin kielimalleihin.

Seuraavaksi

TikTok esittelee Boximator for Motion Control

Älä missaa

Mistral 2 ja Mistral NeMo: Kattava opas uusimpaan Pariisista tulevaan LLM:ään

Aayush Mittal

Olen viettänyt viimeiset viisi vuotta uppoutuen koneoppimisen ja syväoppimisen kiehtovaan maailmaan. Intohimoni ja asiantuntemukseni ovat saaneet minut osallistumaan yli 50:een erilaiseen ohjelmistosuunnitteluprojektiin keskittyen erityisesti tekoälyyn/ML:ään. Jatkuva uteliaisuuteni on myös vetänyt minut kohti luonnollisen kielen käsittelyä, alaa, jota olen innokas tutkimaan lisää.

Unite.AI