ืืื ื ืืืืืช ืืืืืืชืืช
ืืืืืื ืฉื ืฉืคื ืืืืื ืขื Scikit-learn: ืืืจืื ืืงืืฃ ื-Scikit-LLM

ืขื ืืื ืฉืืืื ืืืืืืช ืขืืืื ืืฉืคื ืืืชืืืืืืช ืฉื ืืืืืื ืืื ChatGPT ืขื ืืกืืจืช Scikit-learn ืืจื-ืชืืืืชืืช ืืื ืคืืฆื, Scikit-LLM ืืฆืืขื ืืจืกื ื ืืกืจ ืชืงืืื ืืืชืขืืงืืช ืืืืจืืืืืืช ืฉื ื ืชืื ืื ืืงืกืืืืืืื.
Scikit-LLM, ื ืืืฉ ืืืชืจ ืืจืฉืื ืฉืื ืืืืจ GitHub, ืืืืฆื ืฉืืืื ืฉื โ ืืืื ื ืืืืืืืชืืช ืืืชืงืืืช ืฉื ืืืืืื ืืฉืคื ืืืืื (LLMs) ืืื GPT-3.5 ืฉื OpenAI ืืืกืืืื ืืืืืืืชืืช ืืืฉืชืืฉ ืฉื Scikit-learn. ืืืืืช Python ืื, ืฉืชืืื ื ื ืืืืืื ืื ืืชืื ืืงืกื, ืืืคืืช ืขืืืื ืฉืคื ืืืขืืช ืืชืงืื ืื ืืืฉ ืืืขืื.
ืืื Scikit-LLM?
ืขืืืจ ืืื ืืืืืจืื ืืืื ืืช ืื ืืฃ ืฉื Scikit-learn, Scikit-LLM ืืจืืืฉ ืืื ืืชืงืืืืช ืืืขืืช. ืืื ืฉืืืจ ืขื ื-API ืืืืืจ, ืืืืคืฉืจ ืืืฉืชืืฉืื ืืืฉืชืืฉ ืืคืื ืงืฆืืืช ืืื .fit(), .fit_transform(), ื .predict()ืืืืืืช ืฉืื ืืฉืื ืืขืจืืืื ืืชืื ืฆืื ืืจ Sklearn ืืืืืื ืืช ืืืืืฉืืช ืฉืื, ืื ืฉืืืคื ืืืชื ืืืชืจืื ืขืืืจ ืืื ืืืขืื ืืื ืื ืืฉืคืจ ืืช ืคืจืืืงืื ืืืืืช ืืืืื ื ืฉืืื ืขื ืืื ืช ืฉืคื ืืชืงืืืช.
ืืืืืจ ืื ื ืืงืืจ ืืช Scikit-LLM, ืืื ืืืชืงื ืชื ืืขื ืืืืฉืื ืืืขืฉื ืฉืื ืืืฉืืืืช ื ืืชืื ืืงืกื ืฉืื ืืช. ืชืืืื ืืืฆื ืืืฆืืจ ืืกืืืื ืืงืกื ืืืืงืจืื ืืกืืืื ืืงืกื ืขื ืืจื ืืคืก, ืืชืขืืืงื ืืชืืื ืืช ืืชืงืืืืช ืืื ืืงืืืจืืืฆืื ืืกืืืื ืืงืกื.
Scikit-learn: ืืื ืืคืื ื ืฉื ืืืืืช ืืืื ื
ืืคื ื ืฉื ืฆืืื ืืชืื Scikit-LLM, ืืืื ื ืืืข ืืืกืืืืช ืฉืื - Scikit-learn. Scikit-learn, ืฉื ืืืืจ ืืขืืื ืืืืืื ืืืืฉืืืืช, ืืืืข ืืืืืช ืืืืืช ืืืืืืจืืชืืื ืืืงืืคื ืฉืื, ืืคืฉืืืช ืฉืื ืืืืืืืชืืืช ืืืฉืชืืฉ. Scikit-learn, ืืืืกื ืืืืื ืจืื ืฉื ืืฉืืืืช, ืืื ืืจืืจืกืื ืืขื ืืฉืืืืืช, ืืื ืืืื ืืืืขืืฃ ืขื ืืืขื ื ื ืชืื ืื ืจืืื.
Scikit-learn, ืฉื ืื ืชื ืขื ืืกืืก ืืกืคืจืืืช ืืืืขืืืช ืฉื ืคืืืชืื (NumPy, SciPy ื-Matplotlib), ืืืืืช ืืืืืช ืืืื ืืืจืฆืื ืฉืื ืขื ืืืืกื ืืช ืืืืขืืช ืฉื ืคืืืชืื ืืืืขืืืืชื ืขื ืืขืจืื NumPy ืืืืจืืฆืืช ืืืืืืช ืฉื SciPy.
ืืืกืืกื, Scikit-learn ืขืืกืงืช ืืืืืืืช ืืงืืืช ืฉืืืืฉ. ืืื ืงืฉืจ ืืืืืืจืืชื ืฉืชืืืจื, ืืฉืืืื ื ืฉืืจืื ืขืงืืืื - ืืืื ืืช ืืืืืงื, ืืฉืชืืฉื ืืฉืืืช 'ืืชืืื' ืขื ืื ืชืื ืื ืฉืืื, ืืืืืื 'ื ืืืื' ืื 'ืืจื ืกืคืืจืืฆืื' ืืื ืื ืฆื ืืช ืืืืื. ืคืฉืืืช ืื ืืฆืืฆืืช ืืช ืขืงืืืช ืืืืืื, ืื ืฉืืืคื ืืืชื ืื ืงืืืช ืืชืืื ืืืืืืืืช ืขืืืจ ืืื ืฉืืืฉืื ืืืืืืช ืืืื ื.
ืืืืจืช ืืกืืืื
ืืคื ื ืฉื ืฆืืื ืืคืจืืื, ืืฉืื ืืืืืืจ ืืช ืกืืืืช ืืขืืืื. ืขืืืจ ืืืืจ ืื, Google Colab ืชืืื ืืคืืืคืืจืื ืืืืขืืคืช, ืืืกืคืงืช ืกืืืื ื ืืืฉื ืืืืงื ืืืจืฆืช ืงืื Python.
ืึทืชืงึธื ึธื
%%capture !pip install scikit-llm watermark %load_ext watermark %watermark -a "your-username" -vmp scikit-llm
ืืฉืื ืืืืืจื ืฉื ืืคืชืืืช API
Scikit-LLM ืืืจืฉ ืืคืชื API ืฉื OpenAI ืืื ืืืฉืช ืืืืืื ืืฉืคื ืืืกืืกืืื.
from skllm.config import SKLLMConfig OPENAI_API_KEY = "sk-****" OPENAI_ORG_ID = "org-****" SKLLMConfig.set_openai_key(OPENAI_API_KEY) SKLLMConfig.set_openai_org(OPENAI_ORG_ID)
ืืกืืื GPT ืขื ืืคืก ืืจื
ืืฉืืืื ZeroShotGPTClassifier ืืื ืชืืื ื ืืืฆืืช ืืืคื ืฉื Scikit-LLM ืฉืืื ืคืช ืืช ืืืืืชื ืฉื ChatGPT ืืกืืื ืืงืกื ืขื ืกืื ืชืืืืืช ืชืืืืจืืืช, ืืื ืฆืืจื ืืืืืื ืืืื ืืกืืจืชื.
ืืืืื โโืกืคืจืืืช ืืืขืจืื ื ืชืื ืื
from skllm import ZeroShotGPTClassifier from skllm.datasets import get_classification_dataset X, y = get_classification_dataset()
ืืื ืช ืื ืชืื ืื
ืคืืฆืื ืื ืชืื ืื ืืชืช-ืงืืืฆืืช ืืืืื ืืืืืงื:
def training_data(data):
return data[:8] + data[10:18] + data[20:28]
def testing_data(data):
return data[8:10] + data[18:20] + data[28:30]
X_train, y_train = training_data(X), training_data(y)
X_test, y_test = testing_data(X), testing_data(y)
ืืืจืื ืืืืืื ืืืืืื
ืืืืจื ืืืืืื ืฉื ื-ZeroShotGPTClassifier:
clf = ZeroShotGPTClassifier(openai_model="gpt-3.5-turbo") clf.fit(X_train, y_train) predicted_labels = clf.predict(X_test)
ืืขืจืื
ืืขืจืืช ืืืฆืืขื ืืืืื:
from sklearn.metrics import accuracy_score
print(f"Accuracy: {accuracy_score(y_test, predicted_labels):.2f}")
ืกืืืื ืืงืกื ืขื Scikit-LLM
ืกืืืื ืืงืกื ืืื ืืืคืืื ืงืจืืื ืืชืืื ื-NLP, ื-Scikit-LLM ืจืืชื ืืช ืืืืืืชืื ืฉื GPT ืืชืืื ืื ืืืืฆืขืืช... GPTSummarizer ืืืืื. ืชืืื ื ืื ืืืืืช ืืืืืช ืืืืืช ืืืกืชืืืืช ืฉืื, ืืืืคืฉืจืช ืฉืืืืฉ ืื ืื ืืืื ืขืฆืืื ืืืฆืืจืช ืกืืืืืื ืืื ืืฉืื ืขืืืื ืืงืืื ืืืจืืืืช ืขืืืื ืจืืืืช ืืืชืจ.
ืืืฉืืืื ืฉื GPTSummarizer:
- ืกืืืื ืขืฆืืื: ืืฉืืืื
GPTSummarizerืืืื ืืืฆืืจ ืืืืคื ืขืฆืืื ืกืืืืืื ืชืืฆืืชืืื ืืืกืืืื ืืจืืืื, ืืืจ ืืขื ืขืจื ืจื ืื ืืชืื ืชืืื ืืืืจ ืื ืืืืืืฅ ืืืืข ืืคืชื ืืืืืืืช ืืืืืืช ืฉื ืืงืกื. - ืขืืืื ืืงืืื ืืคืขืืืืช ืืืจืืช: ืืืจืืืืช ืขืืืื ืืืืืืืช ืฉืืืื ืืจืืืื ืฉื ื ืืชืื ืืงืกื, ื-
GPTSummarizerื ืืชื ืืืฉืชืืฉ ืื ืืื ืืฆืืฆื ื ืชืื ื ืืงืกื. ืื ืืคืืืช ืืช ืขืืืก ืืืืฉืื ืืืคืฉื ืืช ืฉืืื ืื ืืชืื ืืืืื ืืืื ืืืื ืืืืข ืืืื ื.
ืืืฉืื ืกืืืื ืืงืกื:
ืชืืืื ืืืืฉืื ืฉื ืกืืืื ืืงืกื ื-Scikit-LLM ืืืื:
- ืืืื
GPTSummarizerืืืขืจื ืื ืชืื ืื ืืจืืืื ืื. - ืืฆืืจืช ืืืคืข ืฉื
GPTSummarizerืขื ืคืจืืืจืื ืืืืืจืื ืืืmax_wordsืืื ืืฉืืื ืืืืจื ืืกืืืื. - ืืืืช
fit_transformืฉืืื ืืืฆืืจืช ืกืืืืืื.
ืืฉืื ืืฆืืื ืื ื max_words ืืคืจืืืจ ืืฉืืฉ ืืงื ืื ืื ืืื ืืืืืื ื ืืงืฉื, ืืืืืื ืฉืกืืืืืื ืืฉืืจื ืขื ืงืืืจื ืืืืช ืืจืืืื ืืืืช, ืื ืื ืื ืืืจืืื ืืืขื ืืกืคืืจืช ืืืืืื ืฉืฆืืื ื.
ืืฉืืืืช ืจืืืืช ืืืชืจ ืฉื Scikit-LLM
ืืืืื ืืชืืื ืืช ืฉื Scikit-LLM, ืืืื ืกืืืื ืืงืกื, ืกืืืื, ืืงืืืจืืืฆืื, ืชืจืืื ืืืืืืช ืืืกืชืืืืช ืฉืื ืืืืคืื ืื ืชืื ืื ืื ืืชืืืืื, ืืืคืืื ืืืชื ืืืื ืืงืืฃ ืืืฉืืืืช ื ืืชืื ืืงืกื ืืืืื ืืช. ืืืืฉืืช ืืงืืืช ืฉืืืืฉ ืื ืืชืืืืืช ืื ืืืชืืืืื ืืื ืืื ืืกืื ืืชืืื ืืืื ื ืืืืืืืชืืช ืืืืืืช ืืืื ื.
ืืืฉืืืื ืคืืื ืฆืืืืืื:
- ื ืืชืื ืืฉืื ืืงืืืืช: ืกืืืื ืืฉืื ืืงืืืืช ืืงืืืืจืืืช ืืื ืืืืื, ืฉืืืื ืื ื ืืืจืื, ืฉืืืื ืืืืืื ืืฉืืคืืจื ืฉืืจืืช ืืงืืืืช ืื ืืกืืจืืืืืช ืคืืชืื ืืืฆืจืื.
- ืกืืืื ืืืืจื ืืืฉืืช: ืืืื ืืืืจื ืืืฉืืช ืื ืืฉืืื ืฉืื ืื ืืฆืืจื ืืื ืืช ืืืฉืืช ืืืชืืืืช ืืืฉืืช ืื ื ืืชืื ืืืืืช.
- ืชืจืืื ืฉืคื: ืชืจืืื ืืกืืืื ืขืืืจ ืคืขืืืืช ืจื-ืืืืืืืช ืื ืืฉืืืืฉ ืืืฉื.
- ืชืงืฆืืจ ืืืกืื: ืชืคืืกื ืืืืจื ืฉื ืืืืชื ืฉื ืืกืืืื ืืจืืืื ืื ืืฆืืจืช ืืจืกืืืช ืงืฆืจืืช ืืืชืจ ืืคืจืกืื.
ืืชืจืื ืืช ืฉื Scikit-LLM:
- ืืืืง: ืืขืืืืช ืืืืืช ืืืฉืืืืช ืืื ืกืืืื ืืกืืืื ืืงืกื ืืจืืช ืืคืก ืชืืฆืื.
- ืืืืจืืช: ืืชืืื ืืืฉืืืืช ืขืืืื ืืืื ืืืช ืืฉื ืืขืืืืชื.
- ืืืจืืืืช: ืืกืืื ืืืชืืืื ืขื ืืืืืืช ืืืืืืช ืฉื ืืงืกื, ืื ืฉืืืคื ืืืชื ืืืืืืื ืขืืืจ ืืืฉืืื ืืื ืืืื.
ืกืืืื: ืืืืืฅ Scikit-LLM ืื ืืชืื ืืงืกื ืืชืงืื
ืืกืืืื, Scikit-LLM ืืืืื ืืื ืจื ืขืืฆืื, ืจื-ืชืืืืชื ืืืืืืืชื ืืืฉืชืืฉ ืืชืืื ื ืืชืื ืืืงืกื. ืืืืืชื ืืฉืื ืืืืืื ืฉื ืฉืคื ืืืืื ืขื ืืจืืืืช ืขืืืื ืืกืืจืชืืืช ืฉื ืืืืืช ืืืื ื, ืืฉืืืื ืขื ืืืคืื ืืงืื ืคืชืื, ืืืคืืื ืืืชื ืื ืืก ืืขื ืขืจื ืขืืืจ ืืืงืจืื, ืืคืชืืื ืืขืกืงืื ืืืื. ืืื ืื ืืืืืจ ืืฉืืคืืจ ืฉืืจืืช ืืืงืืืืช, ื ืืชืื ืืืืืช ืืืฉืืช, ืืงืืช ืชืงืฉืืจืช ืจื-ืืฉืื ืืช ืื ืืืงืืง ืืืืข ืืืื ื ืืืกืืืื ื ืจืืืื, Scikit-LLM ืืฆืืข ืคืชืจืื ืืืง.












