Trí tuệ nhân tạo

Các Mẫu Thiết Kế trong Python cho Kỹ Sư Trí Tuệ Nhân Tạo và LLM: Hướng Dẫn Thực Tiễn

Published November 25, 2024

Updated April 27, 2026

Aayush Mittal Mittal

Design Patterns in Python for AI and LLM Engineers: A Practical Guide

Với tư cách là kỹ sư trí tuệ nhân tạo, việc tạo ra mã sạch, hiệu quả và có thể bảo trì là rất quan trọng, đặc biệt khi xây dựng các hệ thống phức tạp.

Các mẫu thiết kế là các giải pháp có thể tái sử dụng cho các vấn đề chung trong thiết kế phần mềm. Đối với kỹ sư trí tuệ nhân tạo và mô hình ngôn ngữ lớn (LLM), các mẫu thiết kế giúp xây dựng các hệ thống mạnh mẽ, có thể mở rộng và bảo trì, xử lý các công việc phức tạp một cách hiệu quả. Bài viết này sẽ đi sâu vào các mẫu thiết kế trong Python, tập trung vào sự liên quan của chúng trong các hệ thống trí tuệ nhân tạo và dựa trên LLM. Tôi sẽ giải thích từng mẫu với các ví dụ sử dụng thực tế trong trí tuệ nhân tạo và các đoạn mã Python.

Hãy cùng khám phá một số mẫu thiết kế chính đặc biệt hữu ích trong các ngữ cảnh trí tuệ nhân tạo và học máy, cùng với các ví dụ Python.

Tại Sao Các Mẫu Thiết Kế Lại Quan Trọng Đối Với Kỹ Sư Trí Tuệ Nhân Tạo

Các hệ thống trí tuệ nhân tạo thường liên quan đến:

Tạo đối tượng phức tạp (ví dụ: tải mô hình, đường ống xử lý dữ liệu).
Quản lý tương tác giữa các thành phần (ví dụ: suy luận mô hình, cập nhật thời gian thực).
Xử lý khả năng mở rộng, bảo trì và linh hoạt cho các yêu cầu thay đổi.

Các mẫu thiết kế giải quyết những thách thức này, cung cấp một cấu trúc rõ ràng và giảm các sửa đổi tùy tiện. Chúng thuộc ba loại chính:

Creational Patterns: Tập trung vào việc tạo đối tượng. (Singleton, Factory, Builder)
Structural Patterns: Tổ chức các mối quan hệ giữa các đối tượng. (Adapter, Decorator)
Behavioral Patterns: Quản lý giao tiếp giữa các đối tượng. (Strategy, Observer)

1. Mẫu Singleton

Mẫu Singleton đảm bảo một lớp chỉ có một thể hiện và cung cấp một điểm truy cập toàn cầu vào thể hiện đó. Điều này đặc biệt có giá trị trong các công việc trí tuệ nhân tạo, nơi các tài nguyên được chia sẻ – như cài đặt cấu hình, hệ thống ghi nhật ký hoặc thể hiện mô hình – phải được quản lý nhất quán mà không bị trùng lặp.

Khi Nào Sử Dụng

Quản lý cấu hình toàn cầu (ví dụ: siêu tham số mô hình).
Chia sẻ tài nguyên trên nhiều luồng hoặc tiến trình (ví dụ: bộ nhớ GPU).
Đảm bảo truy cập nhất quán vào một động cơ suy luận duy nhất hoặc kết nối cơ sở dữ liệu.

Triển Khai

Dưới đây là cách triển khai mẫu Singleton trong Python để quản lý cấu hình cho một mô hình trí tuệ nhân tạo:

class ModelConfig:
"""Lớp Singleton để quản lý cấu hình mô hình toàn cầu."""
_instance = None # Biến lớp để lưu thể hiện Singleton

def __new__(cls, *args, **kwargs):
if not cls._instance:
# Tạo một thể hiện mới nếu không tồn tại
cls._instance = super().__new__(cls)
cls._instance.settings = {} # Khởi tạo từ điển cấu hình
return cls._instance

def set(self, key, value):
"""Thiết lập một cặp khóa-giá trị cấu hình."""
self.settings[key] = value

def get(self, key):
"""Lấy giá trị cấu hình theo khóa."""
return self.settings.get(key)

# Ví dụ sử dụng
config1 = ModelConfig()
config1.set("model_name", "GPT-4")
config1.set("batch_size", 32)

# Truy cập vào cùng một thể hiện
config2 = ModelConfig()
print(config2.get("model_name")) # Đầu ra: GPT-4
print(config2.get("batch_size")) # Đầu ra: 32
print(config1 is config2) # Đầu ra: True (cả hai đều là cùng một thể hiện)

Giải Thích

Phương Thức __new__: Điều này đảm bảo chỉ một thể hiện của lớp được tạo. Nếu một thể hiện đã tồn tại, nó trả về thể hiện hiện có.
Trạng Thái Chia Sẻ: Cả config1 và config2 đều trỏ đến cùng một thể hiện, làm cho tất cả các cấu hình đều có thể truy cập toàn cầu và nhất quán.
Trường Hợp Sử Dụng Trí Tuệ Nhân Tạo: Sử dụng mẫu này để quản lý các cài đặt toàn cầu như đường dẫn đến tập dữ liệu, cấu hình ghi nhật ký hoặc biến môi trường.

2. Mẫu Factory

Mẫu Factory cung cấp một cách để ủy quyền việc tạo đối tượng cho các lớp con hoặc phương thức nhà máy chuyên dụng. Trong các hệ thống trí tuệ nhân tạo, mẫu này lý tưởng để tạo động các loại mô hình, bộ nạp dữ liệu hoặc đường ống khác nhau dựa trên ngữ cảnh.

Khi Nào Sử Dụng

Tạo mô hình động dựa trên đầu vào người dùng hoặc yêu cầu nhiệm vụ.
Quản lý logic tạo đối tượng phức tạp (ví dụ: đường ống xử lý dữ liệu nhiều bước).
Ngắt việc khởi tạo đối tượng khỏi phần còn lại của hệ thống để cải thiện tính linh hoạt.

Triển Khai

Hãy xây dựng một Nhà máy để tạo mô hình cho các nhiệm vụ trí tuệ nhân tạo khác nhau, như phân loại văn bản, tóm tắt và dịch:

class BaseModel:
"""Lớp cơ sở抽象 cho mô hình trí tuệ nhân tạo."""
def predict(self, data):
raise NotImplementedError("Các lớp con phải triển khai phương thức `predict`")

class TextClassificationModel(BaseModel):
def predict(self, data):
return f"Phân loại văn bản: {data}"

class SummarizationModel(BaseModel):
def predict(self, data):
return f"Tóm tắt văn bản: {data}"

class TranslationModel(BaseModel):
def predict(self, data):
return f"Dịch văn bản: {data}"

class ModelFactory:
"""Lớp Nhà máy để tạo mô hình trí tuệ nhân tạo động."""
@staticmethod
def create_model(task_type):
"""Phương thức nhà máy để tạo mô hình dựa trên loại nhiệm vụ."""
task_mapping = {
"classification": TextClassificationModel,
"summarization": SummarizationModel,
"translation": TranslationModel,
}
model_class = task_mapping.get(task_type)
if not model_class:
raise ValueError(f"Loại nhiệm vụ không biết: {task_type}")
return model_class()

# Ví dụ sử dụng
task = "classification"
model = ModelFactory.create_model(task)
print(model.predict("Trí tuệ nhân tạo sẽ thay đổi thế giới!"))
# Đầu ra: Phân loại văn bản: Trí tuệ nhân tạo sẽ thay đổi thế giới!

Giải Thích

Lớp Cơ Sở: Lớp BaseModel định nghĩa giao diện (predict) mà tất cả các lớp con phải triển khai, đảm bảo tính nhất quán.
Logic Nhà Máy: Lớp ModelFactory chọn động lớp phù hợp dựa trên loại nhiệm vụ và tạo một thể hiện.
Tính Mở Rộng: Thêm một loại mô hình mới là khá đơn giản – chỉ cần triển khai một lớp con mới và cập nhật ánh xạ nhiệm vụ của nhà máy.

Trường Hợp Sử Dụng Trí Tuệ Nhân Tạo

Hãy tưởng tượng bạn đang thiết kế một hệ thống chọn một mô hình LLM khác nhau (ví dụ: BERT, GPT hoặc T5) dựa trên nhiệm vụ. Mẫu Factory làm cho việc mở rộng hệ thống trở nên dễ dàng khi các mô hình mới trở nên có sẵn mà không cần sửa đổi mã hiện có.

3. Mẫu Builder

Mẫu Builder tách việc xây dựng một đối tượng phức tạp khỏi biểu diễn của nó. Mẫu này hữu ích khi một đối tượng liên quan đến nhiều bước để khởi tạo hoặc cấu hình.

Khi Nào Sử Dụng

Xây dựng đường ống nhiều bước (ví dụ: xử lý dữ liệu trước).
Quản lý cấu hình cho các thí nghiệm hoặc đào tạo mô hình.
Tạo đối tượng yêu cầu nhiều tham số, đảm bảo tính dễ đọc và bảo trì.

Triển Khai

Dưới đây là cách sử dụng mẫu Builder để tạo một đường ống xử lý dữ liệu:

class DataPipeline:
"""Lớp Xây Dựng để xây dựng đường ống xử lý dữ liệu."""
def __init__(self):
self.steps = []

def add_step(self, step_function):
"""Thêm một bước xử lý vào đường ống."""
self.steps.append(step_function)
return self # Trả về self để cho phép chuỗi phương thức

def run(self, data):
"""Chạy tất cả các bước trong đường ống."""
for step in self.steps:
data = step(data)
return data

# Ví dụ sử dụng
pipeline = DataPipeline()
pipeline.add_step(lambda x: x.strip()) # Bước 1: Loại bỏ khoảng trắng
pipeline.add_step(lambda x: x.lower()) # Bước 2: Chuyển đổi thành chữ thường
pipeline.add_step(lambda x: x.replace(".", "")) # Bước 3: Loại bỏ dấu chấm

data_xu_ly = pipeline.run(" Chào Thế Giới. ")
print(data_xu_ly) # Đầu ra: chào thế giới

Giải Thích

Phương Thức Chuỗi: Phương thức add_step cho phép chuỗi để có cú pháp ngắn gọn khi định nghĩa đường ống.
Thực Thi Bước Đến Bước: Đường ống xử lý dữ liệu bằng cách chạy nó qua từng bước theo trình tự.
Trường Hợp Sử Dụng Trí Tuệ Nhân Tạo: Sử dụng mẫu Builder để tạo các đường ống xử lý dữ liệu phức tạp hoặc thiết lập đào tạo mô hình.

4. Mẫu Strategy

Mẫu Strategy định nghĩa một họ các thuật toán có thể thay thế, bao gồm từng thuật toán và cho phép thay đổi hành vi tại thời điểm chạy. Điều này đặc biệt hữu ích trong các hệ thống trí tuệ nhân tạo, nơi cùng một quá trình (ví dụ: suy luận hoặc xử lý dữ liệu) có thể yêu cầu các phương pháp khác nhau tùy thuộc vào ngữ cảnh.

Khi Nào Sử Dụng

Chuyển đổi giữa các chiến lược suy luận (ví dụ: xử lý批 vs. truyền trực tuyến).
Áp dụng các kỹ thuật xử lý dữ liệu khác nhau động.
Chọn các chiến lược quản lý tài nguyên dựa trên cơ sở hạ tầng có sẵn.

Triển Khai

Hãy sử dụng mẫu Strategy để triển khai hai chiến lược suy luận khác nhau cho một mô hình trí tuệ nhân tạo: suy luận批 và suy luận truyền trực tuyến.

class InferenceStrategy:
"""Lớp cơ sở抽象 cho các chiến lược suy luận."""
def infer(self, model, data):
raise NotImplementedError("Các lớp con phải triển khai phương thức `infer`")

class BatchInference(InferenceStrategy):
"""Chiến lược cho suy luận批."""
def infer(self, model, data):
print("Đang thực hiện suy luận批...")
return [model.predict(item) for item in data]

class StreamInference(InferenceStrategy):
"""Chiến lược cho suy luận truyền trực tuyến."""
def infer(self, model, data):
print("Đang thực hiện suy luận truyền trực tuyến...")
results = []
for item in data:
results.append(model.predict(item))
return results

class InferenceContext:
"""Kết Text để chuyển đổi giữa các chiến lược suy luận động."""
def __init__(self, strategy: InferenceStrategy):
self.strategy = strategy

def set_strategy(self, strategy: InferenceStrategy):
"""Thay đổi chiến lược suy luận động."""
self.strategy = strategy

def infer(self, model, data):
"""Ủy quyền suy luận cho chiến lược đã chọn."""
return self.strategy.infer(model, data)

# Lớp Mô Hình Mẫu
class MockModel:
def predict(self, input_data):
return f"Đã Dự Đoán: {input_data}"

# Ví dụ sử dụng
model = MockModel()
data = ["mẫu1", "mẫu2", "mẫu3"]

context = InferenceContext(BatchInference())
print(context.infer(model, data))
# Đầu ra:
# Đang thực hiện suy luận批...
# ['Đã Dự Đoán: mẫu1', 'Đã Dự Đoán: mẫu2', 'Đã Dự Đoán: mẫu3']

# Chuyển sang suy luận truyền trực tuyến
context.set_strategy(StreamInference())
print(context.infer(model, data))
# Đầu ra:
# Đang thực hiện suy luận truyền trực tuyến...
# ['Đã Dự Đoán: mẫu1', 'Đã Dự Đoán: mẫu2', 'Đã Dự Đoán: mẫu3']

Giải Thích

Lớp Chiến Lược Cơ Sở: Lớp InferenceStrategy định nghĩa giao diện mà tất cả các chiến lược phải tuân theo.
Chiến Lược Cụ Thể: Mỗi chiến lược (ví dụ: BatchInference, StreamInference) triển khai logic cụ thể cho phương pháp đó.
Chuyển Động: Lớp InferenceContext cho phép chuyển đổi chiến lược tại thời điểm chạy, cung cấp tính linh hoạt cho các trường hợp sử dụng khác nhau.

Khi Nào Sử Dụng

Chuyển đổi giữa suy luận批 cho xử lý ngoại tuyến và suy luận truyền trực tuyến cho ứng dụng thời gian thực.
Thay đổi động các kỹ thuật xử lý dữ liệu hoặc tiền xử lý dựa trên nhiệm vụ hoặc định dạng đầu vào.

5. Mẫu Observer

Mẫu Observer thiết lập mối quan hệ một-nhiều giữa các đối tượng. Khi một đối tượng (chủ thể) thay đổi trạng thái, tất cả các đối tượng phụ thuộc (người quan sát) của nó sẽ được thông báo tự động. Điều này đặc biệt hữu ích trong các hệ thống trí tuệ nhân tạo để giám sát thời gian thực, xử lý sự kiện hoặc đồng bộ hóa dữ liệu.

Khi Nào Sử Dụng

Giám sát các chỉ số như độ chính xác hoặc mất mát trong quá trình đào tạo mô hình.
Cập nhật thời gian thực cho bảng điều khiển hoặc nhật ký.
Quản lý các phụ thuộc giữa các thành phần trong các công việc phức tạp.

Triển Khai

Hãy sử dụng mẫu Observer để giám sát hiệu suất của một mô hình trí tuệ nhân tạo trong thời gian thực.

class Subject:
"""Lớp cơ sở cho các chủ thể được quan sát."""
def __init__(self):
self._observers = []

def attach(self, observer):
"""Gán một người quan sát vào chủ thể."""
self._observers.append(observer)

def detach(self, observer):
"""Ngắt một người quan sát khỏi chủ thể."""
self._observers.remove(observer)

def notify(self, data):
"""Thông báo tất cả người quan sát về sự thay đổi trạng thái."""
for observer in self._observers:
observer.update(data)

class ModelMonitor(Subject):
"""Chủ thể giám sát các chỉ số hiệu suất mô hình."""
def update_metrics(self, metric_name, value):
"""Mô phỏng cập nhật một chỉ số hiệu suất và thông báo người quan sát."""
print(f"Cập nhật {metric_name}: {value}")
self.notify({metric_name: value})

class Observer:
"""Lớp cơ sở cho người quan sát."""
def update(self, data):
raise NotImplementedError("Các lớp con phải triển khai phương thức `update`")

class LoggerObserver(Observer):
"""Người quan sát để ghi nhật ký chỉ số."""
def update(self, data):
print(f"Đang ghi nhật ký chỉ số: {data}")

class AlertObserver(Observer):
"""Người quan sát để kích hoạt cảnh báo nếu ngưỡng bị vi phạm."""
def __init__(self, threshold):
self.threshold = threshold

def update(self, data):
for metric, value in data.items():
if value &gt; self.threshold:
print(f"CẢNH BÁO: {metric} vượt ngưỡng với giá trị {value}")

# Ví dụ sử dụng
monitor = ModelMonitor()
logger = LoggerObserver()
alert = AlertObserver(threshold=90)

monitor.attach(logger)
monitor.attach(alert)

# Mô phỏng cập nhật chỉ số
monitor.update_metrics("độ chính xác", 85) # Ghi nhật ký chỉ số
monitor.update_metrics("độ chính xác", 95) # Ghi nhật ký và kích hoạt cảnh báo

Chủ Thể: Quản lý một danh sách người quan sát và thông báo họ khi trạng thái của nó thay đổi. Trong ví dụ này, lớp ModelMonitor theo dõi các chỉ số.
Người Quan Sát: Thực hiện các hành động cụ thể khi được thông báo. Ví dụ, LoggerObserver ghi nhật ký chỉ số, trong khi AlertObserver kích hoạt cảnh báo nếu ngưỡng bị vi phạm.
Thiết Kế Mở: Người quan sát và chủ thể được耦 hợp lỏng lẻo, làm cho hệ thống trở nên mô-đun và có thể mở rộng.

Sự Khác Biệt Của Các Mẫu Thiết Kế Đối Với Kỹ Sư Trí Tuệ Nhân Tạo So Với Kỹ Sư Truyền Thống

Các mẫu thiết kế, mặc dù được áp dụng rộng rãi, mang những đặc điểm độc đáo khi được triển khai trong kỹ thuật trí tuệ nhân tạo so với kỹ thuật phần mềm truyền thống. Sự khác biệt nằm ở những thách thức, mục tiêu và quy trình công việc đặc trưng của các hệ thống trí tuệ nhân tạo, thường đòi hỏi các mẫu phải được thích nghi hoặc mở rộng ngoài những ứng dụng thông thường của chúng.

1. Tạo Đối Tượng: Tĩnh So Với Động

Kỹ Thuật Truyền Thống: Các mẫu tạo đối tượng như Factory hoặc Singleton thường được sử dụng để quản lý cấu hình, kết nối cơ sở dữ liệu hoặc trạng thái phiên người dùng. Những điều này thường là tĩnh và được xác định rõ ràng trong quá trình thiết kế hệ thống.
Kỹ Thuật Trí Tuệ Nhân Tạo: Tạo đối tượng thường liên quan đến quy trình công việc động, chẳng hạn như:
- Tạo mô hình trên cơ sở đầu vào người dùng hoặc yêu cầu hệ thống.
- Tải các cấu hình mô hình khác nhau cho các nhiệm vụ như dịch, tóm tắt hoặc phân loại.
- Tạo các đường ống xử lý dữ liệu nhiều lần, thay đổi tùy theo đặc điểm của tập dữ liệu (ví dụ: dữ liệu bảng so với văn bản không cấu trúc).

Ví Dụ: Trong trí tuệ nhân tạo, một mẫu Factory có thể tạo động một mô hình học sâu dựa trên loại nhiệm vụ và các ràng buộc phần cứng, trong khi trong các hệ thống truyền thống, nó có thể tạo một thành phần giao diện người dùng.

2. Ràng Buộc Hiệu Suất

Kỹ Thuật Truyền Thống: Các mẫu thiết kế thường được tối ưu hóa cho độ trễ và thông lượng trong các ứng dụng như máy chủ web, truy vấn cơ sở dữ liệu hoặc kết xuất giao diện người dùng.
Kỹ Thuật Trí Tuệ Nhân Tạo: Yêu cầu hiệu suất trong trí tuệ nhân tạo mở rộng đến độ trễ suy luận, sử dụng GPU/TPU và tối ưu hóa bộ nhớ. Các mẫu phải thích ứng với:
- Đệm kết quả trung gian để giảm tính toán trùng lặp (mẫu Decorator hoặc Proxy).
- Chuyển đổi thuật toán động (mẫu Strategy) để cân bằng độ trễ và độ chính xác dựa trên tải hệ thống hoặc ràng buộc thời gian thực.

3. Tính Chất Dựa Trên Dữ Liệu

Kỹ Thuật Truyền Thống: Các mẫu thường hoạt động trên cấu trúc đầu vào-đầu ra cố định (ví dụ: biểu mẫu, phản hồi API REST).
Kỹ Thuật Trí Tuệ Nhân Tạo: Các mẫu phải xử lý biến đổi dữ liệu cả về cấu trúc và quy mô, bao gồm:
- Dữ liệu truyền trực tuyến cho các hệ thống thời gian thực.
- Dữ liệu đa phương thức (ví dụ: văn bản, hình ảnh, video) đòi hỏi các đường ống có các bước xử lý linh hoạt.
- Các tập dữ liệu lớn đòi hỏi các đường ống xử lý dữ liệu và tăng cường hiệu quả, thường sử dụng mẫu như Builder hoặc Pipeline.

4. Thử Nghiệm So Với Tính Ổn Định

Kỹ Thuật Truyền Thống: Tập trung vào việc xây dựng các hệ thống ổn định, có thể dự đoán, nơi các mẫu đảm bảo hiệu suất và độ tin cậy nhất quán.
Kỹ Thuật Trí Tuệ Nhân Tạo: Các quy trình công việc trí tuệ nhân tạo thường là thử nghiệm và liên quan đến:
- Lặp lại các kiến trúc mô hình hoặc kỹ thuật xử lý dữ liệu khác nhau.
- Cập nhật động các thành phần hệ thống (ví dụ: huấn luyện lại mô hình, thay thế thuật toán).
- Mở rộng các quy trình công việc hiện có mà không làm hỏng đường ống sản xuất, thường sử dụng các mẫu có thể mở rộng như Decorator hoặc Factory.

Ví Dụ: Một Factory trong trí tuệ nhân tạo không chỉ tạo một mô hình mà còn gắn các trọng số đã tải trước, cấu hình các trình tối ưu hóa và liên kết các hàm gọi lại đào tạo – tất cả đều động.

Các Thực Tiễn Tốt Nhất Để Sử Dụng Các Mẫu Thiết Kế Trong Các Dự Án Trí Tuệ Nhân Tạo

Đừng Tự Vẽ Sáng Tạo: Sử dụng mẫu chỉ khi chúng rõ ràng giải quyết một vấn đề hoặc cải thiện tổ chức mã.
Xem Xét Quy Mô: Chọn mẫu sẽ mở rộng cùng với sự phát triển của hệ thống trí tuệ nhân tạo.
Tài Liệu: Tài liệu hóa lý do tại sao chọn các mẫu cụ thể và cách chúng nên được sử dụng.
Thử Nghiệm: Các mẫu thiết kế nên làm cho mã của bạn dễ kiểm tra hơn, không khó hơn.
Hiệu Suất: Xem xét các tác động về hiệu suất của mẫu, đặc biệt là trong các đường ống suy luận.

Kết Luận

Các mẫu thiết kế là những công cụ mạnh mẽ cho các kỹ sư trí tuệ nhân tạo, giúp tạo ra các hệ thống có thể bảo trì và mở rộng. Khóa chính là chọn mẫu phù hợp cho nhu cầu cụ thể của bạn và triển khai nó theo cách tăng cường mã của bạn mà không làm cho nó phức tạp hơn.

Hãy nhớ rằng các mẫu là hướng dẫn, không phải quy tắc. Hãy tự do thích nghi với nhu cầu cụ thể của bạn trong khi giữ nguyên các nguyên tắc cốt lõi.

Aayush Mittal

Tôi đã dành 5 năm qua để đắm mình trong thế giới hấp dẫn của Máy học và Học sâu. Đam mê và chuyên môn của tôi đã dẫn tôi đến việc đóng góp vào hơn 50 dự án kỹ thuật phần mềm đa dạng, với trọng tâm đặc biệt là AI/ML. Sự tò mò liên tục của tôi cũng đã thu hút tôi đến Xử lý Ngôn ngữ Tự nhiên, một lĩnh vực tôi渴望 khám phá thêm.