Connect with us

Lãnh đạo tư tưởng

Tại sao “LLM tốt nhất cho Tiếp thị” không tồn tại

mm

Mỗi bản phát hành mô hình ngôn ngữ lớn mới đều đến với những lời hứa giống nhau: cửa sổ ngữ cảnh lớn hơn, lý luận mạnh mẽ hơn và hiệu suất điểm chuẩn tốt hơn. Sau đó, không lâu sau đó, các nhà tiếp thị am hiểu AI cảm thấy một loại lo lắng quen thuộc bắt đầu len lỏi vào. Liệu mô hình họ đang sử dụng cho mọi thứ đã lỗi thời? Liệu có đáng để chuyển đổi và đào tạo lại mọi thứ từ đầu? Điều gì sẽ xảy ra nếu họ không làm gì và bị tụt lại phía sau?

Lo lắng đó là dễ hiểu. Nhưng cũng là không cần thiết.

Là người chịu trách nhiệm xây dựng các hệ thống mà các nhà tiếp thị dựa vào hàng ngày, tôi thấy mẫu này được lặp lại trên các đội và quy trình làm việc lâu trước khi nó xuất hiện trên các tiêu đề.

Từ góc độ sản phẩm và nền tảng, điều gì đó đã trở nên rõ ràng hơn trong vài năm qua: không có mô hình duy nhất nào liên tục hoạt động tốt nhất trên tất cả các nhiệm vụ tiếp thị. Có vị trí hàng đầu để theo dõi hàng trăm đội tiếp thị ra mắt các chiến dịch toàn cầu khi tốc độ đổi mới mô hình tăng tốc, rõ ràng là các yêu cầu của công việc tiếp thị thực tế quá tinh vi để một chiến lược mô hình duy nhất có thể tồn tại theo thời gian.

Việc chọn “mô hình đúng” không quan trọng vì không có mô hình duy nhất nào đúng cho mọi nhiệm vụ. Điều quan trọng là thiết kế các hệ thống có thể liên tục đánh giá các mô hình và khớp chúng với công việc cụ thể mà các nhà tiếp thị đang cố gắng thực hiện. Điều này không phải là điều mà các nhà tiếp thị cá nhân nên quản lý, mà là điều mà các công cụ của họ nên xử lý cho họ. Kết luận thực tế là đơn giản: ngừng hỏi mô hình nào là “tốt nhất” và bắt đầu hỏi liệu các công cụ của bạn có thể thích nghi khi các mô hình thay đổi.

Tại sao tư duy “Mô hình tốt nhất” bị phá vỡ trong Tiếp thị

Hầu hết các cuộc thảo luận công khai về LLM xoay quanh các điểm chuẩn chung: các vấn đề toán học, thách thức lý luận, các kỳ thi tiêu chuẩn. Các điểm chuẩn này là tín hiệu hữu ích cho tiến bộ nghiên cứu, nhưng chúng là dự đoán yếu về hiệu suất nhiệm vụ thực tế.

Nội dung tiếp thị, cụ thể, có các đặc điểm mà các điểm chuẩn chung hiếm khi bắt được:

  • Nó luôn về một sản phẩm hoặc dịch vụ cụ thể
  • Nó luôn được viết cho một đối tượng xác định
  • Nó phải phản ánh nhất quán giọng nói, âm điệu và tiêu chuẩn của thương hiệu

Ví dụ, chúng tôi liên tục thấy rằng các mô hình khác nhau vượt trội trong các loại công việc tiếp thị khác nhau. Một số mô hình tốt hơn trong việc tạo bản sao trong giọng nói thương hiệu từ đầu, trong khi các mô hình khác hoạt động tốt hơn trong việc hiểu các tài liệu kỹ thuật phức tạp và cô đọng chúng thành các bài đăng trên blog. Chúng tôi học được điều này thông qua thử nghiệm nghiêm ngặt, vì các khả năng mới chỉ tạo ra giá trị khi chúng được đánh giá nhanh chóng và thực tế. Vì vậy, ví dụ, khi Gemini 3 Pro được ra mắt vào cuối tháng 11 năm 2025, đội của chúng tôi tích hợp và thử nghiệm trong vòng 24 giờ, sau đó cung cấp cho các khách hàng được chọn để đánh giá sự phù hợp của nó với các quy trình làm việc tiếp thị thực tế chứ không phải các điểm chuẩn trừu tượng.

Mẫu này không phải là giai thoại. Nghiên cứu ngày càng cho thấy rằng hiệu suất LLM phụ thuộc rất nhiều vào nhiệm vụ, với các mô hình hiển thị sự biến thiên có ý nghĩa trên các nhiệm vụ viết, tóm tắt, lý luận và thực hiện hướng dẫn. Một mô hình hoạt động tốt trên các thử nghiệm lý luận chung có thể vẫn gặp khó khăn với việc tạo nội dung nhạy cảm với thương hiệu và bị giới hạn.

Thậm chí quan trọng hơn, chúng tôi thấy những thay đổi này trên cơ sở hàng tháng. Sự lãnh đạo mô hình thay đổi khi các nhà cung cấp tối ưu hóa cho các khả năng, cấu trúc chi phí và phương pháp đào tạo khác nhau. Ý tưởng rằng một nhà cung cấp sẽ vẫn “tốt nhất” trên tất cả các trường hợp sử dụng tiếp thị đã trở nên lỗi thời.

Chi phí ẩn của việc theo đuổi các bản phát hành

Khi các đội cố gắng theo dõi thủ công các bản phát hành mô hình và chuyển đổi công cụ một cách phản ứng, chi phí hoạt động sẽ tăng lên. Các nhà tiếp thị gặp phải:

  • Gián đoạn quy trình làm việc vì các lời nhắc, mẫu và quy trình yêu cầu điều chỉnh liên tục
  • Chất lượng đầu ra không nhất quán vì các mô hình khác nhau hoạt động khác nhau trên các nhiệm vụ
  • Mệt mỏi quyết định vì thời gian đánh giá thay thế công việc sản xuất

Tôi đã thấy các đội tiếp thị dành cả quý để di chuyển từ một nhà cung cấp này sang một nhà cung cấp khác, chỉ để tìm thấy rằng các lời nhắc cẩn thận của họ không còn hoạt động như mong đợi. Nội dung mà trước đây cảm thấy phù hợp với thương hiệu bây giờ đọc khác. Các thành viên trong đội đã quen với một quy trình làm việc bây giờ phải đối mặt với một đường cong học tập mới. Những lợi ích về hiệu suất được hứa hẹn hiếm khi vật chất hóa theo cách biện minh cho sự gián đoạn.

Nghiên cứu ngành công nghiệp liên tục cho thấy rằng hầu hết giá trị AI bị mất không phải ở lớp mô hình, mà trong tích hợp và quản lý thay đổi. Từ góc độ sản phẩm, rủi ro lớn nhất là gắn các quy trình làm việc quá chặt với một mô hình duy nhất. Điều đó chỉ tạo ra khóa kỹ thuật, điều này làm cho việc cải tiến khó hơn theo thời gian.

Một cách tiếp cận bền vững hơn: Hệ thống được tối ưu hóa cho LLM

Một cách tiếp cận bền vững hơn là giả định sự biến động. Và sau đó thiết kế cho nó.

Trong một hệ thống được tối ưu hóa cho LLM, các mô hình được coi là các thành phần có thể thay thế chứ không phải là các phụ thuộc cố định. Hiệu suất được đánh giá liên tục bằng cách sử dụng các quy trình làm việc thực tế, không phải các điểm chuẩn trừu tượng. Các mô hình khác nhau có thể được định tuyến đến các nhiệm vụ khác nhau dựa trên kết quả quan sát được thay vì khả năng lý thuyết.

Điều này có thể có nghĩa là định tuyến việc tạo chú thích trên mạng xã hội đến một mô hình vượt trội về sự ngắn gọn và sức mạnh, trong khi chỉ đạo nội dung blog dài đến một mô hình khác duy trì sự nhất quán trên hàng nghìn từ. Trình đại lý giúp tạo chiến lược có thể sử dụng một mô hình thứ ba tốt hơn trong việc lý luận. Hệ thống đưa ra những quyết định định tuyến này tự động dựa trên mô hình nào đã được thử nghiệm tốt nhất cho từng loại nhiệm vụ cụ thể.

Từ góc độ của người dùng, quá trình này nên là vô hình. Một ẩn dụ tôi yêu thích ở đây: Trong ẩm thực Pháp, mỗi thành phần – nước sốt, giảm, gia vị – có một kỹ thuật đằng sau nó. Người dùng không cần biết mỗi thành phần đến từ đâu. Họ chỉ trải nghiệm một bữa ăn tốt hơn.

Đối với các nhà tiếp thị, cùng một nguyên tắc áp dụng. Động cơ bên dưới có thể thay đổi trong khi các quy trình làm việc vẫn ổn định. Các cải tiến xuất hiện dần dần dưới dạng sự phù hợp với thương hiệu tốt hơn, sự hài lòng với nội dung cao hơn và kết quả nhất quán hơn, mà không buộc các đội phải học lại các công cụ mọi vài tháng. Trong thực tế, điều này có nghĩa là các nhà tiếp thị nhận được kết quả nhất quán hơn và ít gián đoạn quy trình làm việc hơn, ngay cả khi các mô hình thay đổi dưới bề mặt.

Tại sao đo lường quan trọng hơn các điểm chuẩn

Các quyết định mô hình chỉ quan trọng nếu chúng tạo ra các cải tiến có thể đo lường được trong các quy trình làm việc thực tế. Các điểm chuẩn công khai cung cấp thông tin định hướng, nhưng chúng không trả lời các câu hỏi hoạt động cụ thể của tiếp thị như:

  • Liệu mô hình này áp dụng giọng nói thương hiệu một cách đáng tin cậy hơn?
  • Liệu nó kết hợp kiến thức sản phẩm với ít lỗi hơn?
  • Liệu nó giảm thời gian chỉnh sửa hoặc các nút thắt quản lý?

Nghiên cứu gần đây nhấn mạnh tầm quan trọng của việc đánh giá vòng lặp con người và thử nghiệm cụ thể cho các hệ thống LLM ứng dụng. Ở quy mô lớn, những tín hiệu này dự đoán giá trị nhiều hơn so với xếp hạng bảng xếp hạng.

Sự thay đổi của Agentic làm tăng ставки

Khi các hệ thống AI trở nên chủ động hơn, lập kế hoạch, soạn thảo, lặp lại và thực hiện với sự giám sát trực tiếp ít hơn, tầm quan trọng của việc lựa chọn mô hình cơ bản tăng lên. Đồng thời, nó trở nên ít thực tế hơn cho con người để giám sát mọi quyết định.

Điều này phản ánh nghiên cứu hiện tại về các hệ thống chủ động, nhấn mạnh rằng việc lựa chọn công cụ và mô hình có tác động đáng kể đến độ tin cậy và an toàn. Trong môi trường này, việc lựa chọn mô hình trở thành một quyết định về cơ sở hạ tầng, không phải là sở thích của người dùng. Hệ thống bản thân phải đảm bảo rằng mỗi thành phần của một quy trình làm việc được cung cấp bởi mô hình phù hợp nhất tại thời điểm đó, dựa trên hiệu suất quan sát được thay vì thói quen.

Hấp thụ thay đổi thay vì phản ứng với nó

Các tiêu đề sẽ tiếp tục xuất hiện, các mô hình mới sẽ tiếp tục được ra mắt, và sự lãnh đạo trong hiệu suất LLM sẽ tiếp tục thay đổi.

Thành công là về việc xây dựng các hệ thống có thể hấp thụ sự biến động của mô hình thay vì phản ứng với mỗi bản phát hành càng nhanh càng tốt. Đây là cách các nhà tiếp thị có thể mở rộng công việc của mình nhanh chóng, duy trì chất lượng và sự nhất quán của thương hiệu, và tập trung vào công việc thực sự tạo ra tác động.

Tôi thực sự tin rằng tương lai của AI trong tiếp thị là làm cho việc thay đổi mô hình trở nên không liên quan đến những người làm công việc. Sau tất cả, các nhà tiếp thị có nhiều việc quan trọng hơn để làm ngoài việc đào tạo lại mô hình mọi sáu tháng.

Bryan Tsao là Chief Product Officer tại Jasper, nền tảng đại lý tiếp thị, nơi ông lãnh đạo các đội Product, Engineering, Growth và Data. Trước khi gia nhập Jasper, ông đã giữ các vị trí lãnh đạo cấp cao bao gồm VP của Growth và Data tại Dropbox, VP của Product và Design tại Namely, và VP của Product, Design và Data tại Mattermark. Ông nắm giữ bằng Thạc sĩ về Hệ thống Quản lý Thông tin từ Đại học California, Berkeley, và bằng Cử nhân về Khoa học Nhận thức từ UC San Diego.