Kết nối với chúng tôi

AI nguồn mở phản công với Llama 4 của Meta

Trí tuệ nhân tạo

AI nguồn mở phản công với Llama 4 của Meta

mm

Trong vài năm qua, thế giới AI đã chuyển từ văn hóa cộng tác mở sang văn hóa do các hệ thống độc quyền được bảo vệ chặt chẽ thống trị. OpenAI – một công ty được thành lập theo đúng nghĩa đen với chữ “mở” trong tên – đã chuyển sang giữ bí mật các mô hình mạnh nhất của mình sau năm 2019. Các đối thủ cạnh tranh như nhân loạiGoogle AI tiên tiến được xây dựng tương tự đằng sau các bức tường API, chỉ có thể truy cập theo các điều khoản của họ. Cách tiếp cận khép kín này được biện minh một phần vì lợi ích an toàn và kinh doanh, nhưng nó khiến nhiều người trong cộng đồng than thở về sự mất mát của tinh thần nguồn mở ban đầu. 

Bây giờ, tinh thần đó đang trỗi dậy trở lại. Meta mẫu Llama 4 mới ra mắt báo hiệu một nỗ lực táo bạo để hồi sinh AI nguồn mở ở cấp độ cao nhất – và ngay cả những người chơi được bảo vệ theo truyền thống cũng đang lưu ý. Giám đốc điều hành của OpenAI, Sam Altman gần đây đã thừa nhận rằng công ty đã “ở phía sai lầm của lịch sử” liên quan đến các mô hình mở và công bố kế hoạch cho một biến thể GPT-4 “mới mạnh mẽ, trọng lượng mở”. Tóm lại, AI nguồn mở đang phản công, và ý nghĩa và giá trị của “mở” đang phát triển.

(Nguồn: Meta)

Llama 4: Meta's Open Challenger đối đầu với GPT-4o, Claude và Gemini

Meta đã tiết lộ Llama 4 như một thách thức trực tiếp khác đối với các mẫu xe mới từ các đối thủ AI hạng nặng, định vị nó như một lựa chọn thay thế cho xe có trọng lượng mở. Llama 4 hiện có hai phiên bản – Llama 4 Scout và Llama 4 Maverick – với thông số kỹ thuật gây kinh ngạc. Cả hai đều hỗn hợp các chuyên gia (MoE) các mô hình chỉ kích hoạt một phần nhỏ các tham số của chúng cho mỗi truy vấn, cho phép tổng kích thước lớn mà không làm tăng chi phí thời gian chạy. Scout và Maverick đều sử dụng 17 tỷ tham số "hoạt động" (phần hoạt động trên bất kỳ đầu vào nào được cung cấp), nhưng nhờ MoE, Scout phân bổ chúng cho 16 chuyên gia (tổng cộng 109 tỷ tham số) và Maverick cho 128 chuyên gia (tổng cộng 400 tỷ). Kết quả: Các mô hình Llama 4 mang lại hiệu suất đáng gờm – và thực hiện điều đó với các đặc quyền độc đáo mà ngay cả một số mô hình đóng cũng không có.

Ví dụ, Llama 4 Scout tự hào có cửa sổ ngữ cảnh 10 triệu mã thông báo hàng đầu trong ngành, vượt xa hầu hết các đối thủ. Điều này có nghĩa là nó có thể tiếp nhận và lý giải các tài liệu hoặc cơ sở mã thực sự lớn chỉ trong một lần. Mặc dù có quy mô lớn, Scout vẫn đủ hiệu quả để chạy trên một GPU H100 duy nhất khi được lượng tử hóa cao, ám chỉ rằng các nhà phát triển sẽ không cần siêu máy tính để thử nghiệm với nó. 

Trong khi đó, Llama 4 Maverick được điều chỉnh để đạt được sức mạnh tối đa. Các thử nghiệm ban đầu cho thấy Maverick phù hợp hoặc đánh bại các mô hình đóng hàng đầu về các nhiệm vụ lý luận, mã hóa và thị giác. Trên thực tế, Meta đã giới thiệu một người anh em thậm chí còn lớn hơn, Llama 4 Behemoth, vẫn đang trong quá trình đào tạo, mà nội bộ “vượt trội hơn GPT-4.5, Claude 3.7 Sonnet và Gemini 2.0 Pro trên một số tiêu chuẩn STEM.” Thông điệp ở đây rất rõ ràng: các mô hình mở không còn là hạng hai nữa; Llama 4 đang hướng tới vị thế tiên tiến nhất.

Quan trọng không kém, Meta đã tạo ra Llama 4 ngay lập tức để tải xuống và sử dụng. Các nhà phát triển có thể lấy Scout và Maverick từ trang web chính thức hoặc Ôm mặt theo Giấy phép cộng đồng Llama 4. Điều đó có nghĩa là bất kỳ ai – từ một hacker trong gara đến một công ty Fortune 500 – đều có thể tìm hiểu sâu hơn, tinh chỉnh mô hình theo nhu cầu của họ và triển khai trên phần cứng hoặc đám mây của riêng họ. Đây là sự tương phản hoàn toàn với các dịch vụ độc quyền như GPT-4o của OpenAI hoặc Claude 3.7 của Anthropic, được phục vụ thông qua các API trả phí mà không có quyền truy cập vào các trọng số cơ bản. 

Meta nhấn mạnh rằng tính cởi mở của Llama 4 là về việc trao quyền cho người dùng: “Chúng tôi đang chia sẻ những mô hình đầu tiên trong đàn Llama 4, giúp mọi người có thể xây dựng những trải nghiệm đa phương thức được cá nhân hóa nhiều hơn.” Nói cách khác, Llama 4 là một bộ công cụ dành cho các nhà phát triển và nhà nghiên cứu trên toàn thế giới. Bằng cách phát hành các mô hình có khả năng sánh ngang với GPT-4 và Claude, Meta đang làm sống lại quan niệm rằng AI hàng đầu không nhất thiết phải sống sau một bức tường phí.

(Nguồn: Meta)

Chủ nghĩa duy tâm đích thực hay lối chơi chiến lược?

Meta giới thiệu Llama 4 bằng những lời lẽ to tát và gần như vị tha. “Mô hình AI nguồn mở của chúng tôi, Llama, đã được tải xuống hơn một tỷ lần,” Giám đốc điều hành Mark Zuckerberg công bố gần đây, Thêm rằng “việc mở nguồn các mô hình AI là điều cần thiết để đảm bảo mọi người ở mọi nơi đều có thể tiếp cận được những lợi ích của AI.” Khung này mô tả Meta như người cầm đuốc của AI dân chủ hóa – một công ty sẵn sàng chia sẻ các mô hình vương miện của mình vì lợi ích chung. Và thực sự, sự nổi tiếng của gia đình Llama đã chứng minh điều này: các mô hình đã được tải xuống ở quy mô đáng kinh ngạc (nhảy vọt từ 650 triệu lên 1 tỷ lượt tải xuống chỉ trong vài tháng) và chúng đã được các công ty như Spotify, AT&T và DoorDash sử dụng trong sản xuất.

Meta tự hào lưu ý rằng các nhà phát triển đánh giá cao "tính minh bạch, khả năng tùy chỉnh và bảo mật" khi có các mô hình mở mà họ có thể tự chạy, điều này “giúp đạt đến những cấp độ sáng tạo và đổi mới mới,” so với API hộp đen. Về nguyên tắc, điều này nghe giống như tinh thần phần mềm nguồn mở cũ (nghĩ đến Linux hoặc Apache) được áp dụng cho AI – một chiến thắng rõ ràng cho cộng đồng.

Tuy nhiên, người ta không thể bỏ qua phép tính chiến lược đằng sau sự cởi mở này. Meta không phải là một tổ chức từ thiện và "nguồn mở" trong bối cảnh này đi kèm với những cảnh báo. Đáng chú ý là Llama 4 được phát hành theo giấy phép cộng đồng đặc biệt, không phải giấy phép cho phép tiêu chuẩn - vì vậy trong khi các trọng số mô hình được sử dụng miễn phí, vẫn có những hạn chế (ví dụ, một số trường hợp sử dụng tài nguyên cao có thể yêu cầu phải có sự cho phép và giấy phép là “độc quyền” theo nghĩa là nó được tạo ra bởi Meta). Đây không phải là Sáng kiến ​​nguồn mở (OSI) định nghĩa được chấp thuận về nguồn mở, điều này khiến một số nhà phê bình cho rằng các công ty đang sử dụng sai thuật ngữ này. 

Trên thực tế, cách tiếp cận của Meta thường được mô tả là AI “open-weight” hoặc “source-available”: mã và trọng số được công khai, nhưng Meta vẫn duy trì một số quyền kiểm soát và không tiết lộ mọi thứ (ví dụ như dữ liệu đào tạo). Điều đó không làm giảm tiện ích cho người dùng, nhưng nó cho thấy Meta là chiến lược mở – giữ đủ quyền để bảo vệ chính nó (và có lẽ là lợi thế cạnh tranh của nó). Nhiều công ty đang dán nhãn “nguồn mở” lên các mô hình AI trong khi vẫn giữ lại các chi tiết quan trọng, làm suy yếu tinh thần cởi mở thực sự.

Tại sao Meta lại mở ra? Bối cảnh cạnh tranh cung cấp manh mối. Việc phát hành các mô hình mạnh mẽ miễn phí có thể nhanh chóng xây dựng một cơ sở người dùng doanh nghiệp và nhà phát triển rộng lớn – trí tuệ nhân tạo, một công ty khởi nghiệp của Pháp, đã làm chính xác điều này với các mô hình mở ban đầu của mình để đạt được uy tín là một phòng thí nghiệm hàng đầu. 

Bằng cách gieo mầm thị trường với Llama, Meta đảm bảo công nghệ của mình trở thành nền tảng trong hệ sinh thái AI, có thể mang lại lợi nhuận dài hạn. Đây là chiến lược bao trùm và mở rộng cổ điển: nếu mọi người sử dụng mô hình "mở" của bạn, bạn sẽ gián tiếp đặt ra các tiêu chuẩn và thậm chí có thể hướng mọi người đến nền tảng của bạn (ví dụ: các sản phẩm trợ lý AI của Meta tận dụng Llama. Ngoài ra còn có yếu tố quan hệ công chúng và định vị. Meta có thể đóng vai trò là nhà đổi mới nhân từ, đặc biệt là trái ngược với OpenAI - công ty đã phải đối mặt với những lời chỉ trích vì cách tiếp cận khép kín của mình. Trên thực tế, sự thay đổi quan điểm của OpenAI về các mô hình mở phần nào nhấn mạnh động thái của Meta hiệu quả như thế nào. 

Sau mô hình mở mang tính đột phá của Trung Quốc DeepSeek-R1 nổi lên vào tháng 1 và vượt qua các mô hình trước đó, Altman chỉ ra rằng OpenAI không muốn bị bỏ lại ở "phía sai của lịch sử". Bây giờ OpenAI đang hứa hẹn một mô hình mở với khả năng suy luận mạnh mẽ trong tương lai, đánh dấu sự thay đổi thái độ. Thật khó để không thấy ảnh hưởng của Meta trong sự thay đổi đó. Tư thế nguồn mở của Meta vừa xác thực chiến lược: nó thực sự mở rộng khả năng tiếp cận AI, nhưng cũng là một nước cờ khôn ngoan để đánh bại các đối thủ và định hình tương lai của thị trường theo các điều khoản của Meta.

Ý nghĩa đối với các nhà phát triển, doanh nghiệp và tương lai của AI

Đối với các nhà phát triển, sự hồi sinh của các mô hình mở như Llama 4 là một luồng gió mới. Thay vì bị khóa chặt trong hệ sinh thái và phí của một nhà cung cấp duy nhất, giờ đây họ có tùy chọn chạy AI mạnh mẽ trên cơ sở hạ tầng của riêng mình hoặc tùy chỉnh tự do. 

Đây là một lợi ích to lớn cho các doanh nghiệp trong các ngành nhạy cảm – hãy nghĩ đến tài chính, chăm sóc sức khỏe hoặc chính phủ – vốn cảnh giác với việc đưa dữ liệu bí mật vào hộp đen của người khác. Với Llama 4, một ngân hàng hoặc bệnh viện có thể triển khai một mô hình ngôn ngữ hiện đại đằng sau tường lửa của riêng họ, điều chỉnh nó trên dữ liệu riêng tư, mà không cần chia sẻ mã thông báo với một thực thể bên ngoài. Ngoài ra còn có một lợi thế về chi phí. Trong khi phí API dựa trên mức sử dụng cho các mô hình hàng đầu có thể tăng vọt, thì một mô hình mở không có phí sử dụng – bạn chỉ phải trả cho sức mạnh tính toán để chạy nó. Các doanh nghiệp tăng cường khối lượng công việc AI nặng có thể tiết kiệm đáng kể bằng cách lựa chọn một giải pháp mở mà họ có thể mở rộng quy mô nội bộ.

Không có gì ngạc nhiên khi chúng ta thấy nhiều doanh nghiệp quan tâm hơn đến các mô hình mở; nhiều doanh nghiệp đã bắt đầu nhận ra rằng khả năng kiểm soát và bảo mật của AI nguồn mở phù hợp hơn với nhu cầu của họ so với các dịch vụ đóng áp dụng chung cho mọi trường hợp.

Các nhà phát triển cũng gặt hái được lợi ích từ sự đổi mới. Với quyền truy cập vào nội bộ mô hình, họ có thể tinh chỉnh và cải thiện AI cho các lĩnh vực thích hợp (luật, công nghệ sinh học, ngôn ngữ khu vực – bạn đặt tên cho nó) theo những cách mà một API đóng có thể không bao giờ đáp ứng được. Sự bùng nổ của các dự án do cộng đồng thúc đẩy xung quanh các mô hình Llama trước đó – từ các chatbot được tinh chỉnh dựa trên kiến ​​thức y khoa đến các ứng dụng điện thoại thông minh dành cho người thích chạy các phiên bản thu nhỏ – đã chứng minh cách các mô hình mở có thể dân chủ hóa thử nghiệm. 

Tuy nhiên, sự hồi sinh của mô hình mở cũng đặt ra những câu hỏi khó. "Dân chủ hóa" có thực sự xảy ra nếu chỉ những người có tài nguyên điện toán đáng kể mới có thể chạy mô hình 400B tham số? Trong khi Llama 4 Scout và Maverick hạ thấp tiêu chuẩn phần cứng so với các mô hình đơn khối, chúng vẫn nặng ký - một điểm không bị mất đối với một số nhà phát triển có PC không thể xử lý chúng nếu không có sự trợ giúp của đám mây. 

Hy vọng là các kỹ thuật như nén mô hình, chưng cất hoặc các biến thể chuyên gia nhỏ hơn sẽ truyền sức mạnh của Llama 4 xuống các kích thước dễ tiếp cận hơn. Một mối quan tâm khác là việc sử dụng sai mục đích. OpenAI và những người khác từ lâu đã lập luận rằng việc phát hành các mô hình mạnh mẽ một cách công khai có thể cho phép các tác nhân độc hại (tạo ra thông tin sai lệch, mã phần mềm độc hại, v.v.). 

Những lo ngại đó vẫn còn: một Claude hoặc GPT nguồn mở có thể bị sử dụng sai mục đích nếu không có bộ lọc an toàn mà các công ty áp dụng trên API của họ. Mặt khác, những người ủng hộ lập luận rằng tính cởi mở cho phép cộng đồng cũng để xác định và khắc phục các vấn đề, làm cho các mô hình mạnh mẽ và minh bạch hơn theo thời gian so với bất kỳ hệ thống bí mật nào. Có bằng chứng cho thấy các cộng đồng mô hình mở coi trọng vấn đề an toàn, phát triển các rào cản riêng và chia sẻ các phương pháp hay nhất – nhưng đó là một căng thẳng đang diễn ra.

Điều ngày càng rõ ràng là chúng ta đang hướng đến một bối cảnh AI lai, nơi các mô hình mở và đóng cùng tồn tại, mỗi mô hình ảnh hưởng đến nhau. Các nhà cung cấp đóng như OpenAI, Anthropic và Google vẫn giữ lợi thế về hiệu suất tuyệt đối - cho đến hiện tại. Thật vậy, tính đến cuối năm 2024, nghiên cứu cho thấy các mô hình mở chậm hơn khoảng một năm so với các mô hình khép kín tốt nhất về khả năng. Nhưng khoảng cách đó đang nhanh chóng thu hẹp. 

Trên thị trường ngày nay, “AI nguồn mở” không còn chỉ có nghĩa là các dự án sở thích hay các mô hình cũ nữa – giờ đây nó đã trở thành trọng tâm của chiến lược AI dành cho các công ty công nghệ lớn và các công ty khởi nghiệp. Việc ra mắt Llama 4 của Meta là lời nhắc nhở mạnh mẽ về giá trị đang phát triển của tính cởi mở. Đây vừa là lập trường triết học về dân chủ hóa công nghệ vừa là động thái chiến thuật trong cuộc chiến công nghiệp có rủi ro cao. Đối với các nhà phát triển và doanh nghiệp, nó mở ra cánh cửa mới cho sự đổi mới và quyền tự chủ, ngay cả khi nó làm phức tạp các quyết định với những sự đánh đổi mới. Và đối với hệ sinh thái rộng lớn hơn, nó làm dấy lên hy vọng rằng những lợi ích của AI sẽ không bị khóa trong tay một số ít tập đoàn – if tinh thần mã nguồn mở có thể giữ vững được vị thế của mình. 

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.