Connect with us

Trí tuệ nhân tạo

Liquid AI Ra Mắt Liquid Foundation Models: Một Bộ Đổi Mới Trong Trí Tuệ Nhân Tạo Generative

mm

Trong một thông báo đột phá, Liquid AI, một công ty spin-off của MIT, đã giới thiệu loạt Liquid Foundation Models (LFMs) đầu tiên của mình. Những mô hình này, được thiết kế từ nguyên tắc đầu tiên, đã đặt ra một tiêu chuẩn mới trong lĩnh vực trí tuệ nhân tạo generative, mang lại hiệu suất không thể sánh được trên nhiều quy mô. LFMs, với kiến trúc đổi mới và khả năng tiên tiến, đang sẵn sàng thách thức các mô hình AI hàng đầu trong ngành, bao gồm cả ChatGPT.

Liquid AI được thành lập bởi một nhóm các nhà nghiên cứu của MIT, bao gồm Ramin Hasani, Mathias Lechner, Alexander Amini, và Daniela Rus. Với trụ sở tại Boston, Massachusetts, sứ mệnh của công ty là tạo ra các hệ thống AI tổng thể có khả năng và hiệu quả cho các doanh nghiệp mọi quy mô. Đội ngũ này ban đầu đã tiên phong trong lĩnh vực mạng nơ-ron lỏng, một lớp mô hình AI được lấy cảm hứng từ động lực học của não, và hiện đang nhắm đến việc mở rộng khả năng của các hệ thống AI trên mọi quy mô, từ thiết bị cạnh đến triển khai cấp doanh nghiệp.

LFM Là Gì?

Liquid Foundation Models đại diện cho một thế hệ mới của các hệ thống AI, những hệ thống này cực kỳ hiệu quả về sử dụng bộ nhớ và năng lực tính toán. Được xây dựng trên nền tảng của các hệ thống động, xử lý tín hiệu và đại số tuyến tính số, những mô hình này được thiết kế để xử lý nhiều loại dữ liệu tuần tự – như văn bản, video, âm thanh và tín hiệu – với độ chính xác đáng kinh ngạc.

Liquid AI đã phát triển ba mô hình ngôn ngữ chính trong khuôn khổ ra mắt này:

  • LFM-1B: Một mô hình dày đặc với 1,3 tỷ tham số, được tối ưu hóa cho các môi trường bị hạn chế về tài nguyên.
  • LFM-3B: Một mô hình 3,1 tỷ tham số, lý tưởng cho các kịch bản triển khai cạnh, như ứng dụng di động.
  • LFM-40B: Một mô hình Mixture of Experts (MoE) 40,3 tỷ tham số được thiết kế để xử lý các nhiệm vụ phức tạp với hiệu suất vượt trội.

Những mô hình này đã chứng minh được kết quả hàng đầu trong các điểm chuẩn AI chính, khiến chúng trở thành một đối thủ đáng gờm so với các mô hình AI generative hiện có.

Hiệu Suất Hàng Đầu

Liquid AI’s LFMs mang lại hiệu suất hàng đầu trong các điểm chuẩn khác nhau. Ví dụ, LFM-1B vượt trội so với các mô hình dựa trên transformer trong cùng phân khúc, trong khi LFM-3B cạnh tranh với các mô hình lớn hơn như Phi-3.5 của Microsoft và loạt Llama của Meta. Mô hình LFM-40B, mặc dù có kích thước lớn, nhưng vẫn đủ hiệu quả để cạnh tranh với các mô hình có số tham số thậm chí còn lớn hơn, mang lại sự cân bằng độc đáo giữa hiệu suất và hiệu quả tài nguyên.

Một số điểm nổi bật về hiệu suất của LFM bao gồm:

  • LFM-1B: Chiếm ưu thế trong các điểm chuẩn như MMLU và ARC-C, thiết lập một tiêu chuẩn mới cho các mô hình 1B tham số.
  • LFM-3B: Vượt qua các mô hình như Phi-3.5 và Gemma 2 của Google về hiệu quả, đồng thời duy trì dấu chân bộ nhớ nhỏ, khiến nó lý tưởng cho các ứng dụng AI di động và cạnh.
  • LFM-40B: Kiến trúc MoE của mô hình này mang lại hiệu suất tương đương với các mô hình lớn hơn, với 12 tỷ tham số hoạt động tại bất kỳ thời điểm nào.

Một Kỷ Nguyên Mới Trong Hiệu Suất AI

Một thách thức đáng kể trong AI hiện đại là quản lý bộ nhớ và tính toán, đặc biệt khi làm việc với các nhiệm vụ dài như tóm tắt tài liệu hoặc tương tác trò chuyện. LFMs vượt trội trong lĩnh vực này bằng cách nén dữ liệu đầu vào một cách hiệu quả, dẫn đến việc tiêu thụ bộ nhớ giảm trong quá trình suy luận. Điều này cho phép các mô hình xử lý các chuỗi dài hơn mà không cần nâng cấp phần cứng tốn kém.

Ví dụ, LFM-3B cung cấp độ dài ngữ cảnh token 32k – khiến nó trở thành một trong những mô hình hiệu quả nhất cho các nhiệm vụ yêu cầu xử lý đồng thời lượng dữ liệu lớn.

Kiến Trúc Đổi Mới

LFMs được xây dựng trên một khuôn khổ kiến trúc độc đáo, khác biệt với các mô hình transformer truyền thống. Kiến trúc này tập trung vào các toán tử tuyến tính thích ứng, điều chỉnh tính toán dựa trên dữ liệu đầu vào. Cách tiếp cận này cho phép Liquid AI tối ưu hóa hiệu suất đáng kể trên nhiều nền tảng phần cứng, bao gồm phần cứng của NVIDIA, AMD, Cerebras và Apple.

Không gian thiết kế cho LFMs liên quan đến sự kết hợp mới của trộn tokencấu trúc trộn kênh giúp cải thiện cách mô hình xử lý dữ liệu. Điều này dẫn đến khả năng khái quát hóa và推 lý vượt trội, đặc biệt trong các nhiệm vụ dài và ứng dụng đa phương tiện.

Mở Rộng Biên Giới AI

Liquid AI có tham vọng lớn lao cho LFMs. Ngoài các mô hình ngôn ngữ, công ty đang làm việc để mở rộng các mô hình nền tảng của mình để hỗ trợ nhiều phương thức dữ liệu, bao gồm video, âm thanh và dữ liệu chuỗi thời gian. Những tiến bộ này sẽ cho phép LFMs mở rộng trên nhiều ngành công nghiệp, như dịch vụ tài chính, công nghệ sinh học và thiết bị điện tử tiêu dùng.

Công ty cũng tập trung vào việc đóng góp cho cộng đồng khoa học mở. Mặc dù các mô hình này không được mã nguồn mở tại thời điểm này, Liquid AI dự định sẽ phát hành các phát hiện nghiên cứu, phương pháp và tập dữ liệu liên quan đến cộng đồng AI rộng lớn hơn, khuyến khích sự hợp tác và đổi mới.

Truy Cập Sớm và Ứng Dụng

Liquid AI hiện đang cung cấp truy cập sớm vào LFMs của mình thông qua các nền tảng khác nhau, bao gồm Liquid Playground, Lambda (Giao diện trò chuyện và API), và Perplexity Labs. Các doanh nghiệp muốn tích hợp các hệ thống AI tiên tiến vào hoạt động của mình có thể khám phá tiềm năng của LFMs trên nhiều môi trường triển khai, từ thiết bị cạnh đến giải pháp trên cơ sở.

Liquid AI’s cách tiếp cận khoa học mở khuyến khích những người áp dụng sớm chia sẻ kinh nghiệm và thông tin của họ. Công ty đang tích cực tìm kiếm phản hồi để tinh chỉnh và tối ưu hóa các mô hình của mình cho các ứng dụng thực tế. Các nhà phát triển và tổ chức quan tâm đến việc trở thành một phần của hành trình này có thể đóng góp vào các nỗ lực kiểm tra đỏ và giúp Liquid AI cải thiện các hệ thống AI của mình.

Kết Luận

Việc ra mắt Liquid Foundation Models đánh dấu một bước tiến đáng kể trong lĩnh vực AI. Với sự tập trung vào hiệu quả, khả năng thích ứng và hiệu suất, LFMs đang sẵn sàng để thay đổi cách các doanh nghiệp tiếp cận với tích hợp AI. Khi nhiều tổ chức áp dụng các mô hình này, tầm nhìn của Liquid AI về các hệ thống AI tổng thể có thể mở rộng sẽ có khả năng trở thành một phần quan trọng của kỷ nguyên AI tiếp theo.

Nếu bạn quan tâm đến việc khám phá tiềm năng của LFMs cho tổ chức của mình, Liquid AI mời bạn liên hệ và tham gia cộng đồng ngày càng phát triển của những người áp dụng sớm đang định hình tương lai của AI.

Để biết thêm thông tin, hãy truy cập trang web chính thức của Liquid AI và bắt đầu thử nghiệm với LFMs ngay hôm nay.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.