Phỏng vấn
Manuel Romero, Đồng sáng lập và Giám đốc Khoa học tại Maisa – Loạt bài Phỏng vấn

Manuel Romero, Đồng sáng lập và Giám đốc Khoa học tại Maisa, là một nhà nghiên cứu và kỹ sư AI tập trung vào việc phát triển các hệ thống trí tuệ nhân tạo đáng tin cậy, đạt cấp độ doanh nghiệp. Ông đồng sáng lập Maisa vào năm 2024 để xây dựng AI có trách nhiệm, có khả năng thực thi các quy trình kinh doanh phức tạp với tính minh bạch và kiểm soát. Trước Maisa, Romero đã đảm nhiệm các vai trò kỹ sư AI cấp cao và học máy tại các công ty bao gồm Clibrain và Narrativa, nơi ông chuyên về xử lý ngôn ngữ tự nhiên và các hệ thống AI quy mô lớn. Trước đó trong sự nghiệp, ông từng là kỹ sư phần mềm full-stack và chuyên gia DevOps trước khi chuyển sang nghiên cứu và phát triển AI tiên tiến, trở thành một người đóng góp tích cực cho hệ sinh thái AI mã nguồn mở. Maisa AI phát triển “công nhân kỹ thuật số” tự trị, các tác nhân AI được thiết kế để tự động hóa các quy trình làm việc doanh nghiệp phức tạp trong khi vẫn duy trì khả năng truy xuất nguồn gốc, quản trị và độ tin cậy. Nền tảng này cho phép các tổ chức xây dựng và triển khai các tác nhân AI bằng ngôn ngữ tự nhiên, cho phép tự động hóa trên các hệ thống nội bộ và nguồn dữ liệu mà không cần mã hóa nhiều. Bằng cách tập trung vào lập luận có thể kiểm chứng và thực thi có cấu trúc, Maisa hướng tới việc khắc phục những hạn chế phổ biến liên quan đến hệ thống AI tạo sinh và giúp các doanh nghiệp triển khai AI tự trị an toàn ở quy mô lớn. Anh thường tập trung vào việc hiểu “lý do sâu xa” đằng sau các hệ thống AI. Từ góc độ kỹ thuật, điều gì thôi thúc anh đồng sáng lập Maisa vào năm 2024, và anh tin rằng khoảng trống nào trong kiến trúc AI doanh nghiệp chưa được giải quyết? Động lực đằng sau việc thành lập Maisa xuất phát từ nhận thức rằng hầu hết các ngăn xếp AI doanh nghiệp được xây dựng xung quanh các mô hình, chứ không phải các hệ thống. Trong thời kỳ bùng nổ AI tạo sinh, nhiều công ty tập trung vào việc tích hợp các mô hình ngôn ngữ lớn vào các quy trình làm việc hiện có. Tuy nhiên, các hệ thống này thường mong manh, mờ đục và khó vận hành ở quy mô lớn. Chúng thiếu:
- khả năng thực thi xác định ở những nơi quan trọng.
- khả năng quan sát, truy xuất nguồn gốc mạnh mẽ
- khả năng tái lập
Khoảng trống chúng tôi nhìn thấy là sự vắng mặt của một cơ sở hạ tầng AI thực sự cho doanh nghiệp. Các công ty đang xây dựng ứng dụng xung quanh các API LLM, nhưng họ thiếu thứ gì đó tương đương với một kiến trúc máy tính cho công việc tri thức. Maisa được tạo ra để giải quyết khoảng trống đó bằng cách thiết kế một kiến trúc tập trung vào Đơn vị Xử lý Tri thức (KPU), một hệ thống cho phép AI hoạt động đáng tin cậy bên trong các quy trình làm việc doanh nghiệp thực tế. Anh đã làm việc với các hệ thống xử lý ngôn ngữ tự nhiên tiên tiến và hệ thống tạo sinh trước khi thành lập Maisa. Những kinh nghiệm đó đã định hình các lựa chọn kiến trúc đằng sau nền tảng như thế nào? Kinh nghiệm làm việc của tôi trong NLP và NLG, đặc biệt là xung quanh việc đào tạo và tiền đào tạo các mô hình ngôn ngữ và sau đó là các mô hình ngôn ngữ lớn (hàng trăm mô hình), đã làm rõ một điều khi cố gắng xây dựng các hệ thống thực sự trên chúng. Kiến trúc transformer cực kỳ mạnh mẽ, nhưng nó đi kèm với ít nhất ba hạn chế nền tảng phải được giải quyết để sử dụng nó một cách đáng tin cậy trong sản xuất. Đầu tiên là ảo giác. Các mô hình này tạo ra văn bản theo xác suất và có thể tạo ra đầu ra nghe có vẻ đúng nhưng không dựa trên thông tin đã được xác minh. Thứ hai là hạn chế về ngữ cảnh. Ngay cả với cửa sổ ngữ cảnh lớn hơn, các mô hình hoạt động trong một không gian token có giới hạn, điều này khiến việc lập luận trên các khối kiến thức lớn hoặc phức tạp trở nên khó khăn. Thứ ba là thông tin cập nhật. Các mô hình được đào tạo trước đại diện cho một bản chụp kiến thức tại thời điểm đào tạo, trong khi môi trường doanh nghiệp đòi hỏi các hệ thống có thể lập luận trên thông tin thay đổi liên tục. Việc nhận ra những ràng buộc này đã định hình nhiều quyết định kiến trúc đằng sau Maisa. Thay vì chỉ dựa vào mô hình, chúng tôi tập trung vào việc xây dựng một hệ thống cung cấp quyền truy cập có cấu trúc vào tri thức, cơ chế xác thực và thực thi được kiểm soát để AI có thể hoạt động đáng tin cậy trong các quy trình làm việc doanh nghiệp thực tế. Nhiều doanh nghiệp thử nghiệm với AI tạo sinh nhưng gặp khó khăn khi vượt ra ngoài các dự án thí điểm. Từ góc độ thiết kế hệ thống, lý do cốt lõi khiến việc mở rộng quy mô thất bại ở nhiều tổ chức là gì? Nhiều doanh nghiệp gặp khó khăn khi vượt ra ngoài các dự án thí điểm AI tạo sinh vì hầu hết các triển khai được xây dựng như các thí nghiệm hơn là các hệ thống mạnh mẽ. Các nguyên mẫu ban đầu thường dựa vào kỹ thuật nhắc nhở, điều phối nhẹ và các đường dẫn truy xuất đơn giản, có thể chứng minh giá trị nhưng không cung cấp độ tin cậy, khả năng quan sát hoặc kiểm soát cần thiết cho môi trường sản xuất. Khi các tổ chức cố gắng mở rộng quy mô các hệ thống này, họ gặp phải các vấn đề như đầu ra không nhất quán, thiếu khả năng truy xuất nguồn gốc, khó khăn trong việc tích hợp với các quy trình làm việc doanh nghiệp và quản trị hạn chế về cách AI hoạt động. Về cốt lõi, vấn đề là các mô hình ngôn ngữ lớn là các bộ tạo xác suất, trong khi các quy trình doanh nghiệp đòi hỏi hành vi có thể dự đoán và kiểm toán được. Nếu không có một kiến trúc bổ sung cấu trúc xung quanh lập luận, xác thực, thực thi và giám sát, các hệ thống AI tạo sinh vẫn khó mở rộng quy mô vượt ra ngoài các trường hợp sử dụng riêng lẻ. Công nhân Kỹ thuật số của Maisa được thiết kế để có thể kiểm toán và có cấu trúc thay vì hoàn toàn xác suất. Điều đó có ý nghĩa thực tế như thế nào đối với các doanh nghiệp đang đánh giá AI cho mục đích sử dụng sản xuất? Khi chúng tôi nói Công nhân Kỹ thuật số của Maisa có thể kiểm toán và có cấu trúc thay vì hoàn toàn xác suất, chúng tôi có nghĩa là AI hoạt động trong một hệ thống được kiểm soát nơi các hành động và lập luận của nó có thể được theo dõi và quản trị. Thay vì cho phép một mô hình tự do tạo ra đầu ra và quyết định, hệ thống cấu trúc cách AI tương tác với dữ liệu, công cụ và quy trình làm việc. Mỗi bước trong quy trình có thể được ghi nhật ký, kiểm tra và xác thực, và các hành động được thực thi thông qua các giao diện được xác định thay vì trực tiếp từ đầu ra mô hình. Đối với các doanh nghiệp, điều này có nghĩa là các hệ thống AI có thể được giám sát, kiểm toán và tích hợp vào các quy trình quan trọng với sự tự tin lớn hơn. Nó chuyển AI từ một trợ lý hộp đen thành một hệ thống có hành vi có thể được hiểu, kiểm soát và tin tưởng trong môi trường sản xuất. Là kiến trúc sư của Đơn vị Xử lý Tri thức, nó khác với một lớp điều phối điển hình hoặc công cụ quy trình làm việc được xây dựng xung quanh các mô hình ngôn ngữ lớn như thế nào? Đơn vị Xử lý Tri thức khác với các lớp điều phối điển hình vì nó được thiết kế để quản lý toàn bộ vòng đời của lập luận do AI điều khiển thay vì chỉ đơn giản là phối hợp các lời nhắc và lệnh gọi mô hình. Hầu hết các khung điều phối đóng vai trò là trình quản lý quy trình làm việc kết hợp các bước như truy xuất, nhắc nhở và thực thi công cụ. KPU hoạt động ở cấp độ kiến trúc sâu hơn bằng cách cấu trúc cách tri thức được truy cập, cách lập luận được thực hiện và cách các hành động được thực thi trong hệ thống. Nó coi xử lý tri thức như một lớp tính toán cốt lõi, tích hợp bộ nhớ, xác thực và thực thi được kiểm soát để AI có thể hoạt động đáng tin cậy bên trong các quy trình làm việc doanh nghiệp phức tạp thay vì chỉ tạo ra phản hồi. Trong các ngành công nghiệp được quản lý chặt chẽ, khả năng chấp nhận rủi ro thấp. Những quyết định thiết kế cụ thể nào anh đã thực hiện để đảm bảo đầu ra AI vẫn đáng tin cậy và không lan truyền lỗi trên các quy trình làm việc phức tạp? Trong các ngành công nghiệp được quản lý chặt chẽ, độ tin cậy và kiểm soát là điều cần thiết, vì vậy chúng tôi đã thiết kế hệ thống với một số biện pháp bảo vệ để đảm bảo đầu ra AI vẫn đáng tin cậy. Một nguyên tắc chính là thực thi có cấu trúc, nơi AI không thể trực tiếp kích hoạt các hành động quan trọng mà không đi qua các giao diện được kiểm soát. Chúng tôi cũng kết hợp các lớp xác thực kiểm tra đầu ra mô hình so với lược đồ, quy tắc hoặc cơ chế thứ cấp trước khi chúng được chấp nhận. Ngoài ra, hệ thống duy trì khả năng quan sát đầy đủ, ghi lại các bước lập luận, tương tác công cụ và quyết định để chúng có thể được theo dõi và kiểm toán. Cùng nhau, những lựa chọn thiết kế này giúp ngăn chặn lỗi lan truyền qua các quy trình làm việc và cho phép các tổ chức vận hành hệ thống AI với mức độ tin cậy và quản trị được yêu cầu trong môi trường được quản lý chặt chẽ. Những trường hợp sử dụng ban đầu hấp dẫn nhất mà anh đã thấy Công nhân Kỹ thuật số chuyển từ hỗ trợ có hướng dẫn sang thực thi hoàn toàn do AI điều khiển là gì? Một số trường hợp sử dụng ban đầu hấp dẫn nhất xuất hiện trong các quy trình làm việc tập trung vào tri thức nơi các quy trình được xác định rõ ràng nhưng vẫn đòi hỏi phân tích và ra quyết định đáng kể. Trong các lĩnh vực như xem xét tuân thủ, hoạt động hỗ trợ kỹ thuật và quản lý tri thức nội bộ, Công nhân Kỹ thuật số có thể vượt ra ngoài việc chỉ hỗ trợ con người và bắt đầu thực thi các nhiệm vụ có cấu trúc từ đầu đến cuối. Chúng có thể truy xuất và phân tích khối lượng lớn thông tin nội bộ, áp dụng các quy trình đã xác định, tương tác với các hệ thống doanh nghiệp thông qua các công cụ được kiểm soát và tạo ra đầu ra cung cấp trực tiếp vào các quy trình làm việc vận hành. Sự thay đổi then chốt xảy ra khi AI không chỉ tạo ra đề xuất mà còn có thể thực hiện đáng tin cậy các hành động được xác định trong một hệ thống được quản trị, cho phép các tổ chức tự động hóa các phần của công việc tri thức phức tạp thay vì chỉ tăng cường nó. Khi sự giám sát quy định xung quanh AI gia tăng trên toàn cầu, anh nhìn thấy cơ sở hạ tầng AI cốt lõi sẽ phát triển như thế nào để đáp ứng các yêu cầu tuân thủ mà không hạn chế đổi mới? Khi sự giám sát quy định xung quanh AI gia tăng, tôi tin rằng chúng ta sẽ thấy sự chuyển dịch khỏi các kiến trúc chỉ đơn giản gọi các API của nhà cung cấp mô hình và tin tưởng đầu ra một cách mù quáng. Các doanh nghiệ












