Phỏng vấn

Tiến sĩ Xianxin Guo, CEO và Đồng sáng lập của Lumai – Loạt phỏng vấn

mm

Tiến sĩ Xianxin Guo, CEO và Đồng sáng lập của Lumai, là một nhà vật lý và doanh nhân công nghệ sâu, chuyên về tính toán quang học và phần cứng trí tuệ nhân tạo, với bằng tiến sĩ về vật lý lượng tử và quang học phi tuyến từ Đại học Khoa học và Công nghệ Hồng Kông. Ông trước đây đã từng giữ các vị trí nghiên cứu, bao gồm cả vị trí nghiên cứu sau tiến sĩ tại Đại học Calgary và Học bổng nghiên cứu 1851 tại Đại học Oxford, nơi ông đã đóng góp vào các tiến bộ trong lĩnh vực photonics và gia tốc trí tuệ nhân tạo. Từ vị trí trưởng bộ phận nghiên cứu đến CEO, ông là nhà phát minh chính đằng sau công nghệ cốt lõi của công ty và mang lại hơn một thập kỷ kinh nghiệm tại giao điểm của vật lý, học máy và hệ thống tính toán tiên tiến.

Lumai là một công ty spinout của Đại học Oxford, đang phát triển các bộ xử lý trí tuệ nhân tạo thế hệ tiếp theo dựa trên tính toán quang học 3D, sử dụng ánh sáng thay vì điện để thực hiện các phép tính trí tuệ nhân tạo quan trọng. Công nghệ của họ được thiết kế để tăng tốc các phép toán ma trận mà dưới đây là các mô hình trí tuệ nhân tạo hiện đại, mang lại tốc độ xử lý nhanh hơn đáng kể trong khi giảm tiêu thụ năng lượng so với các GPU truyền thống dựa trên silicon. Bằng cách tích hợp tính toán quang học vào môi trường trung tâm dữ liệu hiện có, Lumai nhằm mục đích cho phép triển khai trí tuệ nhân tạo có thể mở rộng và tiết kiệm chi phí hơn, giải quyết các hạn chế ngày càng tăng về năng lực tính toán và sử dụng năng lượng trong các hệ thống trí tuệ nhân tạo quy mô lớn.

Bạn bắt đầu sự nghiệp của mình trong lĩnh vực vật lý lượng tử và quang học phi tuyến, sau đó trở thành Học bổng nghiên cứu 1851 tại Đại học Oxford trước khi đồng sáng lập Lumai từ nghiên cứu của mình. Điều gì là khoảnh khắc quyết định khi bạn nhận ra rằng tính toán quang học có thể chuyển từ lý thuyết học thuật sang một công ty thương mại khả thi?

Trong thời gian tại Đại học Oxford, chúng tôi đã khám phá cách các tính chất của ánh sáng trong không gian tự do có thể được sử dụng để giải quyết các loại phép toán ma trận mà dưới đây là các mô hình học máy. Vào khoảng thời gian đó, các hạn chế của phần cứng truyền thống cho trí tuệ nhân tạo đã trở nên quan trọng hơn. Sự hội tụ của những thách thức mà chúng tôi đã giải quyết trong nghiên cứu của mình và nhu cầu về tính toán hiệu quả hơn đã mang lại cho chúng tôi sự tự tin rằng chúng tôi có thể đưa ý tưởng của mình và giải quyết các vấn đề thực tế.

Chúng tôi đã đi được một chặng đường dài từ nghiên cứu ban đầu đó – tại Lumai, chúng tôi hiện đã xây dựng hệ thống tính toán quang học đầu tiên trên thế giới có khả năng chạy các mô hình ngôn ngữ lớn có một tỷ tham số trong thời gian thực.

Lumai đang giải quyết một trong những nút thắt lớn nhất trong lĩnh vực trí tuệ nhân tạo ngày nay, đó là hạn chế về năng lượng và khả năng mở rộng của tính toán dựa trên silicon. Những hạn chế cụ thể nào trong kiến trúc truyền thống đã đẩy bạn đến một phương pháp khác biệt cơ bản sử dụng ánh sáng?

Điều đã đẩy chúng tôi là quỹ đạo hạn chế của các giải pháp silicon. Với silicon, bạn đang thấy những lợi ích tăng dần, nhưng chúng đi kèm với sự tăng trưởng không tương xứng về công suất và độ phức tạp. Hạn chế của việc mở rộng silicon chủ yếu là do vật lý – tần số không tăng, và số lượng transistor có thể được chuyển đổi bị giới hạn bởi nhiệt. Dòng điện rò rỉ vẫn là một vấn đề. Dự kiến silicon chỉ đóng góp 25% vào việc tăng hiệu suất hàng năm.

Đến một thời điểm, điều đó có ý nghĩa khi hỏi liệu một môi trường vật lý khác có thể xử lý những hoạt động đó một cách tự nhiên hơn, thay vì tiếp tục đẩy các electron mạnh hơn.

Công việc của bạn tập trung vào tính toán quang học và học máy. Làm thế nào sử dụng photon thay vì electron thay đổi cơ bản cách tính toán xảy ra ở cấp độ phần cứng?

Với electron, tính toán vốn là tuần tự và mất mát – bạn đang chuyển đổi transistor, di chuyển điện tích, tạo ra nhiệt. Mỗi hoạt động có một chi phí nhiệt, và chi phí đó tích lũy.

Photon hành xử rất khác. Ánh sáng di chuyển mà không có cùng mức mất mát, và quan trọng nhất, bằng cách sử dụng các tính chất của ánh sáng, số lượng lớn các phép toán ma trận có thể được thực hiện song song chỉ bằng cách cấu trúc cách các chùm ánh sáng tương tác thông qua một môi trường vật lý. Tính toán xảy ra trong sự lan truyền của ánh sáng chính nó, không phải trong việc chuyển đổi hàng tỷ cổng.

Công nghệ của Lumai tận dụng xử lý quang học 3D và song song hóa không gian lớn. Bạn có thể giải thích cách kiến trúc này cho phép cải thiện đáng kể về thông lượng và hiệu quả so với các GPU?

Mục tiêu là thực hiện phép nhân ma trận dày đặc một cách hiệu quả và nhanh nhất có thể trong một chu kỳ. Phương pháp của Lumai làm chính xác điều đó bằng cách sử dụng ánh sáng trong một thể tích 3D, thực hiện hàng triệu hoạt động đồng thời.

Bạn không thể đạt được mức độ song song hóa đó trong các cấu trúc 2D, nơi các hoạt động được xử lý trên hàng trăm lõi yêu cầu di chuyển dữ liệu liên tục. Chính sự song song hóa này – kết hợp với việc một khi bạn đã ở trong lĩnh vực ánh sáng, các hoạt động có thể được thực hiện mà không mất năng lượng – thúc đẩy cả sự cải thiện về thông lượng và giảm đáng kể về năng lượng trên mỗi token.

Nhiều công ty cơ sở hạ tầng trí tuệ nhân tạo vẫn tập trung vào đào tạo, trong khi Lumai lại nhắm vào suy luận. Tại sao bạn tin rằng suy luận là thách thức định nghĩa của giai đoạn tiếp theo của trí tuệ nhân tạo?

Suy luận là nơi trí tuệ nhân tạo thực sự làm điều gì đó hữu ích – mỗi truy vấn được trả lời, mỗi nhiệm vụ của tác nhân được hoàn thành, mỗi tài liệu được tạo. Chúng tôi đã bước vào kỷ nguyên suy luận, và nhu cầu đang tăng với tốc độ mà phần cứng tập trung vào đào tạo không bao giờ được thiết kế để hấp thụ.

Kinh tế cũng khác: suy luận chạy liên tục, trên hàng triệu người dùng. Chi phí trên mỗi token trở thành chỉ số định nghĩa, và đó là nơi mà tường năng lượng ảnh hưởng nặng nề nhất.

Cái gì làm cho suy luận đặc biệt phù hợp với tính toán quang học là giai đoạn tiền điền của suy luận phân tán là nặng về tính toán. Trong giai đoạn tiền điền này, toàn bộ ngữ cảnh được xử lý trước khi tạo ra phản hồi. Điều này gần như hoàn hảo trên động cơ quang học của chúng tôi và đó là nơi chúng tôi tập trung đầu tiên.

Một trong những thách thức lâu dài trong tính toán quang học đã là sự ổn định và khả năng mở rộng. Những đột phá kỹ thuật quan trọng nào đã cho phép Lumai vượt qua các rào cản này?

Thách thức không bao giờ là chứng minh rằng quang học có thể thực hiện tính toán – các nhà nghiên cứu đã chỉ ra điều đó trong nguyên tắc trong nhiều năm. Thách thức là làm cho nó hoạt động ở quy mô, bên ngoài phòng thí nghiệm.

Hai điều quan trọng nhất. Đầu tiên, chúng tôi sử dụng cùng loại thành phần đã được triển khai trong các trung tâm dữ liệu ngày nay cho truyền thông và mạng. Không có vật liệu kỳ lạ, không có chuỗi cung ứng suy đoán. Thứ hai, chúng tôi đã đưa ra một lựa chọn kiến trúc có chủ ý để sử dụng thiết kế lai, kết hợp động cơ tensor quang học với xử lý kỹ thuật số cho kiểm soát hệ thống và phần mềm.

Hệ thống của bạn sử dụng một phương pháp lai kết hợp các thành phần quang học và kỹ thuật số. Làm thế nào sự cân bằng này quan trọng trong việc làm cho tính toán quang học trở nên thực tế cho việc triển khai trung tâm dữ liệu trong thế giới thực?

Nó là cơ bản. Tính toán quang học không có nghĩa là thay thế mọi thứ bằng ánh sáng. Các hệ thống kỹ thuật số cực kỳ tốt trong kiểm soát, trình tự và giao tiếp với hệ sinh thái phần mềm mà ngành công nghiệp đã xây dựng trong nhiều thập kỷ. Động cơ quang học của chúng tôi vượt trội trong các hoạt động toán học cốt lõi mà thống trị tính toán suy luận. Kiến trúc lai cho phép mỗi thành phần làm những gì nó làm tốt nhất.

Từ góc độ triển khai, điều này rất quan trọng. Lumai Iris tích hợp vào cơ sở hạ tầng trung tâm dữ liệu hiện có, sử dụng các giao diện tiêu chuẩn và chạy các mô hình thực, bao gồm Llama 8B và 70B ngày nay.

Với thông báo về dòng máy chủ Lumai Iris, đặc biệt là máy chủ Iris Nova, việc đạt được suy luận thời gian thực trên các mô hình một tỷ tham số có ý nghĩa gì cho tương lai của cơ sở hạ tầng trí tuệ nhân tạo?

Nó cho thấy rằng tính toán quang học đã vượt qua từ nghiên cứu vào thực tế. Chạy các mô hình một tỷ tham số trong thời gian thực là điểm chứng minh mà ngành công nghiệp cần. Gia đình máy chủ Lumai Iris bao gồm ba máy chủ: Nova, Aura và Tetra. Máy chủ Lumai Iris Nova, máy chủ đầu tiên trong gia đình, hiện có sẵn để đánh giá và chúng tôi đã bắt đầu tham gia với các đối tác muốn đưa nó vào sử dụng chống lại các khối lượng công việc suy luận thực tế.

Phổ biến hơn, nó cho thấy rằng quỹ đạo của cơ sở hạ tầng trí tuệ nhân tạo đang chuẩn bị thay đổi. Giả định đã là việc mở rộng suy luận có nghĩa là mua thêm GPU, tiêu thụ nhiều năng lượng hơn, xây dựng các trung tâm dữ liệu lớn hơn. Máy chủ Lumai Iris Nova cho thấy có một con đường khác – một con đường mang lại hiệu suất đáng kể hơn trên mỗi kilowatt và một cấu trúc chi phí khác biệt trên mỗi token. Khi dòng máy chủ Lumai Iris phát triển, những ý nghĩa đối với cách các hyperscaler và doanh nghiệp nghĩ về việc mua sắm tính toán sẽ rất đáng kể.

Thông cáo báo chí nhấn mạnh việc tiêu thụ năng lượng thấp hơn tới 90% so với các hệ thống truyền thống. Sự đột phá này có ý nghĩa như thế nào trong bối cảnh các hạn chế năng lượng ngày càng tăng mà các trung tâm dữ liệu toàn cầu đang phải đối mặt?

Hạn chế năng lượng là thách thức cơ sở hạ tầng định nghĩa của kỷ nguyên trí tuệ nhân tạo – khả năng cung cấp điện đã trở thành một yếu tố hạn chế trên các kế hoạch triển khai và chúng tôi đã đạt đến cái gọi là tường năng lượng.

Trước bối cảnh đó, việc giảm 90% tiêu thụ năng lượng thay đổi hoàn toàn các yếu tố kinh tế và tính khả thi của trí tuệ nhân tạo ở quy mô. Một hệ thống Lumai duy nhất có thể thay thế hàng chục GPU tiêu thụ nhiều năng lượng, điều này dịch thành một sự thay đổi đáng kể về những gì có thể đạt được trong một phạm vi năng lượng nhất định.

Cũng có một chiều kích chi phí: chi phí xây dựng trung tâm dữ liệu phản ánh khả năng cung cấp điện, vì vậy một trung tâm dữ liệu tiêu thụ ít năng lượng hơn sẽ ít tốn kém hơn để xây dựng. Giảm tiêu thụ năng lượng trực tiếp giảm chi phí trên mỗi token – điều mà cuối cùng làm cho trí tuệ nhân tạo trở nên khả thi về mặt kinh tế ở quy mô mà ngành công nghiệp đang xây dựng.

Khi nhìn về tương lai, khi ngành công nghiệp bắt đầu nói về một kỷ nguyên sau silicon, bạn nhìn thấy tính toán quang học sẽ phát triển như thế nào trong thập kỷ tới và Lumai sẽ đóng vai trò gì trong việc định hình sự chuyển đổi đó?

Kỷ nguyên sau silicon đã bắt đầu, và nó đang xảy ra cùng lúc với sự chuyển dịch sang kỷ nguyên suy luận và nhu cầu tiếp tục về hiệu suất cao hơn với chi phí thấp hơn trên mỗi token. Silicon chắc chắn sẽ tiếp tục đóng một vai trò, nhưng giả định rằng mỗi thế hệ cải tiến tính toán đến từ việc nâng cấp các nút silicon không còn đáng tin cậy với tốc độ mà trí tuệ nhân tạo đòi hỏi. Chúng tôi nhìn thấy tính toán quang học được sử dụng trong các phần quan trọng của ngăn xếp nơi cần xử lý song song, hiệu suất cao.

Đối với Lumai, con đường là tiếp tục đẩy mạnh mật độ, hiệu quả và khả năng của tính toán quang học và triển khai nó đến các trung tâm dữ liệu. Tầm nhìn là một thế giới nơi chi phí năng lượng của trí tuệ giảm và nơi một trung tâm dữ liệu megawatt có thể tạo ra cùng một lượng token như một cơ sở gigawatt ngày nay.

That future is not distant speculation. Chúng tôi đã xây dựng hệ thống đầu tiên chứng minh tính toán quang học hoạt động ở quy mô. Mọi thứ từ đây là kỹ thuật.

Cảm ơn vì cuộc phỏng vấn tuyệt vời, độc giả muốn tìm hiểu thêm nên truy cập Lumai.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.