Phỏng vấn
Etan Ginsberg, Đồng sáng lập Martian – Loạt phỏng vấn

Etan Ginsberg là Đồng sáng lập của Martian, một nền tảng định tuyến động mọi yêu cầu đến LLM tốt nhất. Thông qua định tuyến, Martian đạt được hiệu suất cao hơn và chi phí thấp hơn so với bất kỳ nhà cung cấp cá nhân nào, bao gồm cả GPT-4. Hệ thống được xây dựng trên công nghệ Model Mapping độc quyền của công ty, giúp giải mã LLM từ các hộp đen phức tạp thành kiến trúc có thể giải thích được, khiến nó trở thành ứng dụng thương mại đầu tiên của tính giải thích cơ chế.
Etan đã code, thiết kế trang web và xây dựng các doanh nghiệp điện tử cho khách hàng từ khi còn ở trường trung học. Là một người đa tài, Etan là một thí sinh vô địch trí nhớ thế giới và đứng thứ 2 tại Giải vô địch đọc nhanh thế giới ở Thâm Quyến, Trung Quốc.
Ông là một người tham gia cuộc thi hackathon. Các giải thưởng trước đây bao gồm giải ba tại Tech Crunch SZ, chung kết thứ 7 tại Hackathon Princeton và 3 giải thưởng ngành tại Hackathon Yale.
Bạn là người sáng lập startup hai lần trước đó, những công ty này là gì và bạn đã học được gì từ kinh nghiệm này?
Công ty đầu tiên của tôi là nền tảng đầu tiên để thúc đẩy và phát triển môn thể thao American Ninja Warrior. Vào năm 2012, tôi xem American Ninja Warrior như một môn thể thao ngầm (tương tự như MMA vào những năm 90) và tôi đã tạo ra nền tảng đầu tiên nơi mọi người có thể mua bản thiết kế, đặt hàng chướng ngại vật và tìm phòng tập để đào tạo. Tôi đã tư vấn cho các công ty muốn bắt đầu mở phòng tập của riêng họ, bao gồm cả việc hỗ trợ Lực lượng Đặc biệt Hoa Kỳ với một khóa đào tạo và mở rộng một cơ sở từ bản phác thảo trên giấy napkin đến 300.000 đô la doanh thu trong 3 tháng đầu tiên. Mặc dù tôi còn ở trường trung học, tôi đã có kinh nghiệm đầu tiên trong việc quản lý các đội gồm 20+ công nhân và học hỏi về quản lý hiệu quả và quan hệ giữa các cá nhân.
Công ty thứ hai của tôi là một công ty quản lý tài sản thay thế mà tôi đồng sáng lập vào năm 2017 trước khi có làn sóng ICO trong lĩnh vực tiền điện tử. Đây là lần đầu tiên tôi được tiếp xúc với NLP, nơi chúng tôi sử dụng phân tích cảm xúc của dữ liệu truyền thông xã hội như một chiến lược đầu tư.
Tôi đã học được rất nhiều kỹ năng cứng và mềm cần thiết để điều hành một startup – từ cách quản lý một đội đến các khía cạnh kỹ thuật của NLP. Đồng thời, tôi cũng đã học được rất nhiều về bản thân và về những gì tôi muốn làm việc. Tôi tin rằng những công ty thành công nhất được thành lập bởi những người sáng lập có một tầm nhìn hoặc mục tiêu rộng lớn hơn. Tôi rời khỏi lĩnh vực tiền điện tử vào năm 2017 để tập trung vào NLP vì việc tăng cường và hiểu trí thông minh của con người là điều thực sự thúc đẩy tôi. Tôi rất vui khi khám phá ra điều đó.
Khi theo học tại Đại học Pennsylvania, bạn đã thực hiện một số nghiên cứu về AI, cụ thể bạn đã nghiên cứu những gì?
Nghiên cứu của chúng tôi ban đầu tập trung vào việc xây dựng các ứng dụng của LLM. Cụ thể, chúng tôi đã làm việc trên các ứng dụng giáo dục của LLM và đang xây dựng người cố vấn nhận thức LLM đầu tiên. Kết quả khá tốt – chúng tôi đã thấy sự cải thiện 0,3 độ lệch chuẩn trong kết quả của học sinh trong các thí nghiệm ban đầu – và hệ thống của chúng tôi đã được sử dụng từ Đại học Pennsylvania đến Đại học Bhutan.
Bạn có thể thảo luận về cách nghiên cứu này sau đó dẫn bạn đến việc Đồng sáng lập Martian?
Bởi vì chúng tôi là một trong những người đầu tiên xây dựng các ứng dụng trên LLM, chúng tôi cũng là một trong những người đầu tiên gặp phải các vấn đề mà mọi người gặp phải khi xây dựng các ứng dụng trên LLM. Điều đó đã hướng dẫn nghiên cứu của chúng tôi đến lớp cơ sở hạ tầng. Ví dụ, khá sớm, chúng tôi đã tinh chỉnh các mô hình nhỏ hơn trên đầu ra của các mô hình lớn hơn như GPT-3, và tinh chỉnh các mô hình trên các nguồn dữ liệu chuyên dụng cho các nhiệm vụ như lập trình và giải quyết vấn đề toán học. Điều đó cuối cùng đã dẫn chúng tôi đến các vấn đề về hiểu hành vi mô hình và định tuyến mô hình.
Nguồn gốc của tên Martian và mối quan hệ của nó với trí thông minh cũng rất thú vị, bạn có thể chia sẻ câu chuyện về cách tên này được chọn không?
Công ty của chúng tôi được đặt tên theo một nhóm các nhà khoa học Hungary-Mỹ được gọi là “The Martians“. Nhóm này, sống vào thế kỷ 20, bao gồm một số người thông minh nhất từng sống:
- Người nổi tiếng nhất trong số họ là John Von Neumann; ông đã phát minh ra lý thuyết trò chơi, kiến trúc máy tính hiện đại, lý thuyết tự động và đã có những đóng góp cơ bản trong hàng chục lĩnh vực khác.
- Paul Erdos là nhà toán học có sản phẩm công bố nhiều nhất, với hơn 1500 bài báo.
- Theodore Von Karman đã thiết lập các lý thuyết cơ bản về động lực học chất lỏng và giúp thành lập chương trình không gian Mỹ. Ranh giới giữa Trái đất và không gian ngoài được định nghĩa bởi con người được gọi là “đường Kármán” để ghi nhận công việc của ông.
- Leo Szilard đã phát minh ra bom nguyên tử, liệu pháp bức xạ và máy gia tốc hạt.
Những nhà khoa học này và 14 người khác như họ (bao gồm cả người phát minh ra bom hydro, người giới thiệu lý thuyết nhóm vào vật lý hiện đại và những người đóng góp cơ bản cho các lĩnh vực như tổ hợp, lý thuyết số, phân tích số và lý thuyết xác suất) có một sự tương đồng đáng chú ý – tất cả đều sinh ra ở cùng một phần của Budapest. Điều đó đã khiến mọi người đặt câu hỏi: nguồn gốc của sự thông minh đến mức nào?
Để trả lời, Szilard đã đùa rằng, “Người Martians đã đến, và họ tự gọi mình là người Hungary!” Trên thực tế… không ai biết.
Loài người đang ở trong một vị trí tương tự ngày nay với một tập hợp mới của những trí tuệ siêu phàm: Trí tuệ nhân tạo. Mọi người biết rằng các mô hình có thể rất thông minh, nhưng không có ý tưởng về cách chúng hoạt động.
Mục tiêu của chúng tôi là trả lời câu hỏi đó – để hiểu và tận dụng siêu trí tuệ hiện đại.
Bạn có một lịch sử về các kỳ công trí nhớ đáng kinh ngạc, bạn đã tham gia vào các thử thách trí nhớ này như thế nào và kiến thức này đã giúp bạn với khái niệm Martian?
Trong hầu hết các môn thể thao, một vận động viên chuyên nghiệp có thể thực hiện tốt hơn 2-3 lần so với người bình thường (so sánh khoảng cách mà một người bình thường có thể đá một quả bóng vào gôn hoặc tốc độ mà họ ném một quả bóng nhanh như thế nào so với một vận động viên chuyên nghiệp). Các môn thể thao trí nhớ rất thú vị vì các vận động viên hàng đầu có thể ghi nhớ 100 lần hoặc thậm chí 1000 lần nhiều hơn người bình thường với ít đào tạo hơn so với hầu hết các môn thể thao. Hơn nữa, những người này thường là những người có trí nhớ tự nhiên trung bình, những người tín nhiệm hiệu suất của họ cho các kỹ thuật cụ thể mà bất kỳ ai cũng có thể học được. Tôi muốn tối đa hóa kiến thức của loài người, và tôi xem các giải vô địch trí nhớ thế giới như một cái nhìn sâu sắc chưa được đánh giá cao về cách chúng ta có thể tạo ra lợi nhuận phi thường khi tăng cường trí thông minh của con người.
Tôi muốn triển khai các kỹ thuật ghi nhớ trên toàn hệ thống giáo dục nên tôi đã bắt đầu khám phá cách NLP và LLM có thể giúp giảm chi phí thiết lập mà ngăn cản các phương pháp giáo dục hiệu quả nhất được sử dụng trong hệ thống giáo dục chính thống. Yash và tôi đã tạo ra người cố vấn nhận thức LLM đầu tiên và điều đó đã dẫn chúng tôi đến việc khám phá các vấn đề về triển khai LLM mà chúng tôi hiện đang giúp giải quyết.
Martian cơ bản là trừu tượng hóa quyết định về việc sử dụng LLM nào, tại sao điều này hiện tại là một điểm đau cho các nhà phát triển?
Trở nên dễ dàng hơn để tạo ra các mô hình ngôn ngữ – chi phí tính toán đang giảm, các thuật toán trở nên hiệu quả hơn và nhiều công cụ mã nguồn mở hơn có sẵn để tạo ra các mô hình này. Kết quả là, nhiều công ty và nhà phát triển đang tạo ra các mô hình tùy chỉnh được đào tạo trên dữ liệu tùy chỉnh. Vì các mô hình này có chi phí và khả năng khác nhau, bạn có thể đạt được hiệu suất tốt hơn bằng cách sử dụng nhiều mô hình, nhưng việc kiểm tra tất cả và tìm đúng mô hình để sử dụng là khó. Chúng tôi thực hiện việc đó cho các nhà phát triển.
Bạn có thể thảo luận về cách hệ thống hiểu LLM nào tốt nhất cho mỗi nhiệm vụ cụ thể?
Định tuyến tốt cơ bản là một vấn đề về việc hiểu các mô hình. Để định tuyến giữa các mô hình một cách hiệu quả, bạn muốn có thể hiểu những gì khiến chúng thất bại hoặc thành công. Việc hiểu các đặc điểm này với model-mapping cho phép chúng tôi xác định hiệu suất của mô hình sẽ như thế nào trên một yêu cầu mà không cần chạy mô hình đó. Do đó, chúng tôi có thể gửi yêu cầu đó đến mô hình sẽ tạo ra kết quả tốt nhất.
Bạn có thể thảo luận về loại tiết kiệm chi phí có thể được nhìn thấy từ việc tối ưu hóa LLM nào được sử dụng?
Chúng tôi cho phép người dùng chỉ định cách họ cân bằng giữa chi phí và hiệu suất. Nếu bạn chỉ quan tâm đến hiệu suất, chúng tôi có thể vượt trội so với GPT-4 trên openai/evals. Nếu bạn đang tìm kiếm một chi phí cụ thể để làm cho kinh tế đơn vị của bạn hoạt động, chúng tôi cho phép bạn chỉ định chi phí tối đa cho yêu cầu của bạn, sau đó tìm mô hình tốt nhất để hoàn thành yêu cầu đó. Và nếu bạn muốn có điều gì đó động hơn, chúng tôi cho phép bạn chỉ định số tiền bạn sẵn sàng trả cho một câu trả lời tốt hơn – điều đó có nghĩa là nếu hai mô hình có hiệu suất tương tự nhưng có sự khác biệt lớn về chi phí, chúng tôi có thể cho phép bạn sử dụng mô hình ít tốn kém hơn. Một số khách hàng của chúng tôi đã thấy giảm chi phí lên đến 12 lần.
Visions của bạn cho tương lai của Martian là gì?
Mỗi lần chúng tôi cải thiện sự hiểu biết cơ bản của chúng tôi về các mô hình, điều đó sẽ dẫn đến một sự thay đổi范式 cho AI. Fine-tuning là范式 được thúc đẩy bởi việc hiểu đầu ra. Prompting là范式 được thúc đẩy bởi việc hiểu đầu vào. Sự khác biệt đơn giản trong sự hiểu biết của chúng tôi về các mô hình là phần lớn những gì phân biệt ML truyền thống (“hãy đào tạo một hồi quy”) và AI tạo sinh hiện đại (“hãy kích hoạt một AGI sơ sinh”).
Mục tiêu của chúng tôi là liên tục cung cấp những đột phá trong tính giải thích cho đến khi AI được hiểu đầy đủ và chúng tôi có một lý thuyết về trí tuệ vững chắc như các lý thuyết về logic hoặc toán học.
Điều đó có nghĩa là xây dựng. Điều đó có nghĩa là tạo ra các công cụ AI tuyệt vời và đưa chúng vào tay mọi người. Điều đó có nghĩa là phát hành những thứ phá vỡ khuôn mẫu, những thứ mà không ai đã làm trước đây, và những thứ – hơn bất cứ điều gì khác – là thú vị và hữu ích.
Theo lời của Francis Bacon, “Kiến thức là sức mạnh”. Do đó, cách tốt nhất để đảm bảo rằng chúng tôi hiểu AI là phát hành các công cụ mạnh mẽ. Theo quan điểm của chúng tôi, một bộ định tuyến mô hình là một công cụ như vậy. Chúng tôi rất hào hứng khi xây dựng nó, phát triển nó và đưa nó vào tay mọi người.
Đây là công cụ đầu tiên trong nhiều công cụ mà chúng tôi sẽ phát hành trong những tháng tới. Để khám phá một lý thuyết đẹp về trí tuệ nhân tạo, để kích hoạt các loại cơ sở hạ tầng AI hoàn toàn mới, để giúp xây dựng một tương lai tươi sáng hơn cho cả con người và máy móc – chúng tôi không thể chờ đợi để chia sẻ những công cụ đó với bạn.
Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Martian.












