sơ khai Etan Ginsberg, Đồng sáng lập Martian - Chuỗi bài phỏng vấn - Unite.AI
Kết nối với chúng tôi

Phỏng vấn

Etan Ginsberg, Đồng sáng lập Martian – Chuỗi bài phỏng vấn

mm
cập nhật on

Etan Ginsberg là người đồng sáng lập của Sao chổi, một nền tảng tự động định tuyến mọi lời nhắc tới LLM tốt nhất. Thông qua định tuyến, Martian đạt được hiệu suất cao hơn và chi phí thấp hơn bất kỳ nhà cung cấp riêng lẻ nào, kể cả GPT-4. Hệ thống này được xây dựng trên công nghệ Lập bản đồ mô hình độc đáo của công ty giúp giải nén LLM từ các hộp đen phức tạp thành một kiến ​​trúc dễ hiểu hơn, biến nó thành ứng dụng thương mại đầu tiên về khả năng diễn giải cơ học.

Etan đã viết mã, thiết kế trang web và xây dựng doanh nghiệp điện tử cho khách hàng từ khi còn học cấp hai. Một học giả Etan là Đối thủ của Giải vô địch Trí nhớ Thế giới và đứng thứ 2 tại Giải vô địch Đọc Tốc độ Thế giới ở Thâm Quyến, Trung Quốc.

Anh ấy là một đối thủ cạnh tranh vid hackathon. Các giải thưởng trước đây bao gồm giải thứ 3 tại Tech Crunch SZ, top 7 lọt vào chung kết tại Princeton Hackathon và 3 giải thưởng trong ngành tại Yale Hackathon.

Bạn đã từng hai lần sáng lập công ty khởi nghiệp, những công ty này là gì và bạn học được gì từ trải nghiệm này?

Công ty đầu tiên của tôi là nền tảng đầu tiên để quảng bá và phát triển môn thể thao Chiến binh Ninja Mỹ. Quay trở lại năm 2012, tôi xem American Ninja Warrior như một môn thể thao ngầm (tương tự như MMA vào những năm 90) và tôi đã tạo ra nền tảng đầu tiên nơi mọi người có thể mua bản thiết kế, đặt chướng ngại vật và tìm phòng tập thể dục để tập luyện. Tôi đã tư vấn cho các công ty muốn thành lập phòng tập thể dục của riêng mình, bao gồm hỗ trợ Lực lượng Đặc biệt Hoa Kỳ trong một khóa đào tạo và mở rộng quy mô cơ sở từ bản phác thảo khăn ăn lên doanh thu 300 nghìn đô la trong 3 tháng đầu tiên. Mặc dù đang học trung học nhưng tôi đã có trải nghiệm đầu tiên trong việc quản lý các nhóm gồm hơn 20 công nhân và học được cách quản lý hiệu quả cũng như các mối quan hệ giữa các cá nhân.

Công ty thứ hai của tôi là một công ty quản lý tài sản thay thế mà tôi đồng sáng lập vào năm 2017 trước làn sóng ICO trong lĩnh vực tiền điện tử. Đây là lần đầu tiên tôi tiếp xúc với NLP, nơi chúng tôi sử dụng phân tích cảm tính về dữ liệu mạng xã hội làm chiến lược đầu tư.

Tôi đã học được rất nhiều kỹ năng cứng và mềm khi điều hành một công ty khởi nghiệp - từ cách quản lý nhóm đến các khía cạnh kỹ thuật của NLP. Đồng thời, tôi cũng học được nhiều điều về bản thân và về lĩnh vực tôi muốn làm việc. Tôi tin rằng những công ty thành công nhất đều được thành lập bởi những người sáng lập có tầm nhìn hoặc mục tiêu rộng hơn thúc đẩy họ. Tôi rời tiền điện tử vào năm 2017 để tập trung vào NLP vì việc nâng cao và hiểu biết trí thông minh của nhân loại là điều thực sự thúc đẩy tôi. Tôi rất vui khi phát hiện ra điều đó.

Khi theo học tại Đại học Pennsylvania, bạn đã thực hiện một số nghiên cứu về AI, bạn đang nghiên cứu cụ thể điều gì?

Nghiên cứu của chúng tôi ban đầu tập trung vào việc xây dựng các ứng dụng LLM. Đặc biệt, chúng tôi đã nghiên cứu các ứng dụng giáo dục của LLM và đang xây dựng chương trình dạy kèm nhận thức đầu tiên được hỗ trợ bởi LLM. Kết quả khá tốt – chúng tôi nhận thấy kết quả của học sinh đã cải thiện độ lệch chuẩn 0.3 trong thử nghiệm ban đầu – và hệ thống của chúng tôi đã được sử dụng từ Đại học Pennsylvania đến Đại học Bhutan.

Bạn có thể thảo luận về việc nghiên cứu này đã đưa bạn đến với Người sao Hỏa đồng sáng lập như thế nào không?

Bởi vì chúng tôi là một trong những người đầu tiên xây dựng ứng dụng dựa trên LLM nên chúng tôi cũng là một trong những người đầu tiên gặp phải những vấn đề mà mọi người gặp phải khi họ xây dựng ứng dụng dựa trên LLM. Điều đó đã hướng nghiên cứu của chúng tôi tới lớp cơ sở hạ tầng. Ví dụ: từ rất sớm, chúng tôi đã tinh chỉnh các mô hình nhỏ hơn trên đầu ra của các mô hình lớn hơn như GPT-3 và tinh chỉnh các mô hình trên các nguồn dữ liệu chuyên dụng cho các nhiệm vụ như lập trình và giải toán. Điều đó cuối cùng dẫn chúng ta đến các vấn đề về hiểu hành vi của mô hình và về định tuyến mô hình.

Nguồn gốc của cái tên Sao Hỏa và mối quan hệ của nó với trí thông minh cũng rất thú vị, bạn có thể chia sẻ câu chuyện về việc cái tên này được chọn như thế nào không?

Công ty chúng tôi được đặt theo tên của một nhóm các nhà khoa học người Mỹ gốc Hungary được gọi là “Người sao Hỏa”. Nhóm này sống ở thế kỷ 20, bao gồm một số người thông minh nhất từng sống:

  • Nổi tiếng nhất trong số đó là John von Neumann; ông đã phát minh ra lý thuyết trò chơi, kiến ​​trúc máy tính hiện đại, lý thuyết automata và có những đóng góp cơ bản trong hàng chục lĩnh vực khác.
  • Paul Erdos là nhà toán học thành công nhất mọi thời đại, đã xuất bản hơn 1500 bài báo.
  • Theodore Von Karman đã thiết lập các lý thuyết cơ bản về khí động học và giúp thành lập chương trình không gian của Mỹ. Ranh giới do con người xác định giữa Trái đất và không gian bên ngoài được đặt tên là “đường Kármán” để ghi nhận công trình của ông.
  • Leo Szilard phát minh ra bom nguyên tử, xạ trị và máy gia tốc hạt.

Những nhà khoa học này và 14 người khác giống họ (bao gồm người phát minh ra bom khinh khí, người đã đưa lý thuyết nhóm vào vật lý hiện đại và những người đóng góp cơ bản cho các lĩnh vực như tổ hợp, lý thuyết số, phân tích số và lý thuyết xác suất) có chung một điểm tương đồng đáng chú ý - tất cả họ đều có những điểm tương đồng đáng chú ý. được sinh ra ở cùng một phần của Budapest. Điều đó khiến mọi người đặt câu hỏi: nguồn gốc của nhiều thông tin tình báo đến vậy là gì?

Đáp lại, Szilard nói đùa rằng, "Người sao Hỏa đã ở đây và họ tự gọi mình là người Hungary!" Trong thực tế… không ai biết.

Nhân loại ngày nay thấy mình ở vị trí tương tự đối với một nhóm trí tuệ siêu trí tuệ mới có tiềm năng: Trí tuệ nhân tạo. Mọi người biết rằng các mô hình có thể cực kỳ thông minh nhưng lại không biết chúng hoạt động như thế nào.

Sứ mệnh của chúng tôi là trả lời câu hỏi đó – hiểu và khai thác trí tuệ siêu việt hiện đại.

Bạn có lịch sử về những thành tích trí nhớ đáng kinh ngạc, làm thế nào bạn lại đắm mình vào những thử thách trí nhớ này và kiến ​​thức này đã hỗ trợ bạn như thế nào với khái niệm về Sao Hỏa?

Trong hầu hết các môn thể thao, một vận động viên chuyên nghiệp có thể đạt thành tích gấp khoảng 2-3 lần người bình thường (so sánh xem một người bình thường có thể đá vào khung thành bao xa hoặc họ ném bóng nhanh nhanh như thế nào so với vận động viên chuyên nghiệp). Các môn thể thao trí nhớ rất hấp dẫn vì các vận động viên hàng đầu có thể ghi nhớ nhiều hơn 100 lần hoặc thậm chí 1000 lần so với người bình thường mà không cần tập luyện nhiều hơn hầu hết các môn thể thao. Hơn nữa, đây thường là những người có trí nhớ tự nhiên trung bình và cho rằng hiệu suất của họ là nhờ những kỹ thuật cụ thể mà ai cũng có thể học được. Tôi muốn tối đa hóa kiến ​​thức của nhân loại, và tôi coi giải vô địch trí nhớ thế giới là một hiểu biết sâu sắc bị đánh giá thấp về cách chúng ta có thể tạo ra những lợi ích phi thường bằng cách tăng trí thông minh của con người.

Tôi muốn triển khai các kỹ thuật bộ nhớ trong toàn bộ hệ thống giáo dục nên tôi bắt đầu khám phá cách NLP và LLM có thể hỗ trợ giảm chi phí thiết lập ngăn cản việc sử dụng các phương pháp giáo dục hiệu quả nhất trong hệ thống giáo dục chính thống. Yash và tôi đã tạo ra gia sư nhận thức hỗ trợ LLM đầu tiên và điều đó dẫn đến việc chúng tôi phát hiện ra các vấn đề với việc triển khai LLM mà hiện nay chúng tôi đang giúp giải quyết.

Về cơ bản, Martian đang loại bỏ quyết định sử dụng Mô hình ngôn ngữ lớn (LLM) nào, tại sao điều này hiện lại là một điểm khó khăn đối với các nhà phát triển?

Việc tạo các mô hình ngôn ngữ ngày càng trở nên dễ dàng hơn – chi phí tính toán đang giảm xuống, các thuật toán ngày càng trở nên hiệu quả hơn và có nhiều công cụ nguồn mở hơn để tạo ra các mô hình này. Do đó, ngày càng có nhiều công ty và nhà phát triển tạo ra các mô hình tùy chỉnh được đào tạo trên dữ liệu tùy chỉnh. Vì những mô hình này có chi phí và khả năng khác nhau nên bạn có thể đạt được hiệu suất tốt hơn bằng cách sử dụng nhiều mô hình, nhưng rất khó để kiểm tra tất cả chúng và tìm ra mô hình phù hợp để sử dụng. Chúng tôi lo việc đó cho các nhà phát triển.

Bạn có thể thảo luận về cách hệ thống hiểu LLM nào được sử dụng tốt nhất cho từng nhiệm vụ cụ thể không?

Định tuyến tốt về cơ bản là một vấn đề về hiểu biết các mô hình. Để định tuyến giữa các mô hình một cách hiệu quả, bạn cần hiểu được nguyên nhân khiến chúng thất bại hay thành công. Việc có thể hiểu được những đặc điểm này bằng tính năng ánh xạ mô hình cho phép chúng tôi xác định xem bất kỳ mô hình cụ thể nào sẽ hoạt động tốt như thế nào theo yêu cầu mà không cần phải chạy mô hình đó. Do đó, chúng tôi có thể gửi yêu cầu đó đến mô hình sẽ tạo ra kết quả tốt nhất.

Bạn có thể thảo luận về loại hình tiết kiệm chi phí có thể thấy được từ việc tối ưu hóa LLM được sử dụng không?

Chúng tôi cho phép người dùng chỉ định cách họ cân bằng giữa chi phí và hiệu suất. Nếu bạn chỉ quan tâm đến hiệu suất, chúng tôi có thể hoạt động tốt hơn GPT-4 trên openai/evals. Nếu bạn đang tìm kiếm một chi phí cụ thể để thực hiện hiệu quả kinh tế đơn vị của mình, chúng tôi cho phép bạn chỉ định chi phí tối đa cho yêu cầu của mình, sau đó tìm mô hình tốt nhất để hoàn thành yêu cầu đó. Và nếu bạn muốn thứ gì đó năng động hơn, chúng tôi cho phép bạn chỉ định số tiền bạn sẵn sàng trả để có câu trả lời tốt hơn – theo cách đó, nếu hai mẫu có hiệu suất tương tự nhưng chênh lệch lớn về chi phí, chúng tôi có thể cho phép bạn sử dụng những mẫu rẻ hơn . Một số khách hàng của chúng tôi đã thấy chi phí giảm tới 12 lần.

Tầm nhìn của bạn về tương lai của sao Hỏa là gì?

Mỗi lần chúng ta nâng cao hiểu biết cơ bản về các mô hình, điều đó sẽ dẫn đến sự thay đổi mô hình cho AI. Tinh chỉnh là mô hình được thúc đẩy bởi sự hiểu biết về kết quả đầu ra. Nhắc nhở là mô hình được thúc đẩy bởi sự hiểu biết đầu vào. Sự khác biệt duy nhất trong hiểu biết của chúng ta về các mô hình chính là điểm khác biệt giữa ML truyền thống (“hãy đào tạo một bộ hồi quy”) và AI thế hệ hiện đại (“hãy nhắc nhở một AGI bé”).

Mục tiêu của chúng tôi là liên tục mang đến những đột phá về khả năng diễn giải cho đến khi AI được hiểu đầy đủ và chúng tôi có lý thuyết về trí thông minh mạnh mẽ như lý thuyết logic hoặc phép tính của chúng tôi.

Đối với chúng tôi, điều này có nghĩa là xây dựng. Nó có nghĩa là tạo ra công cụ AI tuyệt vời và đưa nó đến tay mọi người. Nó có nghĩa là phát hành những thứ phá vỡ khuôn mẫu, điều mà trước đây chưa ai làm và - hơn bất cứ điều gì khác - rất thú vị và hữu ích.

Theo lời của Sir Francis Bacon, “Tri thức là sức mạnh”. Theo đó, cách tốt nhất để chắc chắn rằng chúng ta hiểu AI là phát hành các công cụ mạnh mẽ. Theo quan điểm của chúng tôi, bộ định tuyến mô hình là một công cụ thuộc loại đó. Chúng tôi rất vui mừng được xây dựng, phát triển và đưa nó đến tay mọi người.

Đây là công cụ đầu tiên trong số nhiều công cụ chúng tôi sẽ phát hành trong những tháng tới. Để khám phá một lý thuyết hay về trí tuệ nhân tạo, kích hoạt các loại cơ sở hạ tầng AI hoàn toàn mới, giúp xây dựng một tương lai tươi sáng hơn cho cả con người và máy móc – chúng tôi rất nóng lòng được chia sẻ những công cụ đó với bạn.

Cảm ơn bạn về cuộc phỏng vấn tuyệt vời, độc giả muốn tìm hiểu thêm hãy truy cập Sao chổi.

Một đối tác sáng lập của unity.AI & một thành viên của Hội đồng Công nghệ Forbes, Antoine là một nhà tương lai học người đam mê tương lai của AI và robot.

Ông cũng là người sáng lập của Chứng khoán.io, một trang web tập trung vào đầu tư vào công nghệ đột phá.