Connect with us

Eric Landau, Đồng sáng lập & CEO của Encord – Loạt phỏng vấn

Phỏng vấn

Eric Landau, Đồng sáng lập & CEO của Encord – Loạt phỏng vấn

mm

Eric Landau là CEO & Đồng sáng lập của Encord, một nền tảng học chủ động cho tầm nhìn máy tính. Eric là nhà nghiên cứu định lượng hàng đầu trên một bàn delta-one toàn cầu, đưa hàng nghìn mô hình vào sản xuất. Trước khi đến với Encord, ông đã dành gần một thập kỷ trong giao dịch tần suất cao tại DRW. Ông holds một S.M. trong Vật lý ứng dụng từ Đại học Harvard, M.S. trong Kỹ thuật điện và B.S. trong Vật lý từ Đại học Stanford.

Trong thời gian rảnh, Eric thích chơi với ChatGPT và các mô hình ngôn ngữ lớn và pha chế cocktail thủ công.

Điều gì đã truyền cảm hứng cho bạn để đồng sáng lập Encord, và kinh nghiệm của bạn trong vật lý hạt và tài chính định lượng đã định hình cách tiếp cận của bạn để giải quyết vấn đề “dữ liệu” trong AI như thế nào?

Tôi lần đầu tiên bắt đầu suy nghĩ về học máy trong khi làm việc trong vật lý hạt và xử lý các tập dữ liệu rất lớn trong thời gian tôi tại Trung tâm Gia tốc tuyến tính Stanford (SLAC). Tôi đã sử dụng phần mềm được thiết kế cho các nhà vật lý bởi các nhà vật lý, điều này có nghĩa là có rất nhiều điều mong muốn về mặt trải nghiệm người dùng. Với các công cụ dễ sử dụng hơn, tôi sẽ có thể chạy phân tích nhanh hơn.

Sau đó, khi làm việc trong tài chính định lượng tại DRW, tôi đã chịu trách nhiệm tạo ra hàng nghìn mô hình được triển khai vào sản xuất. Tương tự như kinh nghiệm của tôi trong vật lý, tôi đã发现 rằng dữ liệu chất lượng cao là rất quan trọng trong việc tạo ra các mô hình chính xác và quản lý dữ liệu phức tạp, quy mô lớn là khó khăn. Ulrik đã có một kinh nghiệm tương tự khi trực quan hóa các tập dữ liệu hình ảnh lớn cho tầm nhìn máy tính.

Khi tôi nghe về ý tưởng ban đầu của anh ấy cho Encord, tôi đã ngay lập tức đồng ý và hiểu được tầm quan trọng. Cùng với Ulrik, chúng tôi đã thấy một cơ hội lớn để xây dựng một nền tảng để tự động hóa và tối ưu hóa quá trình phát triển dữ liệu AI, giúp các đội dễ dàng đưa dữ liệu tốt nhất vào mô hình và xây dựng các hệ thống AI đáng tin cậy.

Bạn có thể giải thích tầm nhìn đằng sau Encord và cách nó so sánh với những ngày đầu của máy tính hoặc internet về tiềm năng và thách thức không?

Tầm nhìn của Encord là trở thành nền tảng cơ bản mà các doanh nghiệp dựa vào để biến đổi dữ liệu của họ thành các mô hình AI chức năng. Chúng tôi là lớp giữa dữ liệu của một công ty và AI của họ.

Theo nhiều cách, AI phản ánh các chuyển đổi范式 trước đó như máy tính cá nhân và Internet vì nó sẽ trở thành một phần không thể thiếu trong các quy trình làm việc cho mỗi cá nhân, doanh nghiệp, quốc gia và ngành công nghiệp. Không giống như các cuộc cách mạng công nghệ trước đó, đã bị hạn chế bởi định luật Moore về sự tăng trưởng tính toán hợp chất 30 lần mỗi 10 năm, sự phát triển AI đã được hưởng lợi từ các đổi mới đồng thời. Do đó, nó đang di chuyển với tốc độ nhanh hơn. Trong lời của Jensen Huang của NVIDIA: “Đối với lần đầu tiên, chúng ta đang chứng kiến các số mũ hợp chất… Chúng ta đang hợp chất với một triệu lần mỗi thập kỷ. Không phải một trăm lần, không phải một nghìn lần, một triệu lần.” Không cường điệu, chúng ta đang chứng kiến công nghệ phát triển nhanh nhất trong lịch sử loài người.

Tiềm năng ở đây là vô cùng lớn: bằng cách tự động hóa và mở rộng quản lý dữ liệu chất lượng cao cho AI, chúng tôi đang giải quyết một nút thắt ngăn cản việc áp dụng AI rộng rãi hơn. Các thách thức gợi nhớ đến các chướng ngại vật trong những ngày đầu của các kỷ nguyên công nghệ trước: các silo, thiếu các phương pháp hay nhất, hạn chế cho người dùng không kỹ thuật và sự thiếu hụt của các trừu tượng được xác định rõ ràng.

Encord Index được định vị là một công cụ chính để quản lý và chăm sóc dữ liệu AI. Làm thế nào nó khác biệt so với các nền tảng quản lý dữ liệu hiện có?

Có một số cách mà Encord Index nổi bật:

Index có khả năng mở rộng: Cho phép người dùng quản lý hàng tỷ, không phải hàng triệu, điểm dữ liệu. Các công cụ khác gặp phải các vấn đề về khả năng mở rộng đối với dữ liệu không cấu trúc và bị hạn chế trong việc hợp nhất tất cả dữ liệu liên quan trong một tổ chức.

Index linh hoạt: Tích hợp trực tiếp với lưu trữ dữ liệu riêng và các nhà cung cấp lưu trữ đám mây như AWS, GCP và Azure. Không giống như các công cụ khác bị giới hạn ở một nhà cung cấp đám mây duy nhất hoặc hệ thống lưu trữ nội bộ, Index không phụ thuộc vào vị trí của dữ liệu. Nó cho phép bạn quản lý dữ liệu từ nhiều nguồn với các biện pháp quản lý và kiểm soát truy cập phù hợp, cho phép họ phát triển các ứng dụng AI an toàn và tuân thủ.

Index đa phương thức: Hỗ trợ AI đa phương thức, quản lý dữ liệu dưới dạng hình ảnh, video, âm thanh, văn bản, tài liệu và hơn thế nữa. Index không bị giới hạn ở một dạng dữ liệu duy nhất như nhiều công cụ LLM ngày nay. Nhận thức của con người là đa phương thức và chúng tôi tin rằng AI đa phương thức sẽ là trung tâm của làn sóng tiến bộ AI tiếp theo, sẽ thay thế các rô-bốt trò chuyện và LLM.

Encord Index tăng cường quá trình chọn dữ liệu phù hợp cho các mô hình AI như thế nào và điều này có tác động gì đến hiệu suất của mô hình?

Encord Index tăng cường việc lựa chọn dữ liệu bằng cách tự động hóa việc chăm sóc các tập dữ liệu lớn, giúp các đội xác định và giữ lại chỉ dữ liệu liên quan nhất trong khi loại bỏ dữ liệu không có thông tin hoặc bị thiên vị. Quá trình này không chỉ giảm kích thước của các tập dữ liệu mà còn cải thiện đáng kể chất lượng dữ liệu được sử dụng để đào tạo các mô hình AI. Khách hàng của chúng tôi đã thấy sự cải thiện lên đến 20% trong các mô hình của họ trong khi đạt được giảm 35% kích thước tập dữ liệu và tiết kiệm hàng trăm nghìn đô la trong chi phí tính toán và chú thích con người.

Với việc tích hợp nhanh chóng các công nghệ tiên tiến như Mô hình Segment Anything của Meta, Encord duy trì vị trí hàng đầu trong cảnh quan AI đang phát triển nhanh chóng như thế nào?

Chúng tôi đã xây dựng nền tảng một cách có chủ ý để có thể thích nghi với các công nghệ mới nhanh chóng. Chúng tôi tập trung vào việc cung cấp một phương pháp phần mềm đầu tiên có khả năng mở rộng, dễ dàng tích hợp các tiến bộ như SAM, đảm bảo rằng người dùng của chúng tôi luôn được trang bị các công cụ mới nhất để duy trì khả năng cạnh tranh.

Chúng tôi dự định sẽ duy trì vị trí hàng đầu bằng cách tập trung vào AI đa phương thức. Nền tảng Encord đã có thể quản lý các loại dữ liệu phức tạp như hình ảnh, video và văn bản, vì vậy khi các tiến bộ trong AI đa phương thức đến, chúng tôi đã sẵn sàng.

Những thách thức phổ biến nhất mà các công ty gặp phải khi quản lý dữ liệu AI là gì và Encord giúp giải quyết những thách thức này như thế nào?

Có 3 thách thức chính mà các công ty gặp phải:

  • Quản lý và kiểm soát dữ liệu kém: Khi các doanh nghiệp chuẩn bị triển khai các giải pháp AI, họ thường phải đối mặt với thực tế rằng dữ liệu của họ bị phân mảnh và không được tổ chức, không sẵn sàng cho AI. Dữ liệu này thường thiếu quản trị mạnh mẽ xung quanh nó, hạn chế nhiều trong số đó không thể được sử dụng trong các hệ thống AI.
  • Thiếu chuyên gia con người: Khi các mô hình AI giải quyết các vấn đề ngày càng phức tạp, sẽ sớm có sự thiếu hụt của các chuyên gia lĩnh vực con người để chuẩn bị và xác thực dữ liệu. Khi nhu cầu AI của một công ty tăng lên, việc mở rộng lực lượng lao động con người này là một thách thức và tốn kém.
  • Công cụ không thể mở rộng: Các mô hình AI hiệu suất cao rất đói dữ liệu về mặt dữ liệu cần thiết cho việc tinh chỉnh, xác thực, RAG và các quy trình làm việc khác. Thế hệ công cụ trước không được trang bị để quản lý lượng dữ liệu và các loại dữ liệu cần thiết cho các mô hình sản xuất hiện đại.

Encord giải quyết những vấn đề này bằng cách tự động hóa quá trình chăm sóc dữ liệu ở quy mô lớn, giúp dễ dàng xác định dữ liệu có tác động từ dữ liệu có vấn đề và đảm bảo việc tạo ra các tập dữ liệu đào tạo và xác thực hiệu quả. Nó sử dụng một phương pháp phần mềm đầu tiên dễ dàng mở rộng lên hoặc xuống khi nhu cầu quản lý dữ liệu thay đổi. Các công cụ chú thích AI hỗ trợ của chúng tôi cho phép các chuyên gia lĩnh vực con người trong quy trình làm việc tối đa hóa hiệu quả. Quá trình này đặc biệt quan trọng trong các ngành như dịch vụ tài chính và chăm sóc sức khỏe, nơi các huấn luyện viên AI tốn kém. Chúng tôi giúp dễ dàng quản lý và hiểu tất cả dữ liệu không cấu trúc của một tổ chức, giảm nhu cầu lao động thủ công.

Encord giải quyết vấn đề thiên vị dữ liệu và các khu vực không được đại diện trong các tập dữ liệu như thế nào để đảm bảo các mô hình AI công bằng và cân bằng?

Giải quyết thiên vị dữ liệu là một焦 điểm quan trọng cho chúng tôi tại Encord. Nền tảng của chúng tôi tự động xác định và hiển thị các khu vực mà dữ liệu có thể bị thiên vị, cho phép các đội AI giải quyết những vấn đề này trước khi chúng ảnh hưởng đến hiệu suất của mô hình. Chúng tôi cũng đảm bảo rằng các khu vực không được đại diện trong các tập dữ liệu được bao gồm đúng cách, giúp phát triển các mô hình AI công bằng và cân bằng hơn. Bằng cách sử dụng các công cụ chăm sóc của chúng tôi, các đội có thể tự tin rằng các mô hình của họ được đào tạo trên dữ liệu đa dạng và đại diện.

Encord gần đây đã huy động được 30 triệu đô la trong vòng Series B. Việc tài trợ này sẽ tăng tốc đường dây sản phẩm và kế hoạch mở rộng của bạn như thế nào?

30 triệu đô la trong vòng Series B sẽ được sử dụng để tăng đáng kể kích thước của các đội sản phẩm, kỹ thuật và nghiên cứu AI của chúng tôi trong vòng sáu tháng tới và tăng tốc việc phát triển Encord Index và các tính năng mới. Chúng tôi cũng đang mở rộng sự hiện diện của mình tại San Francisco với một văn phòng mới và việc tài trợ này sẽ giúp chúng tôi mở rộng hoạt động để hỗ trợ cơ sở khách hàng đang phát triển của mình.

Là công ty AI trẻ nhất từ Y Combinator để huy động Series B, bạn thuộc tính sự tăng trưởng và thành công nhanh chóng của Encord cho điều gì?

Một trong những lý do chúng tôi đã có thể tăng trưởng nhanh là vì chúng tôi đã áp dụng một焦 điểm cực kỳ tập trung vào khách hàng trong tất cả các lĩnh vực của công ty. Chúng tôi liên tục giao tiếp với khách hàng, lắng nghe chặt chẽ các vấn đề của họ và “ôm lấy” họ để đến với các giải pháp. Bằng cách tập trung cực kỳ vào nhu cầu của khách hàng thay vì sự cường điệu, chúng tôi đã tạo ra một nền tảng mà các đội AI hàng đầu trên các ngành công nghiệp khác nhau đều đồng tình. Khách hàng của chúng tôi đã đóng vai trò quan trọng trong việc đưa chúng tôi đến nơi chúng tôi đang ở ngày hôm nay. Khả năng của chúng tôi trong việc mở rộng nhanh chóng và quản lý hiệu quả sự phức tạp của dữ liệu AI đã làm cho chúng tôi trở thành một giải pháp hấp dẫn cho các doanh nghiệp.

Chúng tôi cũng nợ rất nhiều thành công của mình cho các thành viên trong đội, đối tác và nhà đầu tư của chúng tôi, những người đã làm việc không ngừng nghỉ để ủng hộ Encord. Làm việc với các đội sản phẩm, kỹ thuật và tiếp thị hàng đầu đã có tác động to lớn đến sự tăng trưởng của chúng tôi.

Đưa dữ liệu ngày càng quan trọng trong AI, bạn nhìn thấy vai trò của các nền tảng dữ liệu AI như Encord sẽ phát triển như thế nào trong năm năm tới?

Khi các ứng dụng AI trở nên phức tạp hơn, nhu cầu về các giải pháp quản lý dữ liệu hiệu quả và có khả năng mở rộng sẽ chỉ tăng lên. Tôi tin rằng mọi doanh nghiệp cuối cùng sẽ có một bộ phận AI, giống như cách các bộ phận CNTT tồn tại ngày hôm nay. Encord sẽ là nền tảng duy nhất họ cần để quản lý lượng dữ liệu khổng lồ cần thiết cho AI và đưa các mô hình vào sản xuất nhanh chóng.

Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Encord.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.