Kết nối với chúng tôi

Mohammad Abu Sheikh, Nhà sáng lập & Tổng giám đốc điều hành của CNTXT AI – Loạt bài phỏng vấn

Phỏng vấn

Mohammad Abu Sheikh, Nhà sáng lập & Tổng giám đốc điều hành của CNTXT AI – Loạt bài phỏng vấn

mm

Mohammad Abu Sheikh đang chuyển đổi bối cảnh AI ở khu vực MENA, thúc đẩy sự chuyển dịch từ tiêu dùng thụ động sang đổi mới có chủ quyền. Là CEO của CNTXT AI và là người sáng lập quỹ AI trị giá 10 triệu đô la, ông đã lãnh đạo ba lần thoái vốn thành công và bảo đảm được hơn một tỷ đô la tiền tài trợ. Công việc của ông là đặt nền móng cho một hệ sinh thái AI bắt nguồn từ ngôn ngữ, văn hóa và chủ quyền dữ liệu.

CNTXT AI là một công ty chuyển đổi số cung cấp cơ sở hạ tầng đám mây, phần mềm công nghiệp và giải pháp robot để giúp các tổ chức hiện đại hóa hoạt động và khai thác thông tin chi tiết dựa trên dữ liệu trên khắp Trung Đông và Bắc Phi.

Điều gì đã truyền cảm hứng cho bạn để thành lập CNTXT AI và tầm nhìn của bạn về AI có chủ quyền trong thế giới nói tiếng Ả Rập bắt đầu như thế nào?

Chúng tôi đã thấy sự phong phú của dữ liệu chưa được sử dụng hết ở khu vực này của thế giới. Nhiều vấn đề trong việc mở rộng quy mô AI xuất phát từ việc thiếu dữ liệu sẵn sàng — điều này cuối cùng có nghĩa là thiếu sự sẵn sàng của AI. Đó là lý do tại sao chúng tôi bắt đầu CNTXT AI.

Ban đầu, chúng tôi giải quyết những vấn đề tương tự mà chúng tôi gặp phải khi xây dựng LocAI…Chúng tôi đã tận mắt chứng kiến ​​những thách thức này khi làm việc với AI71, TII và G42 (IIAI). Khi chúng tôi giúp các thực thể này giải quyết những vấn đề đó, tầm nhìn trở nên rõ ràng hơn và doanh nghiệp cứ thế phát triển.

Bạn đã đóng vai trò quan trọng trong việc xây dựng thư viện kỹ thuật số tiếng Ả Rập lớn nhất để đào tạo AI. Một số thách thức lớn nhất trong quá trình thực hiện là gì và bạn đã vượt qua chúng như thế nào?

Chất lượng là một trong những thách thức lớn nhất. Một thách thức khác là tính khả dụng hạn chế của dữ liệu tiếng Ả Rập chất lượng cao trực tuyến: tiếng Ả Rập thực sự bị thiếu hụt nghiêm trọng. Chỉ một phần nhỏ nội dung tiếng Ả Rập đã được số hóa và chỉ 3–5% trong tổng số nội dung trực tuyến là tiếng Ả Rập. Con số đó gần như không đáng kể. Chúng tôi đã khắc phục vấn đề đó bằng cách triển khai người dán nhãn dữ liệu, người chú thích và nhà khoa học dữ liệu để tự mình số hóa, tạo và quản lý dữ liệu.

CNTXT AI hoạt động tại giao điểm của văn hóa và tính toán. Làm thế nào để bạn cân bằng giữa đổi mới AI tiên tiến với mục tiêu xây dựng các giải pháp có liên quan đến văn hóa cho khu vực MENA?

Chúng tôi xây dựng các mô hình có nền tảng văn hóa ngay từ đầu. Từ cơ sở hạ tầng đến sản phẩm cuối cùng, văn hóa được nhúng ngay từ đầu — đó không phải là thứ chúng tôi thêm vào sau. Chúng tôi thiết kế, đổi mới và xây dựng với các nền văn hóa, phương ngữ và nhu cầu cụ thể ngay từ ngày đầu tiên. Tiếng Ả Rập là một ngôn ngữ, nhưng nó mang nhiều phương ngữ và bối cảnh văn hóa trên khắp khu vực, vì vậy chúng tôi xây dựng các sản phẩm địa phương cho các quốc gia địa phương. Và chúng tôi thực hiện điều đó bằng cách làm việc với các chú thích viên địa phương, những người ở thực địa, ở quốc gia của họ.

Bạn cũng đồng sáng lập LocAI và lãnh đạo Quỹ SMPL AI. Những dự án này bổ sung cho sứ mệnh của CNTXT AI như thế nào?

LocAI là lớp ứng dụng — phần mà mọi người thực sự tương tác. Nó nằm ngay trên dữ liệu và cơ sở hạ tầng do CNTXT AI xây dựng. Đó là điều làm nên thành công của nó: nó biến đổi nền tảng AI do CNTXT AI cung cấp thành các giải pháp thực tế mà mọi người có thể sử dụng.

Ngược lại, SMPL AI hướng đến việc đền đáp cộng đồng. Tập trung đầu tư vào các công ty khởi nghiệp giai đoạn đầu và giúp xây dựng hệ sinh thái AI khu vực. Chúng tôi chia sẻ các công cụ và bài học mà chúng tôi đã học được từ việc tự xây dựng AI, để những người sáng lập có thể phát triển nhanh hơn và tránh những cạm bẫy thường gặp.

Munsit được gọi là mô hình nhận dạng giọng nói tiếng Ả Rập chính xác nhất trên thế giới. Điều gì thúc đẩy sự phát triển của mô hình này và tại sao lại là bây giờ?

Động lực thúc đẩy sự phát triển của mô hình này rất đơn giản: nhu cầu.

Chúng tôi luôn xây dựng vì nhu cầu. Chúng tôi nhìn vào thị trường và thấy bối cảnh đã chín muồi — các cơ quan chính phủ và khách hàng tư nhân đều yêu cầu một giải pháp như thế này.

Các mô hình hiện tại không đáp ứng được nhiệm vụ. Hầu hết được xây dựng trên công nghệ tiếng Anh và sau đó được điều chỉnh. Chúng không được thiết kế cho tiếng Ả Rập ngay từ đầu và chắc chắn không dành cho các vấn đề cụ thể mà chúng tôi đang giải quyết.

Vì vậy, chúng tôi quyết định tự xây dựng. Đầu tiên là tiếng Ả Rập — theo thiết kế.

Nghiên cứu đằng sau Munsit giới thiệu một phương pháp học tập có giám sát yếu. Bạn có thể giải thích điều đó có nghĩa là gì và tại sao nó lại cần thiết để đào tạo ASR tiếng Ả Rập ở quy mô lớn không?

Chú thích rất tốn kém. Vì vậy, chúng tôi phải vượt ra ngoài các phương pháp truyền thống phụ thuộc vào khối lượng lớn bản ghi chép thủ công. Học tập có giám sát yếu giúp chúng tôi mở rộng quy mô mà không cần phải dán nhãn từng tệp âm thanh bằng tay — điều này đặc biệt quan trọng đối với tiếng Ả Rập, một ngôn ngữ có dữ liệu hạn chế và nhiều phương ngữ khác nhau.

Thay vì sử dụng âm thanh được phiên âm chuyên nghiệp, chúng tôi bắt đầu với 30,000 giờ giọng nói tiếng Ả Rập không có nhãn. Chúng tôi đã xây dựng một đường ống chú thích tạo ra, lọc và làm sạch những chú thích tốt nhất bằng cách sử dụng các kiểm tra tự động. Điều này đã cung cấp cho chúng tôi một tập dữ liệu 15,000 giờ chất lượng cao — tất cả đều không có phiên âm của con người.

Cách tiếp cận này giúp chúng tôi có thể đào tạo mô hình của mình từ đầu, nắm bắt được sự phong phú của tiếng Ả Rập được nói trong các tình huống thực tế, một cách nhanh chóng và tiết kiệm chi phí. Nếu không có phương pháp này, việc xây dựng một hệ thống ASR tiếng Ả Rập ở quy mô này sẽ mất nhiều năm và hàng triệu đô la cho công sức thủ công.

Munsit vượt trội hơn các mô hình từ OpenAI, Microsoft và Meta trên nhiều chuẩn mực. Thành tựu này nói lên điều gì về tương lai của sự đổi mới AI tiếng Ả Rập?

Tương lai của AI tiếng Ả Rập nằm trong tay chúng ta; và đó chính xác là những gì thành tựu này chứng minh. Chúng ta không còn có thể dựa vào các công nghệ mà chúng ta không sở hữu hoặc phụ thuộc vào các bên thứ ba không ưu tiên khu vực của chúng ta.

Munsit cho thấy chúng ta có thể xây dựng AI đẳng cấp thế giới, từ khu vực, cho khu vực — sử dụng tài năng địa phương để giải quyết các vấn đề địa phương. Đây là tín hiệu rõ ràng cho thấy làn sóng đổi mới AI tiếp theo của Ả Rập sẽ đến từ bên trong.

Bạn thấy Munsit sẽ phát triển như thế nào trong các phiên bản tương lai và đâu là ranh giới tiếp theo cho AI giọng nói tiếng Ả Rập tại CNTXT?

Bạn chỉ cần chờ và xem. Tôi có thể nói rằng chúng tôi có một bộ giải pháp AI mới, hoàn toàn mới dành cho tiếng Ả Rập — tất cả đều được hỗ trợ bởi Munsit và các mô hình khác mà chúng tôi hiện đang xây dựng tại CNTXT AI. Đây chỉ là sự khởi đầu.

Ông thường nói về tầm quan trọng của “AI có chủ quyền”. Thuật ngữ đó có ý nghĩa gì với ông và tại sao nó lại quan trọng đối với vùng Vịnh và khu vực MENA nói chung?

Với tôi, AI có chủ quyền có nghĩa là có toàn quyền sở hữu và kiểm soát dữ liệu, cơ sở hạ tầng và các mô hình định hình tương lai của chúng ta. Điều này rất quan trọng vì chúng ta cần nắm giữ vận mệnh của chính mình và điều đó bắt đầu từ dữ liệu.

Chủ quyền dữ liệu là tất cả. Dữ liệu rất quý giá và chúng ta cần đảm bảo dữ liệu nằm trong tay mình.

Chúng ta không thể để mất tương lai của mình và ngồi không trong khi những người khác xây dựng công nghệ cho chúng ta. Tương lai của AI trong khu vực này sẽ đến từ khu vực này. Đó chính xác là những gì chúng ta đang hướng tới.

Bạn thấy CNTXT AI sẽ định hình hệ sinh thái AI ở Trung Đông như thế nào trong năm năm tới?

Bằng cách cho phép sự sẵn sàng thực sự của AI. Chúng tôi tham gia, hiểu các công ty và chính phủ cần gì, xây dựng dữ liệu và chiến lược AI, sau đó giúp họ xây dựng, thử nghiệm, triển khai và mở rộng quy mô.

Nếu dữ liệu là dầu mỏ mới, thì dữ liệu phi cấu trúc là dầu thô chưa tinh chế — đầy tiềm năng nhưng vô dụng cho đến khi được xử lý. Đó là lý do tại sao chúng tôi xây dựng CNTXT AI để giúp các tổ chức dọn dẹp, cấu trúc và kích hoạt dữ liệu của họ. Bởi vì đó là nơi bắt đầu quá trình chuyển đổi AI thực sự.

Với tư cách là một doanh nhân và nhà đầu tư, bạn có lời khuyên nào dành cho những người sáng lập khác đang xây dựng công ty khởi nghiệp AI tại các thị trường mới nổi không?

Bắt đầu ngay. Hành động nhanh. Thất bại nhanh, học nhanh hơn và tiếp tục lặp lại.

Quan trọng nhất là xây dựng cho những vấn đề thực tế. Luôn bám sát thực tế — lắng nghe người dùng, không chỉ là sự cường điệu. Ở các thị trường mới nổi, sự phù hợp và khả năng thích ứng là chìa khóa.

Cảm ơn bạn về cuộc phỏng vấn tuyệt vời, độc giả muốn tìm hiểu thêm hãy truy cập CNTXT AI.

Antoine là một nhà lãnh đạo có tầm nhìn xa và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi niềm đam mê không ngừng nghỉ trong việc định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân nối tiếp, ông tin rằng AI sẽ gây rối loạn cho xã hội như điện, và thường bị bắt gặp khi đang ca ngợi về tiềm năng của các công nghệ đột phá và AGI.

Là một nhà tương lai học, ông cống hiến hết mình để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập Chứng khoán.io, một nền tảng tập trung vào việc đầu tư vào các công nghệ tiên tiến đang định hình lại tương lai và định hình lại toàn bộ các lĩnh vực.