Phỏng vấn
Mohammad Abu Sheikh, Người sáng lập & CEO của CNTXT AI – Loạt phỏng vấn

Mohammad Abu Sheikh đang biến đổi cảnh quan trí tuệ nhân tạo ở khu vực MENA, thúc đẩy sự chuyển đổi từ tiêu thụ thụ động sang đổi mới chủ quyền. Với tư cách là CEO của CNTXT AI và người sáng lập quỹ trí tuệ nhân tạo trị giá 10 triệu đô la, ông đã dẫn đầu ba lần thoát hiểm thành công và đảm bảo hơn một tỷ đô la vốn. Công việc của ông đang đặt nền tảng cho một hệ sinh thái trí tuệ nhân tạo dựa trên ngôn ngữ, văn hóa và chủ quyền dữ liệu.
CNTXT AI là một công ty chuyển đổi số cung cấp cơ sở hạ tầng đám mây, phần mềm công nghiệp và giải pháp robot để giúp các tổ chức hiện đại hóa hoạt động và mở khóa thông tin dựa trên dữ liệu trên toàn Trung Đông và Bắc Phi.
Điều gì đã truyền cảm hứng cho bạn bắt đầu CNTXT AI, và tầm nhìn của bạn về trí tuệ nhân tạo chủ quyền trong thế giới nói tiếng Ả Rập bắt đầu như thế nào?
Chúng tôi đã thấy sự phong phú của dữ liệu chưa được sử dụng ở phần này của thế giới. Nhiều vấn đề trong việc mở rộng quy mô trí tuệ nhân tạo đến từ sự thiếu sẵn sàng của dữ liệu – điều này cuối cùng có nghĩa là thiếu sẵn sàng trí tuệ nhân tạo. Đó là lý do chúng tôi bắt đầu CNTXT AI.
Ban đầu, chúng tôi giải quyết các vấn đề giống như những vấn đề chúng tôi gặp phải khi xây dựng LocAI… Chúng tôi đã thấy những thách thức này trực tiếp khi làm việc với AI71, TII và G42 (IIAI). Khi chúng tôi giúp các thực thể này giải quyết những vấn đề đó, tầm nhìn trở nên rõ ràng hơn và kinh doanh chỉ tiếp tục phát triển.
Bạn đã đóng một vai trò quan trọng trong việc xây dựng thư viện kỹ thuật số tiếng Ả Rập lớn nhất cho đào tạo trí tuệ nhân tạo. Những thách thức lớn nhất trong việc thực hiện điều này là gì, và bạn đã vượt qua chúng như thế nào?
Chất lượng là một trong những thách thức lớn nhất. Một thách thức khác là sự sẵn có hạn chế của dữ liệu tiếng Ả Rập chất lượng cao trực tuyến: tiếng Ả Rập bị đại diện nghiêm trọng. Chỉ một phần nhỏ của nội dung tiếng Ả Rập đã được số hóa, và chỉ 3-5% nội dung trực tuyến là tiếng Ả Rập. Đó gần như là không có gì. Chúng tôi đã vượt qua vấn đề này bằng cách triển khai các nhà ghi nhãn dữ liệu, người chú thích và nhà khoa học dữ liệu để số hóa, tạo và quản lý dữ liệu ourselves.
CNTXT AI hoạt động tại giao điểm của văn hóa và tính toán. Bạn làm thế nào để cân bằng đổi mới trí tuệ nhân tạo tiên tiến với mục tiêu xây dựng các giải pháp có liên quan về văn hóa cho khu vực MENA?
Chúng tôi xây dựng các mô hình dựa trên văn hóa từ đầu. Từ cơ sở hạ tầng đến sản phẩm cuối cùng, văn hóa được nhúng từ rất bắt đầu – nó không phải là điều gì đó chúng tôi thêm vào sau. Chúng tôi thiết kế, đổi mới và xây dựng với các văn hóa, phương ngữ và nhu cầu cụ thể trong tâm trí từ ngày đầu tiên. Tiếng Ả Rập là một ngôn ngữ, nhưng nó mang nhiều phương ngữ và ngữ cảnh văn hóa trên toàn khu vực, vì vậy chúng tôi xây dựng các sản phẩm địa phương cho các quốc gia địa phương. Và chúng tôi làm điều đó bằng cách làm việc với các người chú thích địa phương, những người trên mặt đất, trong các quốc gia của họ.
Bạn cũng đã đồng sáng lập LocAI và dẫn đầu Quỹ trí tuệ nhân tạo SMPL. Những doanh nghiệp này bổ sung cho sứ mệnh của CNTXT AI như thế nào?
LocAI là lớp ứng dụng – phần mà mọi người thực sự tương tác. Nó ngồi ngay trên đầu dữ liệu và cơ sở hạ tầng được xây dựng bởi CNTXT AI. Đó là điều làm cho nó thành công: nó biến các nền tảng trí tuệ nhân tạo được cung cấp bởi CNTXT AI thành các giải pháp thế giới thực mà mọi người có thể sử dụng.
SMPL AI, mặt khác, là về việc quay lại cộng đồng. Nó tập trung vào việc đầu tư vào các công ty khởi nghiệp giai đoạn đầu và giúp xây dựng hệ sinh thái trí tuệ nhân tạo khu vực. Chúng tôi chia sẻ các công cụ và bài học chúng tôi đã học được từ việc xây dựng trí tuệ nhân tạo ourselves, để các nhà sáng lập có thể phát triển nhanh hơn và tránh các điểm yếu thông thường.
Munsit đã được gọi là mô hình nhận dạng giọng nói tiếng Ả Rập chính xác nhất trên thế giới. Điều gì đã thúc đẩy sự phát triển của mô hình này, và tại sao bây giờ?
Điều gì đã thúc đẩy sự phát triển của mô hình này là đơn giản: nhu cầu.
Chúng tôi luôn xây dựng từ sự cần thiết. Chúng tôi nhìn vào thị trường và thấy rằng cảnh quan là sẵn sàng – các cơ quan chính phủ và khách hàng tư nhân đều đang yêu cầu một giải pháp như thế này.
Các mô hình hiện có chỉ không đủ tốt. Hầu hết được xây dựng trên công nghệ tiếng Anh và sau đó được điều chỉnh. Chúng không được thiết kế cho tiếng Ả Rập từ đầu, và chắc chắn không phải cho các vấn đề cụ thể mà chúng tôi đang giải quyết.
Vì vậy, chúng tôi quyết định xây dựng mô hình của riêng mình. Nó là tiếng Ả Rập đầu tiên – theo thiết kế.
Nghiên cứu về Munsit giới thiệu một cách tiếp cận học tập yếu. Bạn có thể giải thích điều đó có nghĩa là gì và tại sao nó lại quan trọng cho việc đào tạo nhận dạng giọng nói tiếng Ả Rập trên quy mô lớn?
Chú thích là tốn kém. Vì vậy, chúng tôi phải vượt ra ngoài các phương pháp truyền thống dựa trên số lượng lớn bản ghi âm thủ công. Học tập yếu đã giúp chúng tôi mở rộng quy mô mà không cần phải ghi nhãn từng tệp âm thanh bằng tay – điều này đặc biệt quan trọng đối với tiếng Ả Rập, một ngôn ngữ có ít dữ liệu và nhiều phương ngữ khác nhau.
Thay vì sử dụng âm thanh được ghi âm chuyên nghiệp, chúng tôi bắt đầu với 30.000 giờ nói tiếng Ả Rập không được ghi nhãn. Chúng tôi xây dựng một đường ống chú thích tạo, lọc và làm sạch các tệp tốt nhất bằng cách sử dụng các kiểm tra tự động. Điều này đã mang lại cho chúng tôi một tập dữ liệu chất lượng cao 15.000 giờ – tất cả đều không cần ghi nhãn thủ công.
Cách tiếp cận này đã làm cho nó có thể đào tạo mô hình của chúng tôi từ đầu, bắt được sự phong phú của tiếng Ả Rập nói trong các tình huống thực tế, nhanh chóng và tiết kiệm chi phí. Nếu không có phương pháp này, việc xây dựng một hệ thống nhận dạng giọng nói tiếng Ả Rập trên quy mô này sẽ mất nhiều năm và hàng triệu đô la trong nỗ lực thủ công.
Munsit đã vượt qua các mô hình từ OpenAI, Microsoft và Meta trên nhiều điểm chuẩn. Thành tựu này nói gì về tương lai của đổi mới trí tuệ nhân tạo tiếng Ả Rập?
Tương lai của trí tuệ nhân tạo tiếng Ả Rập nằm trong tay chúng tôi; và đó chính xác là điều mà thành tựu này chứng minh. Chúng tôi không thể tiếp tục dựa vào các công nghệ mà chúng tôi không sở hữu hoặc phụ thuộc vào các bên thứ ba không ưu tiên khu vực của chúng tôi.
Munsit cho thấy rằng chúng tôi có thể xây dựng trí tuệ nhân tạo hàng đầu thế giới, từ khu vực, cho khu vực – sử dụng tài năng địa phương để giải quyết các vấn đề địa phương. Đó là một tín hiệu rõ ràng rằng làn sóng đổi mới trí tuệ nhân tạo tiếng Ả Rập tiếp theo sẽ đến từ trong.
Bạn thấy Munsit sẽ phát triển như thế nào trong các phiên bản tương lai, và những biên giới tiếp theo cho trí tuệ nhân tạo tiếng Ả Rập tại CNTXT là gì?
Bạn chỉ cần chờ và xem. Điều mà tôi có thể nói là rằng chúng tôi có một bộ giải pháp trí tuệ nhân tạo tiếng Ả Rập mới, đầy đủ, đang trên đường đến – tất cả đều được cung cấp bởi Munsit và các mô hình khác mà chúng tôi đang xây dựng tại CNTXT AI. Đây chỉ là bắt đầu.
Bạn thường nói về tầm quan trọng của “trí tuệ nhân tạo chủ quyền”. Điều đó có nghĩa là gì với bạn, và tại sao nó lại quan trọng đối với Vùng Vịnh và khu vực MENA rộng lớn hơn?
Đối với tôi, trí tuệ nhân tạo chủ quyền có nghĩa là có quyền sở hữu và kiểm soát đầy đủ đối với dữ liệu, cơ sở hạ tầng và mô hình định hình tương lai của chúng tôi. Điều đó quan trọng vì chúng tôi cần sở hữu số phận của mình, và điều đó bắt đầu với dữ liệu.
Chủ quyền dữ liệu là mọi thứ. Dữ liệu là quý giá, và chúng tôi cần đảm bảo rằng nó vẫn nằm trong tay chúng tôi.
Chúng tôi không thể đủ khả năng để giao phó tương lai của mình và ngồi yên trong khi những người khác xây dựng công nghệ cho chúng tôi. Tương lai của trí tuệ nhân tạo trong khu vực này sẽ đến từ khu vực này. Đó chính xác là điều mà chúng tôi đang hướng tới.
Bạn thấy CNTXT AI sẽ định hình hệ sinh thái trí tuệ nhân tạo ở Trung Đông trong năm năm tới như thế nào?
Bằng cách cho phép sẵn sàng trí tuệ nhân tạo thực sự. Chúng tôi đi vào, hiểu những gì các công ty và chính phủ cần, xây dựng các chiến lược dữ liệu và trí tuệ nhân tạo, và sau đó giúp họ xây dựng, thử nghiệm, triển khai và mở rộng quy mô.
Nếu dữ liệu là dầu mỏ mới, thì dữ liệu không có cấu trúc là dầu chưa tinh chế – đầy tiềm năng nhưng vô dụng cho đến khi được xử lý. Đó là lý do tại sao chúng tôi đã xây dựng CNTXT AI để giúp các tổ chức làm sạch, cấu trúc và kích hoạt dữ liệu của họ. Bởi vì đó là nơi mà sự biến đổi trí tuệ nhân tạo thực sự bắt đầu.
Từ góc độ của bạn là một doanh nhân và nhà đầu tư, bạn sẽ đưa ra lời khuyên gì cho các nhà sáng lập khác đang xây dựng các công ty khởi nghiệp trí tuệ nhân tạo ở các thị trường mới nổi?
Bắt đầu ngay. Di chuyển nhanh. Thất bại nhanh, học nhanh hơn, và tiếp tục lặp lại.
Quan trọng nhất, xây dựng cho các vấn đề thực sự. Ở gần mặt đất – lắng nghe người dùng, không chỉ tiếng ồn. Trong các thị trường mới nổi, tính liên quan và khả năng thích nghi là chìa khóa.
Cảm ơn bạn đã phỏng vấn tuyệt vời, người đọc muốn tìm hiểu thêm nên truy cập CNTXT AI.












