Phỏng vấn
Saket Saurabh, CEO và Đồng sáng lập của Nexla – Series Phỏng vấn

Saket Saurabh, CEO và Đồng sáng lập của Nexla, là một doanh nhân có đam mê sâu sắc với dữ liệu và cơ sở hạ tầng. Ông đang dẫn đầu sự phát triển của một nền tảng kỹ thuật dữ liệu tự động hóa thế hệ tiếp theo, được thiết kế để mang lại quy mô và tốc độ cho những người làm việc với dữ liệu.
Trước đó, Saurabh đã thành lập một công ty khởi nghiệp di động thành công, đạt được các cột mốc đáng kể, bao gồm việc mua lại, IPO và tăng trưởng thành một doanh nghiệp hàng triệu đô la. Ông cũng đã đóng góp vào nhiều sản phẩm và công nghệ đổi mới trong thời gian tại Nvidia.
Nexla cho phép tự động hóa kỹ thuật dữ liệu để dữ liệu có thể sẵn sàng sử dụng. Họ đạt được điều này thông qua một cách tiếp cận độc đáo của Nexsets – các sản phẩm dữ liệu làm cho nó dễ dàng cho bất kỳ ai tích hợp, chuyển đổi, giao hàng và giám sát dữ liệu.
Điều gì đã truyền cảm hứng cho bạn để đồng sáng lập Nexla, và làm thế nào những trải nghiệm của bạn trong kỹ thuật dữ liệu đã định hình tầm nhìn của bạn cho công ty?
Trước khi thành lập Nexla, tôi bắt đầu hành trình kỹ thuật dữ liệu của mình tại Nvidia xây dựng công nghệ có khả năng mở rộng cao, cao cấp về phía tính toán. Sau đó, tôi đã đưa công ty khởi nghiệp trước đó của mình qua một hành trình mua lại và IPO trong không gian quảng cáo di động, nơi dữ liệu lớn và học máy là một phần cốt lõi của dịch vụ của chúng tôi, xử lý khoảng 300 tỷ bản ghi dữ liệu mỗi ngày.
Khi nhìn vào cảnh quan vào năm 2015 sau khi công ty trước của tôi được niêm yết công khai, tôi đang tìm kiếm thử thách lớn tiếp theo mà tôi hào hứng. Đến từ hai nền tảng đó, rõ ràng với tôi rằng các thách thức về dữ liệu và tính toán đang hội tụ khi ngành công nghiệp đang chuyển hướng sang các ứng dụng tiên tiến được cung cấp bởi dữ liệu và AI.
Mặc dù chúng tôi không biết tại thời điểm đó rằng Trí tuệ nhân tạo Thế hệ (GenAI) sẽ tiến bộ nhanh như thế nào, nhưng rõ ràng là học máy và AI sẽ là nền tảng để tận dụng dữ liệu. Vì vậy, tôi bắt đầu suy nghĩ về loại cơ sở hạ tầng nào cần thiết để mọi người thành công khi làm việc với dữ liệu, và làm thế nào chúng tôi có thể làm cho nó có thể cho bất kỳ ai, không chỉ là kỹ sư, để tận dụng dữ liệu trong cuộc sống chuyên nghiệp hàng ngày của họ.
Điều đó đã dẫn đến tầm nhìn cho Nexla – để đơn giản hóa và tự động hóa kỹ thuật phía sau dữ liệu, vì kỹ thuật dữ liệu là một giải pháp tùy chỉnh trong hầu hết các công ty, đặc biệt là khi đối phó với các vấn đề dữ liệu phức tạp hoặc lớn. Mục tiêu là làm cho dữ liệu dễ tiếp cận và dễ tiếp cận hơn cho một loạt người dùng, không chỉ là kỹ sư dữ liệu. Những trải nghiệm của tôi trong việc xây dựng các hệ thống và ứng dụng dữ liệu có khả năng mở rộng đã thúc đẩy tầm nhìn này để dân chủ hóa quyền truy cập vào dữ liệu thông qua tự động hóa và đơn giản hóa.
Nexsets thể hiện như thế nào sứ mệnh của Nexla trong việc làm cho dữ liệu sẵn sàng sử dụng cho mọi người, và tại sao sự đổi mới này quan trọng đối với các doanh nghiệp hiện đại?
Nexsets thể hiện sứ mệnh của Nexla trong việc làm cho dữ liệu sẵn sàng sử dụng cho mọi người bằng cách giải quyết thách thức cốt lõi của dữ liệu. 3Vs của dữ liệu – khối lượng, tốc độ và đa dạng – đã là một vấn đề dai dẳng. Ngành công nghiệp đã đạt được một số tiến bộ trong việc giải quyết các thách thức với khối lượng và tốc độ. Tuy nhiên, sự đa dạng của dữ liệu vẫn còn là một chướng ngại vật đáng kể vì sự phổ biến của các hệ thống và ứng dụng mới đã dẫn đến sự đa dạng ngày càng tăng trong các cấu trúc và định dạng dữ liệu.
Cách tiếp cận của Nexla là tự động mô hình hóa và kết nối dữ liệu từ các nguồn đa dạng thành một thực thể nhất quán, một sản phẩm dữ liệu mà chúng tôi gọi là Nexset. Điều này cho phép người dùng truy cập và làm việc với dữ liệu mà không cần phải hiểu sự phức tạp cơ bản của các nguồn dữ liệu và cấu trúc khác nhau. Một Nexset hoạt động như một cổng, cung cấp một giao diện đơn giản và trực tiếp đến dữ liệu.
Điều này quan trọng đối với các doanh nghiệp hiện đại vì nó cho phép nhiều người, không chỉ là kỹ sư dữ liệu, tận dụng dữ liệu trong công việc hàng ngày của họ. Bằng cách trừu tượng hóa sự đa dạng và phức tạp của dữ liệu, Nexsets làm cho nó có thể cho người dùng kinh doanh, nhà phân tích và những người khác tương tác trực tiếp với dữ liệu họ cần mà không yêu cầu chuyên môn kỹ thuật rộng rãi.
Chúng tôi cũng đã làm việc để làm cho tích hợp dễ sử dụng cho người tiêu dùng dữ liệu ít kỹ thuật hơn – từ giao diện người dùng và cách mọi người cộng tác và quản lý dữ liệu đến cách họ xây dựng chuyển đổi và công việc. Trừu tượng hóa sự phức tạp của sự đa dạng dữ liệu là chìa khóa để dân chủ hóa quyền truy cập vào dữ liệu và trao quyền cho một loạt người dùng để khai thác giá trị từ tài sản thông tin của họ. Đây là một khả năng quan trọng đối với các doanh nghiệp hiện đại đang tìm cách trở nên dựa trên dữ liệu hơn và tận dụng thông tin được cung cấp bởi dữ liệu trên toàn tổ chức.
Điều gì làm cho dữ liệu “sẵn sàng cho GenAI” và Nexla giải quyết các yêu cầu này một cách hiệu quả như thế nào?
Câu trả lời một phần phụ thuộc vào cách bạn sử dụng GenAI. Hầu hết các công ty đang triển khai GenAI Retrieval Augmented Generation (RAG). Điều đó đòi hỏi phải chuẩn bị và mã hóa dữ liệu để tải vào cơ sở dữ liệu vector và sau đó lấy dữ liệu thông qua tìm kiếm để thêm vào bất kỳ lời nhắc nào làm ngữ cảnh làm đầu vào cho một mô hình ngôn ngữ lớn (LLM) mà chưa được đào tạo bằng dữ liệu này. Vì vậy, dữ liệu cần được chuẩn bị theo cách để làm việc tốt cho cả tìm kiếm vector và LLM.
Bất kể bạn đang sử dụng RAG, Retrieval Augmented Fine-Tuning (RAFT) hay thực hiện đào tạo mô hình, có một số yêu cầu chính:
- Định dạng dữ liệu: GenAI LLM thường hoạt động tốt nhất với dữ liệu ở định dạng cụ thể. Dữ liệu cần được cấu trúc theo cách mà các mô hình có thể dễ dàng tiêu thụ và xử lý. Nó cũng nên được “chia nhỏ” theo cách giúp LLM sử dụng dữ liệu tốt hơn.
- Kết nối: GenAI LLM cần có thể truy cập động vào các nguồn dữ liệu liên quan, thay vì dựa vào các tập dữ liệu tĩnh. Điều này đòi hỏi kết nối liên tục với các hệ thống và kho dữ liệu doanh nghiệp khác nhau.
- Bảo mật và quản lý: Khi sử dụng dữ liệu doanh nghiệp nhạy cảm, điều quan trọng là phải có các kiểm soát bảo mật và quản lý mạnh mẽ. Truy cập và sử dụng dữ liệu cần được bảo mật và tuân thủ các chính sách tổ chức hiện có. Bạn cũng cần quản lý dữ liệu được sử dụng bởi LLM để giúp ngăn chặn vi phạm dữ liệu.
- Khả năng mở rộng: GenAI LLM có thể là dữ liệu và tính toán đòi hỏi, vì vậy cơ sở hạ tầng dữ liệu cơ bản cần có khả năng mở rộng để đáp ứng nhu cầu của các mô hình này.
Nexla giải quyết các yêu cầu để làm cho dữ liệu sẵn sàng cho GenAI theo một số cách chính:
- Truy cập dữ liệu động: Nền tảng tích hợp dữ liệu của Nexla cung cấp một cách duy nhất để kết nối với 100 nguồn và sử dụng các phong cách tích hợp và tốc độ dữ liệu khác nhau, cùng với điều phối, để cung cấp cho GenAI LLM dữ liệu mới nhất chúng cần, khi chúng cần, thay vì dựa vào các tập dữ liệu tĩnh.
- Chuẩn bị dữ liệu: Nexla có khả năng trích xuất, chuyển đổi và chuẩn bị dữ liệu ở các định dạng được tối ưu hóa cho từng trường hợp sử dụng GenAI, bao gồm mã hóa dữ liệu và hỗ trợ cho nhiều mô hình mã hóa.
- Tự phục vụ và cộng tác: Với Nexla, người tiêu dùng dữ liệu không chỉ truy cập dữ liệu của họ và xây dựng Nexsets và luồng. Họ có thể cộng tác và chia sẻ công việc của mình thông qua một thị trường đảm bảo dữ liệu ở đúng định dạng và cải thiện năng suất thông qua tái sử dụng.
- Tự động hóa: Tích hợp và GenAI đều khó. Nexla tự động hóa nhiều bước cần thiết dựa trên lựa chọn của người tiêu dùng dữ liệu – sử dụng AI và các kỹ thuật khác – để người dùng có thể thực hiện công việc của mình.
- Quản lý và bảo mật: Nexla kết hợp các kiểm soát bảo mật và quản lý mạnh mẽ trên toàn bộ, bao gồm cả cộng tác, để đảm bảo rằng dữ liệu doanh nghiệp nhạy cảm được truy cập và sử dụng một cách bảo mật và tuân thủ.
- Khả năng mở rộng: Nền tảng Nexla được thiết kế để mở rộng quy mô để xử lý các khối lượng công việc GenAI, cung cấp sức mạnh tính toán và khả năng mở rộng đàn hồi cần thiết.
Tích hợp hội tụ, tự phục vụ và cộng tác, tự động hóa và quản lý dữ liệu cần được xây dựng cùng nhau để làm cho dân chủ hóa dữ liệu có thể.
Làm thế nào các loại dữ liệu và nguồn dữ liệu đa dạng đóng góp vào thành công của các mô hình GenAI và Nexla đóng vai trò gì trong việc đơn giản hóa quá trình tích hợp?
Các mô hình GenAI cần truy cập vào tất cả các loại thông tin để cung cấp thông tin chi tiết và tạo ra đầu ra liên quan. Nếu bạn không cung cấp thông tin này, bạn không nên mong đợi kết quả tốt. Điều này tương tự như con người.
Các mô hình GenAI cần được đào tạo trên một loạt dữ liệu, từ cơ sở dữ liệu có cấu trúc đến tài liệu không có cấu trúc, để xây dựng một hiểu biết toàn diện về thế giới. Các nguồn dữ liệu khác nhau, chẳng hạn như bài viết, báo cáo tài chính và tương tác của khách hàng, cung cấp thông tin ngữ cảnh có giá trị mà các mô hình này có thể tận dụng. Tiếp xúc với dữ liệu đa dạng cũng cho phép các mô hình GenAI trở nên linh hoạt và thích nghi hơn, cho phép chúng xử lý một loạt các truy vấn và nhiệm vụ.
Nexla trừu tượng hóa sự đa dạng của tất cả dữ liệu này với Nexsets và làm cho nó dễ dàng truy cập hầu như bất kỳ nguồn nào, sau đó trích xuất, chuyển đổi, điều phối và tải dữ liệu để người tiêu dùng dữ liệu có thể tập trung vào dữ liệu và làm cho nó sẵn sàng cho GenAI.
Những xu hướng nào đang định hình hệ sinh thái dữ liệu vào năm 2025 và hơn thế nữa, đặc biệt là với sự trỗi dậy của GenAI?
Các công ty đã chủ yếu tập trung vào việc sử dụng GenAI để xây dựng các trợ lý hoặc đồng pilot, để giúp mọi người tìm kiếm câu trả lời và đưa ra quyết định tốt hơn. Trí tuệ nhân tạo đại lý, các đại lý tự động hóa nhiệm vụ mà không cần có người tham gia, chắc chắn là một xu hướng đang phát triển khi chúng tôi chuyển sang năm 2025. Các đại lý, giống như đồng pilot, cần tích hợp để đảm bảo rằng dữ liệu chảy liền mạch – không chỉ theo một hướng mà còn trong việc cho phép AI hành động trên dữ liệu đó.
Một xu hướng khác quan trọng cho năm 2025 là sự phức tạp ngày càng tăng của các hệ thống AI. Những hệ thống này đang trở nên tinh vi hơn bằng cách kết hợp các thành phần từ các nguồn khác nhau để tạo ra các giải pháp gắn kết. Điều này tương tự như cách con người dựa vào các công cụ khác nhau trong suốt cả ngày để hoàn thành nhiệm vụ. Các hệ thống AI được trao quyền sẽ theo đuổi cách tiếp cận này, điều phối nhiều công cụ và thành phần. Điều này trình bày một thách thức đáng kể nhưng cũng là một khu vực phát triển chính.
Từ góc độ xu hướng, chúng tôi đang chứng kiến một bước tiến trong việc phát triển trí tuệ nhân tạo để đi từ việc chỉ khớp mẫu đơn giản đến việc thực sự suy luận. Có rất nhiều tiến bộ công nghệ đang diễn ra trong không gian này. Mặc dù những tiến bộ này có thể không hoàn toàn chuyển thành giá trị thương mại vào năm 2025, nhưng chúng đại diện cho hướng chúng tôi đang đi.
Một xu hướng quan trọng khác là sự áp dụng ngày càng tăng các công nghệ tăng tốc cho suy luận AI, đặc biệt là với các công ty như Nvidia. Thông thường, GPU đã được sử dụng rộng rãi cho việc đào tạo các mô hình AI, nhưng suy luận thời gian chạy – điểm mà mô hình đang được sử dụng tích cực – đang trở nên quan trọng như nhau. Chúng tôi có thể mong đợi những tiến bộ trong việc tối ưu hóa suy luận, khiến nó trở nên hiệu quả và có tác động hơn.
Ngoài ra, có một sự nhận thức rằng dữ liệu đào tạo có sẵn đã được tối đa hóa. Điều này có nghĩa là các cải tiến thêm vào mô hình sẽ không đến từ việc thêm nhiều dữ liệu trong quá trình đào tạo mà từ cách các mô hình hoạt động trong quá trình suy luận. Tại thời gian chạy, việc tận dụng thông tin mới để tăng cường kết quả mô hình đang trở thành một焦 điểm quan trọng.
Mặc dù một số công nghệ thú vị bắt đầu đạt đến giới hạn của chúng, nhưng các phương pháp mới sẽ tiếp tục xuất hiện, cuối cùng nhấn mạnh tầm quan trọng của sự linh hoạt cho các tổ chức áp dụng AI. Điều gì hoạt động tốt ngày hôm nay có thể trở nên lỗi thời trong vòng sáu tháng đến một năm, vì vậy hãy chuẩn bị để thêm hoặc thay thế nguồn dữ liệu và bất kỳ thành phần nào của các đường ống AI của bạn. Ở lại sự thích nghi và cởi mở với thay đổi là quan trọng để theo kịp cảnh quan đang phát triển nhanh chóng.
Những chiến lược nào mà các tổ chức có thể áp dụng để phá vỡ các silo dữ liệu và cải thiện luồng dữ liệu trên các hệ thống của họ?
Trước hết, mọi người cần chấp nhận rằng các silo dữ liệu sẽ luôn tồn tại. Điều này đã luôn là trường hợp. Nhiều tổ chức cố gắng tập trung tất cả dữ liệu của họ vào một nơi, tin rằng nó sẽ tạo ra một thiết lập lý tưởng và mở khóa giá trị đáng kể, nhưng điều này chứng minh là gần như không thể. Nó thường biến thành một nỗ lực dài, tốn kém, nhiều năm, đặc biệt là đối với các doanh nghiệp lớn.
Vì vậy, thực tế là các silo dữ liệu ở đây để ở. Một khi chúng tôi chấp nhận điều đó, câu hỏi trở thành: Làm thế nào chúng tôi có thể làm việc với các silo dữ liệu một cách hiệu quả hơn?
Một sự tương tự hữu ích là suy nghĩ về các công ty lớn. Không có công ty lớn nào hoạt động từ một văn phòng duy nhất nơi mọi người làm việc cùng nhau trên toàn cầu. Thay vào đó, họ chia thành trụ sở chính và nhiều văn phòng. Mục tiêu không phải là chống lại sự phân chia tự nhiên này mà là đảm bảo rằng các văn phòng có thể cộng tác hiệu quả. Đó là lý do tại sao chúng tôi đầu tư vào các công cụ năng suất như Zoom hoặc Slack – để kết nối mọi người và cho phép các luồng công việc liền mạch trên các địa điểm.
Tương tự, các silo dữ liệu là các hệ thống phân mảnh sẽ luôn tồn tại trên các đội, bộ phận hoặc ranh giới khác. Mục tiêu không phải là loại bỏ chúng mà là làm cho chúng hoạt động cùng nhau một cách trơn tru. Biết điều này, chúng tôi có thể tập trung vào các công nghệ giúp kết nối các silo này.
Ví dụ, các công nghệ như Nexsets cung cấp một giao diện chung hoặc lớp trừu tượng hóa hoạt động trên các nguồn dữ liệu đa dạng. Bằng cách hoạt động như một cổng đến các silo dữ liệu, chúng đơn giản hóa quá trình tương tác với dữ liệu phân tán trên các silo khác nhau. Điều này tạo ra hiệu quả và giảm thiểu tác động tiêu cực của các silo.
Tóm lại, chiến lược nên là về việc tăng cường sự cộng tác giữa các silo chứ không phải là cố gắng chống lại chúng. Nhiều doanh nghiệp mắc sai lầm khi cố gắng hợp nhất mọi thứ vào một hồ dữ liệu lớn. Nhưng, để nói thật, đó là một trận chiến gần như không thể thắng.
Làm thế nào các nền tảng dữ liệu hiện đại xử lý các thách thức như tốc độ và khả năng mở rộng, và điều gì giúp Nexla khác biệt trong việc giải quyết các vấn đề này?
Cách tôi nhìn nhận, nhiều công cụ trong ngăn xếp dữ liệu hiện đại ban đầu được thiết kế với trọng tâm là dễ sử dụng và tốc độ phát triển, điều này đến từ việc làm cho các công cụ dễ tiếp cận hơn – cho phép các nhà phân tích tiếp thị di chuyển dữ liệu của họ từ một nền tảng tiếp thị trực tiếp đến một công cụ trực quan hóa, ví dụ. Sự tiến hóa của các công cụ này thường liên quan đến việc phát triển các giải pháp điểm, hoặc các công cụ được thiết kế để giải quyết các vấn đề cụ thể, hẹp.
Khi chúng tôi nói về khả năng mở rộng, mọi người thường nghĩ về khả năng mở rộng về khối lượng dữ liệu. Nhưng thách thức thực sự của khả năng mở rộng đến từ hai yếu tố chính: Số lượng người cần làm việc với dữ liệu đang tăng lên, và sự đa dạng của các hệ thống và loại dữ liệu mà các tổ chức cần quản lý.
Các công cụ hiện đại, được chuyên môn hóa cao, có xu hướng giải quyết chỉ một tập hợp con của các thách thức này. Kết quả là, các tổ chức kết thúc bằng việc sử dụng nhiều công cụ, mỗi công cụ giải quyết một vấn đề duy nhất, điều này cuối cùng tạo ra các thách thức của riêng nó, như quá tải công cụ và hiệu quả.
Nexla giải quyết vấn đề này bằng cách duy trì sự cân bằng cẩn thận giữa sự dễ sử dụng và tính linh hoạt. Một mặt, chúng tôi cung cấp sự đơn giản thông qua các tính năng như mẫu và giao diện người dùng thân thiện. Mặt khác, chúng tôi cung cấp khả năng và khả năng của nhà phát triển cho phép các nhóm liên tục nâng cao nền tảng. Các nhà phát triển có thể thêm các khả năng mới vào hệ thống, nhưng những cải tiến này vẫn còn dễ tiếp cận như các nút và nhấp chuột cho người dùng không kỹ thuật. Cách tiếp cận này tránh được bẫy của các công cụ quá chuyên môn hóa trong khi cung cấp một loạt các chức năng cấp doanh nghiệp.
Điều thực sự giúp Nexla khác biệt là khả năng kết hợp sự dễ sử dụng với khả năng mở rộng và phạm vi rộng cần thiết bởi các tổ chức. Nền tảng của chúng tôi kết nối hai thế giới này một cách liền mạch, cho phép các đội làm việc hiệu quả mà không phải hy sinh sức mạnh hoặc tính linh hoạt.
Một trong những điểm mạnh chính của Nexla nằm ở kiến trúc trừu tượng của nó. Ví dụ, trong khi người dùng có thể thiết kế trực quan một đường ống dữ liệu, cách đường ống đó thực thi là rất linh hoạt. Tùy thuộc vào yêu cầu của người dùng – chẳng hạn như nguồn, đích hoặc liệu dữ liệu cần được thời gian thực – nền tảng tự động ánh xạ đường ống đến một trong sáu động cơ khác nhau. Điều này đảm bảo hiệu suất tối ưu mà không yêu cầu người dùng quản lý những phức tạp này một cách thủ công.
Nền tảng cũng được kết nối lỏng lẻo, có nghĩa là các hệ thống nguồn và đích được tách biệt. Điều này cho phép người dùng dễ dàng thêm nhiều đích đến các nguồn hiện có, thêm nhiều nguồn đến các đích hiện có và cho phép tích hợp hai chiều giữa các hệ thống.
Điều quan trọng là Nexla trừu tượng hóa thiết kế của đường ống để người dùng có thể xử lý dữ liệu批, dữ liệu truyền và dữ liệu thời gian thực mà không cần thay đổi luồng công việc hoặc thiết kế của họ. Nền tảng tự động thích nghi với nhu cầu này, giúp người dùng dễ dàng làm việc với dữ liệu ở bất kỳ định dạng hoặc tốc độ nào. Điều này nhiều hơn về thiết kế có suy nghĩ hơn là cụ thể ngôn ngữ lập trình, đảm bảo một trải nghiệm không gián đoạn.
Tất cả điều này minh họa rằng chúng tôi đã xây dựng Nexla với người tiêu dùng cuối cùng của dữ liệu trong tâm trí. Nhiều công cụ truyền thống được thiết kế cho những người sản xuất dữ liệu hoặc quản lý hệ thống, nhưng chúng tôi tập trung vào nhu cầu của người tiêu dùng dữ liệu muốn có giao diện nhất quán và trực tiếp để truy cập dữ liệu, bất kể nguồn gốc của nó. Ưu tiên trải nghiệm của người tiêu dùng đã cho phép chúng tôi thiết kế một nền tảng đơn giản hóa quyền truy cập vào dữ liệu trong khi duy trì tính linh hoạt cần thiết để hỗ trợ các trường hợp sử dụng đa dạng.
Chúng tôi có thể chia sẻ các ví dụ về cách các tính năng không mã và mã thấp đã biến đổi kỹ thuật dữ liệu cho khách hàng của bạn?
Các tính năng không mã và mã thấp đã biến đổi quá trình kỹ thuật dữ liệu thành một trải nghiệm cộng tác thực sự cho người dùng. Ví dụ, trong quá khứ, nhóm vận hành tài khoản của DoorDash, những người quản lý dữ liệu cho các nhà bán lẻ, cần cung cấp các yêu cầu cho nhóm kỹ sư. Các kỹ sư sẽ xây dựng các giải pháp, dẫn đến một quá trình lặp lại tốn thời gian.
Giờ đây, với các công cụ không mã và mã thấp, động lực này đã thay đổi. Nhóm vận hành hàng ngày có thể sử dụng giao diện mã thấp để xử lý các nhiệm vụ của họ trực tiếp. Đồng thời, nhóm kỹ sư có thể nhanh chóng thêm các tính năng và khả năng mới thông qua cùng một nền tảng mã thấp, cho phép cập nhật ngay lập tức. Nhóm vận hành có thể sử dụng liền mạch các tính năng này mà không cần chậm trễ.
Sự thay đổi này đã biến quá trình thành một nỗ lực cộng tác hơn là một nút thắt sáng tạo, dẫn đến tiết kiệm thời gian đáng kể. Khách hàng đã báo cáo rằng các nhiệm vụ trước đây mất hai đến ba tháng có thể được hoàn thành trong dưới hai tuần – một cải tiến 5x đến 10x về tốc độ.
Làm thế nào vai trò của kỹ thuật dữ liệu đang phát triển, đặc biệt là với việc áp dụng ngày càng tăng của AI?
Kỹ thuật dữ liệu đang phát triển nhanh chóng, được thúc đẩy bởi tự động hóa và các tiến bộ như GenAI. Nhiều khía cạnh của lĩnh vực này, chẳng hạn như tạo mã và tạo kết nối, đang trở nên nhanh hơn và hiệu quả hơn. Ví dụ, với GenAI, tốc độ tạo và triển khai kết nối đã được cải thiện đáng kể. Nhưng tiến bộ này cũng giới thiệu các thách thức mới, bao gồm sự phức tạp tăng lên, lo ngại về bảo mật và nhu cầu về quản lý và quản lý mạnh mẽ.
Một mối quan tâm quan trọng là khả năng lạm dụng dữ liệu doanh nghiệp. Các doanh nghiệp lo ngại về dữ liệu độc quyền của họ vô tình được sử dụng để đào tạo mô hình AI và mất lợi thế cạnh tranh hoặc gặp phải vi phạm dữ liệu khi dữ liệu bị rò rỉ cho người khác. Sự phức tạp ngày càng tăng của các hệ thống và khối lượng dữ liệu đòi hỏi các nhóm kỹ thuật dữ liệu phải áp dụng một quan điểm rộng hơn, tập trung vào các vấn đề hệ thống như bảo mật, quản lý và đảm bảo tính toàn vẹn của dữ liệu. Những thách thức này không thể được giải quyết đơn giản bằng AI.
Mặc dù trí tuệ nhân tạo tạo ra có thể tự động hóa các nhiệm vụ cấp thấp, vai trò của kỹ thuật dữ liệu đang chuyển sang việc điều phối hệ sinh thái rộng lớn hơn. Các kỹ sư dữ liệu bây giờ hành động nhiều như những người chỉ huy, quản lý nhiều thành phần và quy trình liên kết, chẳng hạn như thiết lập các biện pháp phòng ngừa để ngăn chặn lỗi hoặc truy cập không được phép, đảm bảo tuân thủ các tiêu chuẩn quản lý và theo dõi cách đầu ra được tạo bởi AI được sử dụng trong quyết định kinh doanh.
Các lỗi và sai sót trong những hệ thống này có thể tốn kém. Ví dụ, các hệ thống AI có thể kéo thông tin chính sách lỗi thời, dẫn đến phản hồi không chính xác, chẳng hạn như hứa hẹn một khoản hoàn tiền cho khách hàng khi nó không được phép. Những loại vấn đề này đòi hỏi sự giám sát và quy trình nghiêm ngặt để bắt và giải quyết những sai sót này trước khi chúng ảnh hưởng đến kinh doanh.
Một trách nhiệm chính khác cho các nhóm kỹ thuật dữ liệu là thích nghi với sự thay đổi trong nhân khẩu học người dùng. Các công cụ AI không còn bị giới hạn ở các nhà phân tích hoặc người dùng kỹ thuật có thể thách thức tính hợp lệ của báo cáo và dữ liệu. Những công cụ này bây giờ được sử dụng bởi các cá nhân ở rìa của tổ chức, chẳng hạn như đại lý hỗ trợ khách hàng, những người có thể không có chuyên môn để thách thức đầu ra không chính xác. Sự dân chủ hóa công nghệ rộng rãi này tăng trách nhiệm của các nhóm kỹ thuật dữ liệu để đảm bảo tính chính xác và độ tin cậy của dữ liệu.
Những tính năng hoặc tiến bộ mới nào có thể được mong đợi từ Nexla khi lĩnh vực kỹ thuật dữ liệu tiếp tục phát triển?
Chúng tôi đang tập trung vào một số tiến bộ để giải quyết các thách thức và cơ hội mới nổi khi kỹ thuật dữ liệu tiếp tục phát triển. Một trong những tiến bộ này là các giải pháp được thúc đẩy bởi AI để giải quyết sự đa dạng của dữ liệu. Một trong những thách thức chính trong kỹ thuật dữ liệu là quản lý sự đa dạng của dữ liệu từ các nguồn đa dạng, vì vậy chúng tôi đang tận dụng AI để简化 hóa quá trình này. Ví dụ, khi nhận dữ liệu từ hàng trăm nhà bán lẻ khác nhau, hệ thống có thể tự động ánh xạ nó vào một cấu trúc tiêu chuẩn. Ngày nay, quá trình này thường đòi hỏi sự đầu vào đáng kể của con người, nhưng các khả năng được thúc đẩy bởi AI của Nexla nhằm giảm thiểu nỗ lực thủ công và tăng hiệu quả.
Chúng tôi cũng đang phát triển công nghệ kết nối của mình để hỗ trợ thế hệ tiếp theo của các luồng công việc dữ liệu, bao gồm khả năng dễ dàng tạo ra các đại lý mới. Những đại lý này cho phép kết nối liền mạch với các hệ thống và cho phép người dùng thực hiện các hành động cụ thể trong những hệ thống đó. Điều này đặc biệt được thiết kế cho nhu cầu ngày càng tăng của người dùng GenAI và làm cho nó dễ dàng hơn để tích hợp và tương tác với nhiều nền tảng.
Thứ ba, chúng tôi tiếp tục đổi mới về giám sát và đảm bảo chất lượng được cải thiện. Khi nhiều người dùng tiêu thụ dữ liệu trên các hệ thống khác nhau, tầm quan trọng của giám sát và đảm bảo chất lượng dữ liệu đã tăng lên đáng kể. Mục tiêu của chúng tôi là cung cấp các công cụ mạnh mẽ cho giám sát hệ thống và đảm bảo chất lượng để dữ liệu vẫn đáng tin cậy và có thể hành động ngay cả khi sử dụng tăng.
Cuối cùng, Nexla cũng đang thực hiện các bước để mã nguồn mở một số khả năng cốt lõi của chúng tôi. Ý tưởng là bằng cách chia sẻ công nghệ của chúng tôi với cộng đồng rộng lớn hơn, chúng tôi có thể trao quyền cho nhiều người hơn để tận dụng các công cụ và giải pháp kỹ thuật dữ liệu tiên tiến, điều này cuối cùng phản ánh cam kết của chúng tôi trong việc thúc đẩy sự đổi mới và hợp tác trong lĩnh vực này.
Cảm ơn vì những phản hồi tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Nexla.












