Συνεντεύξεις
Phil Hall, Chief Growth Officer tại LXT – Interview Series

LXT Chief Growth Officer Phil Hall là một cựu giám đốc điều hành của Appen và thành viên của Forbes Technology Council. Trong vai trò lãnh đạo của mình tại Appen, ông đã điều hành một bộ phận với hơn 1.000 nhân viên và đóng vai trò quan trọng trong việc đạt được 17 năm tăng trưởng doanh thu liên tục với lợi nhuận mạnh mẽ. Trong vai trò hiện tại của mình tại LXT, ông đang làm việc với một đội chuyên gia được chọn lọc kỹ lưỡng để đạt được mục tiêu tăng trưởng tham vọng.
LXT là một công ty dẫn đầu trong lĩnh vực đào tạo dữ liệu AI để cung cấp công nghệ thông minh cho các tổ chức toàn cầu, bao gồm cả các công ty công nghệ lớn nhất thế giới. Với sự hợp tác của một mạng lưới.contributor quốc tế, LXT thu thập và chú thích dữ liệu trên nhiều phương thức với tốc độ, quy mô và sự linh hoạt cần thiết cho doanh nghiệp. Họ có chuyên môn toàn cầu bao gồm hơn 115 quốc gia và 750 vị trí ngôn ngữ. Thành lập vào năm 2010, LXT có trụ sở tại Toronto, Canada với sự hiện diện tại Hoa Kỳ, Úc, Ai Cập, Vương quốc Anh và Thổ Nhĩ Kỳ. Công ty phục vụ khách hàng tại Bắc Mỹ, Châu Âu, Châu Á Thái Bình Dương và Trung Đông.
Khi nào bạn lần đầu tiên phát hiện ra rằng bạn đam mê ngôn ngữ?
Tôi đã bị thu hút bởi ngôn ngữ từ lâu, nhưng về việc tham gia trực tiếp với ngôn ngữ và ngôn ngữ học, có một bước ngoặt quan trọng đối với tôi. Chúng tôi nhận ra rất sớm rằng một trong những đứa con của chúng tôi bị dyslexia, và khi chúng tôi nói với trường học của cô ấy về việc hỗ trợ thêm, họ nói rằng trong khi có các chương trình họ có thể tiếp cận, cũng có những việc tôi có thể làm như một tình nguyện viên tại trường học để giúp con gái tôi và các đứa trẻ khác. Điều đó đã diễn ra tốt đẹp, và từ đó tôi đã tiếp tục học ngôn ngữ học và tìm mình đang giảng dạy tại hai trường đại học ở đây tại Sydney.
Bạn đã giảng dạy ngôn ngữ học trước khi chuyển sang lĩnh vực dữ liệu giọng nói, điều gì đã truyền cảm hứng cho bạn để thay đổi trọng tâm?
Appen có trụ sở tại Sydney chỉ mới chuyển từ một hoạt động được vận hành từ một phòng phụ trong một ngôi nhà sang một hoạt động thương mại hoàn chỉnh. Tôi đã được thông báo rằng họ đang tìm kiếm một nhà ngôn ngữ học (có lẽ chính xác hơn, một ngôn ngữ học!) và tôi đã được giới thiệu với các nhà sáng lập Julie và Chris Vonwiller. Sự chuyển đổi là dần dần và kéo dài trong khoảng hai năm. Tôi đã do dự khi từ bỏ việc giảng dạy – làm việc với các sinh viên đạt được thành tích cao là cả nguồn cảm hứng và rất thú vị. Nhưng đặc biệt là trong những năm tiên phong, tôi đã giải quyết các vấn đề khó khăn cùng với các chuyên gia hàng đầu về công nghệ ngôn ngữ trên thế giới, và mức độ phấn khích là rất cao. Nhiều điều được coi là đương nhiên ngày nay, đã rất thách thức vào thời điểm đó.
Bạn đã nghỉ hưu để gia nhập LXT. Điều gì đã мотivate bạn để làm điều này?
Đó là một câu hỏi thú vị vì tôi thực sự đang tận hưởng bản thân trong nghỉ hưu. Trên thực tế, đồng sáng lập và CEO của chúng tôi, Mohammad Omar, đã tiếp cận tôi vài tháng trước khi tôi phản hồi yêu cầu ban đầu của anh ấy, vì tôi đang sống một lối sống thư giãn và chưa từng nghĩ đến việc trở lại làm việc toàn thời gian.
Nhưng cuối cùng, cơ hội này đơn giản là quá tốt để từ chối.
Trong khi nói chuyện với Mohammad và các thành viên khác của đội LXT, tôi ngay lập tức nhận ra một niềm đam mê ngôn ngữ được chia sẻ. Đội ngũ mà Mohammad đã tập hợp là những người nghĩ sáng tạo với năng lượng không giới hạn, những người hoàn toàn cam kết với sứ mệnh của công ty.
Khi tôi tìm hiểu thêm về cơ hội với LXT, tôi nhận ra đó là một cơ hội mà tôi không muốn bỏ lỡ. Đây là một công ty có tiềm năng lớn để mở rộng và phát triển trong một lĩnh vực mà tôi đam mê. Và khi thị trường AI tiếp tục phát triển theo cấp số nhân, cơ hội giúp nhiều tổ chức chuyển từ thử nghiệm sang sản xuất là một điều thú vị mà tôi rất hạnh phúc được tham gia.
Điều gì là một số thách thức hiện tại đằng sau việc thu thập dữ liệu với quy mô lớn?
Các thách thức là đa dạng như các ứng dụng thúc đẩy chúng.
Về mặt thực tế, các thách thức bao gồm tính xác thực, độ tin cậy, độ chính xác, bảo mật và đảm bảo rằng dữ liệu phù hợp với mục đích – và đó là chưa tính đến số lượng ngày càng tăng các thách thức pháp lý và đạo đức vốn có trong việc thu thập dữ liệu.
Ví dụ, sự phát triển của công nghệ hỗ trợ xe tự hành đòi hỏi phải thu thập một lượng lớn dữ liệu trên nhiều kịch bản khác nhau để xe có thể hiểu cách phản ứng với các tình huống thế giới thực. Có vô số trường hợp ngoại lệ mà bạn có thể gặp phải khi lái xe, vì vậy các thuật toán cung cấp năng lượng cho những chiếc xe đó cần các tập dữ liệu bao gồm mọi thứ từ đường phố đến biển báo dừng đến các vật thể rơi. Và sau đó nếu bạn nhân số đó với số lượng sự kiện thời tiết có thể xảy ra, số lượng dữ liệu đào tạo cần thiết sẽ tăng theo cấp số nhân. Các công ty ô tô tham gia vào không gian tự hành cần thiết lập một đường ống dữ liệu đáng tin cậy, và việc làm điều đó một mình sẽ đòi hỏi một lượng tài nguyên khổng lồ.
Một trường hợp sử dụng khác là việc mở rộng một sản phẩm AI giọng nói hiện có sang các thị trường mới để thu hút thị phần và khách hàng mới. Điều này vô tình đòi hỏi dữ liệu ngôn ngữ, và để đạt được độ chính xác, điều quan trọng là phải thu thập dữ liệu giọng nói từ người bản địa trên nhiều hồ sơ nhân khẩu học khác nhau. Một khi dữ liệu đã được thu thập, các tệp giọng nói cần được chuyển录 để đào tạo các thuật toán NLP của sản phẩm. Việc làm điều này cho nhiều ngôn ngữ và với số lượng dữ liệu cần thiết để có hiệu quả là cực kỳ thách thức đối với các công ty để tự làm, đặc biệt nếu họ thiếu chuyên môn nội bộ trong lĩnh vực này.
Đây chỉ là hai ví dụ về nhiều thách thức tồn tại với việc thu thập dữ liệu cho AI với quy mô lớn, nhưng như bạn có thể tưởng tượng, tự động hóa tại nhà, thiết bị di động và thu thập dữ liệu sinh trắc học mỗi đều có những thách thức cụ thể của riêng chúng.
Điều gì là các cách thức hiện tại mà LXT thu thập và chú thích dữ liệu?
Tại LXT, chúng tôi thu thập và chú thích dữ liệu khác nhau cho mỗi khách hàng, vì tất cả các hợp tác của chúng tôi đều được tùy chỉnh để đáp ứng các thông số kỹ thuật của khách hàng. Chúng tôi làm việc trên nhiều loại dữ liệu, bao gồm âm thanh, hình ảnh, giọng nói, văn bản và video. Đối với việc thu thập dữ liệu, chúng tôi làm việc với một mạng lưới nhà thầu toàn cầu để thu thập dữ liệu trong các phương thức khác nhau. Các bộ sưu tập có thể bao gồm từ việc thu thập dữ liệu trong các môi trường thế giới thực như nhà, văn phòng hoặc trong xe, đến trong phòng thu với các kỹ sư giàu kinh nghiệm trong trường hợp của một số dự án thu thập dữ liệu giọng nói.
Khả năng chú thích dữ liệu của chúng tôi cũng bao gồm nhiều phương thức. Kinh nghiệm của chúng tôi bắt đầu trong không gian giọng nói và trong 12 năm qua, chúng tôi đã mở rộng sang hơn 115 quốc gia và hơn 750 vị trí ngôn ngữ. Điều này có nghĩa là các công ty của mọi quy mô có thể dựa vào LXT để giúp họ thâm nhập vào nhiều thị trường và thu hút các phân khúc khách hàng mới. Gần đây, chúng tôi đã mở rộng vào dữ liệu văn bản, hình ảnh và video, và nền tảng nội bộ của chúng tôi được sử dụng để cung cấp dữ liệu chất lượng cao cho khách hàng của chúng tôi.
Một lĩnh vực phát triển thú vị khác đối với chúng tôi là công việc chú thích bảo mật. Chỉ trong năm nay, chúng tôi đã mở rộng cơ sở vật chất bảo mật ISO 27001 từ hai đến năm địa điểm trên toàn thế giới. Chúng tôi đã phát triển một cuốn sách hướng dẫn cho phép chúng tôi thiết lập các cơ sở mới trong vài tháng. Các dịch vụ chúng tôi tập trung vào trong các cơ sở bảo mật này hiện đang là chú thích và chuyển录 dữ liệu giọng nói, nhưng chúng có thể được sử dụng để chú thích trên nhiều loại dữ liệu.
Tại sao việc thu thập dữ liệu theo cách này là một giải pháp thay thế vượt trội so với dữ liệu tổng hợp?
Dữ liệu tổng hợp là một phát triển thú vị trong lĩnh vực AI và phù hợp với các trường hợp sử dụng cụ thể, đặc biệt là các trường hợp ngoại lệ khó thu thập trong thế giới thực. Việc sử dụng dữ liệu tổng hợp đang tăng lên, đặc biệt là trong các giai đoạn đầu của sự trưởng thành AI khi các công ty vẫn còn trong chế độ thử nghiệm. Tuy nhiên, nghiên cứu của chúng tôi cho thấy rằng khi các tổ chức trưởng thành chiến lược AI của họ và đẩy nhiều mô hình hơn vào sản xuất, họ có nhiều khả năng sử dụng các phương pháp học máy có giám sát hoặc bán giám sát mà phụ thuộc vào dữ liệu được chú thích bởi con người.
Con người đơn giản là tốt hơn máy tính trong việc hiểu các sắc thái để tạo ra dữ liệu cần thiết để đào tạo các mô hình ML hoạt động với độ chính xác cao, và sự giám sát của con người cũng rất quan trọng để giảm thiểu偏見.
Tại sao dữ liệu này lại quan trọng đối với giọng nói và Xử lý Ngôn ngữ Tự nhiên?
Để các thuật toán xử lý giọng nói và ngôn ngữ tự nhiên hoạt động hiệu quả trong các thị trường dự định, chúng cần được đào tạo với số lượng lớn dữ liệu thu thập từ người bản địa có ngữ cảnh văn hóa của người dùng cuối mà họ đại diện. Nếu không có dữ liệu này, việc áp dụng AI giọng nói sẽ có những hạn chế nghiêm trọng.
Ngoài ra, môi trường cần được tính đến khi thu thập dữ liệu giọng nói. Nếu giải pháp AI giọng nói được đào tạo sẽ được sử dụng trong một chiếc xe, ví dụ, có các điều kiện đường xá và thời tiết khác nhau ảnh hưởng đến giọng nói và cần được tính đến. Đây là những kịch bản phức tạp mà một đối tác dữ liệu có kinh nghiệm có thể giúp đỡ.
Có điều gì khác mà bạn muốn chia sẻ về LXT?
Trước hết, tôi muốn cảm ơn bạn vì cơ hội để chia sẻ câu chuyện của chúng tôi! Tôi muốn nhấn mạnh rằng công ty của chúng tôi cam kết giúp các tổ chức thuộc mọi quy mô thành công với các sáng kiến AI của họ. Chúng tôi đã tập trung vào việc cung cấp dữ liệu AI tùy chỉnh cao cho các công ty trên toàn thế giới trong hơn 12 năm và chúng tôi sẽ rất vui được kết nối với bất kỳ ai đang tìm cách tạo ra một đường ống dữ liệu đáng tin cậy để hỗ trợ các dự án AI của họ.
Cảm ơn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập LXT.












