Trí tuệ nhân tạo
Dr. Neil Yager, Đồng sáng lập và Nhà khoa học trưởng của Phrasee – Loạt phỏng vấn

Dr. Neil Yager là Nhà khoa học trưởng của Phrasee, và là kiến trúc sư của phương pháp Phrasee, một công cụ viết nội dung được hỗ trợ bởi AI đã giúp tối ưu hóa nội dung tiếp thị cho một số thương hiệu nổi tiếng nhất thế giới, bao gồm eBay, Groupon, và Virgin – cộng với nhiều thương hiệu khác, từ Úc đến Mỹ, trong hơn 20 ngôn ngữ, từ tiếng Anh đến tiếng Nhật.
Dr. Yager đã viết hơn một chục ấn phẩm học thuật, đã viết một cuốn sách về khai thác dữ liệu, và nắm giữ một số bằng sáng chế. Là một trong những chuyên gia hàng đầu thế giới về việc thương mại hóa trí tuệ nhân tạo, ông có bằng Tiến sĩ về Khoa học Máy tính từ Đại học New South Wales ở Úc.
Bạn là một chuyên gia 20 năm kinh nghiệm trong ngành công nghệ, bạn đã từng tham gia vào các vai trò liên quan đến AI nào trước đây?
Tôi đã tham gia vào công việc liên quan đến AI từ thời tôi còn học Tiến sĩ vào giữa những năm 2000. Tuy nhiên, lĩnh vực này đã trải qua nhiều lần đổi thương hiệu kể từ đó. Ví dụ, 15 năm trước, tôi đã nghiên cứu “nhận dạng mẫu thống kê”. Một vài năm sau, điều này được biết đến nhiều hơn với tên gọi “học máy”, đây là một tên gọi hấp dẫn hơn. Gần đây, học máy (và “học sâu” đặc biệt) đã trở thành đồng nghĩa với “trí tuệ nhân tạo” nói chung. Tôi có những cảm xúc lẫn lộn về điều này. Một mặt, công việc của tôi với Phrasee đã dạy tôi tầm quan trọng của việc xây dựng thương hiệu. Mặt khác, thuật ngữ “trí tuệ nhân tạo” mang theo những chiếc vali và có thể dẫn đến những hiểu lầm về công nghệ. Tôi tự hỏi chúng ta sẽ ở đâu nếu chúng ta vẫn gọi nó là “nhận dạng mẫu thống kê”.
Hầu hết công việc trước đây của tôi đều trong lĩnh vực xử lý tín hiệu và thị giác máy tính. Tôi không có nhiều kinh nghiệm về xử lý ngôn ngữ tự nhiên trước khi đến với Phrasee. Tôi đã học được rằng ngôn ngữ có lẽ là vấn đề khó nhất trong AI.
Vào năm 2008, bạn đã đồng viết một cuốn sách có tên ‘Hệ thống sinh trắc học và phân tích dữ liệu: Thiết kế, đánh giá và khai thác dữ liệu’, cuốn sách này kết hợp các khía cạnh của thống kê và học máy để cung cấp một hướng dẫn toàn diện về việc đánh giá, giải thích và hiểu dữ liệu sinh trắc học. Ngoài việc có thêm nhiều tài nguyên tính toán, bạn có nghĩ rằng lĩnh vực này đã phát triển kể từ khi cuốn sách được xuất bản? Bạn có thể mô tả cách nó phát triển không?
Học sâu đã làm thay đổi các lĩnh vực thị giác máy tính, xử lý ngôn ngữ và học máy kể từ khi tôi viết cuốn sách đó. Sẽ không thể viết cuốn sách đó ngày nay nếu không có một phần về học sâu.
Cuộc cách mạng học sâu thực sự bắt đầu vào năm 2012 khi một mô hình học sâu đã giành chiến thắng trong một cuộc thi gọi là ImageNet. ImageNet là một tập dữ liệu nhận dạng vật thể hình ảnh nơi máy tính xác định những gì trong một hình ảnh (ví dụ “con chó” hoặc “bóng”). Trong nhiều thập kỷ, các nhà nghiên cứu đã đạt được những bước tiến nhỏ trên các tập dữ liệu chuẩn. Mỗi lĩnh vực hoạt động độc lập và phụ thuộc nặng vào chuyên môn của lĩnh vực. Gần như qua đêm, tất cả các mô hình được xây dựng cẩn thận trong nhiều năm đã trở nên lỗi thời. Các thuật toán học sâu được thiết kế bởi những người ngoài cuộc đã giành chiến thắng trong các cuộc thi với những khoảng cách đáng kể. Điều này đã biến đổi ngành công nghiệp AI.
Lĩnh vực này vẫn đang phát triển nhanh chóng và đã phát triển thậm chí kể từ khi chúng tôi bắt đầu Phrasee chỉ vài năm trước. Ví dụ, các công cụ học sâu mà chúng tôi hiện đang phụ thuộc vào thậm chí không tồn tại khi chúng tôi thành lập công ty. Tốc độ đổi mới mang lại những thách thức của riêng nó.
Có thể bạn chia sẻ với chúng tôi về những gì Phrasee có thể làm cho các doanh nghiệp?
Phrasee giải quyết hai vấn đề cho doanh nghiệp. Đầu tiên, có vấn đề về việc viết nội dung tiếp thị. Hiện nay có nhiều kênh quảng cáo hơn bao giờ hết (ví dụ: email, AdWords, mạng xã hội, in ấn, podcast, v.v.). Việc viết nội dung cho tất cả những kênh này với chất lượng cao và phù hợp với phong cách và giọng nói của thương hiệu là rất khó. Phrasee giải quyết vấn đề về quy mô bằng cách tự động tạo nội dung. Thứ hai, điều quan trọng là tất cả ngôn ngữ được sử dụng phải hiệu quả. Không chỉ Phrasee tạo ra ngôn ngữ mà nó còn sử dụng học máy để dự đoán tác động của thông điệp và tối ưu hóa cho phù hợp.
Điều gì đã thu hút bạn đến ý tưởng sử dụng Xử lý Ngôn ngữ Tự nhiên (NLP), và Học sâu để cải thiện sức mạnh của nội dung quảng cáo?
Sử dụng AI để tối đa hóa tác động của các chiến dịch tiếp thị kỹ thuật số không phải là một ý tưởng mới. Có những đội ngũ người có bằng tiến sĩ về vật lý đã được tuyển dụng để làm việc về tối ưu hóa quảng cáo. Tuy nhiên, trong hầu hết các trường hợp, họ tập trung nỗ lực nghiên cứu và phát triển vào những thứ như phân khúc khán giả, cá nhân hóa, thời gian giao hàng, vị trí quảng cáo, phông chữ, v.v. Khi chúng tôi bắt đầu đưa ra ý tưởng cho Phrasee, chúng tôi nhận thấy rằng gần như mọi thứ về quảng cáo đều được tối ưu hóa ngoại trừ ngôn ngữ thực sự được sử dụng! Chúng tôi đã xác định đây là một khoảng trống trên thị trường và một cơ hội lớn.
Phrasee có thể cải thiện nội dung tiếp thị trong hơn 20 ngôn ngữ, bao gồm cả tiếng Nhật. Bạn có thể thảo luận về một số vấn đề Xử lý Ngôn ngữ Tự nhiên duy nhất mà bạn gặp phải với các ngôn ngữ nước ngoài?
Sự bổ sung gần đây nhất vào tập hợp các ngôn ngữ được hỗ trợ của chúng tôi là tiếng Nga. Đây là một ngôn ngữ Slav, và nó rất khác biệt so với các ngôn ngữ Ấn-Âu khác. Trong trường hợp này, cần phải xây dựng các quy tắc mới vào hệ thống tạo ngôn ngữ của chúng tôi để đầu ra là trôi chảy và chính xác về mặt ngữ pháp. Điều này không chỉ là vấn đề ngôn ngữ. Đây cũng là vấn đề phát triển phần mềm. Khi đầu ra của hệ thống chúng tôi ở ngôn ngữ bản địa của nhà phát triển, thì tương đối dễ dàng để phát hiện ra lỗi và xác minh rằng mọi thứ đều hoạt động chính xác. Tuy nhiên, khi làm việc với tiếng Nga hoặc tiếng Nhật, chúng tôi có thể đang tạo ra những điều vô nghĩa và không có ý tưởng. Điều quan trọng là phải có một người bản địa tham gia chặt chẽ vào quá trình kiểm tra chất lượng.
Thách thức không chỉ nằm ở các ngôn ngữ nước ngoài. Cũng có những sự khác biệt khu vực thú vị. Ví dụ, tiếng Anh có biến thể chính tả cho Mỹ, Anh, Úc, Canada, v.v. Hơn nữa, có những sự khác biệt về ngữ pháp. Trong tiếng Anh Anh, bạn “đưa một cái nhìn”, trong khi ở tiếng Anh Mỹ, bạn “nhìn một cái”. Ý nghĩa của từ cũng có thể thay đổi từ nơi này sang nơi khác. Một “đồ cao su” là một cục tẩy ở Anh, nhưng một bao cao su ở Bắc Mỹ! Để các hệ thống NLG được sử dụng cho các ứng dụng kinh doanh, chúng cần phải xử lý tất cả những sắc thái này.
Có thể bạn cũng chia sẻ một số chi tiết về cách học sâu được sử dụng trong Phrasee?
Có 2 thành phần AI chính trong công nghệ của Phrasee. Đầu tiên là Tạo Ngôn ngữ Tự nhiên (NLG), thực sự tạo ra ngôn ngữ. Thứ hai là học sâu, và ở đây tập trung vào hiệu suất. Hiệu suất có thể có nghĩa khác nhau tùy thuộc vào ngữ cảnh. Ví dụ, mục tiêu của một dòng tiêu đề email là lôi kéo người nhận mở email và xem nội dung bên trong. Đối với Facebook, mục tiêu có thể là tối đa hóa lượt thích hoặc chia sẻ. Với một lượng lớn dữ liệu lịch sử, có thể tìm thấy những xu hướng và mẫu tinh vi mà con người không bao giờ nhận thấy. Đây là một vấn đề học máy tiêu chuẩn.
Học sâu cung cấp một số lợi thế so với phương pháp học máy truyền thống. Với học máy truyền thống, có sự tập trung mạnh vào “kỹ thuật tính năng”. Điều này có nghĩa là nhà phát triển cần quyết định những gì họ tin là các tính năng quan trọng nhất của ngôn ngữ. Ví dụ: từ, độ dài, sử dụng biểu tượng cảm xúc, v.v. Vấn đề là điều này bị giới hạn bởi kỹ năng và tưởng tượng của kỹ sư. Tuy nhiên, với học sâu, văn bản thô được đưa vào mô hình, và nó xây dựng mô hình máy tính của ngôn ngữ (điều này được gọi là học cuối cùng). Do đó, nó miễn phí khỏi sự thiên vị của con người và đây là một cách tiếp cận mạnh mẽ. Tuy nhiên, nhược điểm là nó có thể khó hiểu tại sao mô hình lại hành xử theo cách đó. “Khả năng giải thích” là một lĩnh vực nghiên cứu tích cực trong cộng đồng học sâu. Tuy nhiên, có một sự đánh đổi cơ bản giữa sự phức tạp của một hệ thống và khả năng hiểu của chúng tôi. Ngôn ngữ của con người rất lộn xộn, vì vậy các giải pháp NLP thành công thường có một mức độ phức tạp cao.
Một trong những chức năng của Phrasee là khả năng viết theo giọng điệu độc đáo của thương hiệu, bạn có thể giải thích cách điều này được thực hiện?
Khi chúng tôi ký hợp đồng với một khách hàng mới, điều đầu tiên chúng tôi làm là thu thập thông tin về phong cách giao tiếp của thương hiệu. Điều này bao gồm bất kỳ hướng dẫn thương hiệu chính thức nào, các chiến dịch tiếp thị lịch sử, và một loạt các câu hỏi mà chúng tôi đã phát triển cho mục đích này. Tất cả thông tin này được sử dụng bởi một đội ngũ kỹ thuật ngôn ngữ trong nhà để xây dựng một mô hình ngôn ngữ cụ thể cho khách hàng. Các mô hình ngôn ngữ của chúng tôi là tạo sinh, có nghĩa là chúng có thể tạo ra ngôn ngữ chưa từng thấy trước đây theo phong cách độc đáo của khách hàng.
Các mô hình ngôn ngữ có thể được cập nhật tại bất kỳ thời điểm nào. Ví dụ, tại thời điểm hiện tại, chúng tôi đang ở đỉnh điểm của cuộc khủng hoảng COVID-19. Đội ngũ ngôn ngữ của chúng tôi đang xem xét các mô hình của chúng tôi để đảm bảo rằng ngôn ngữ không phù hợp không thể được tạo ra. Một cụm từ như “Những ưu đãi này đang trở nên phổ biến!” có thể là vô hại một vài tháng trước, nhưng rõ ràng là không phù hợp trong tình hình đại dịch toàn cầu. Điều này chứng tỏ sự linh hoạt của hệ thống của chúng tôi.
Loại dữ liệu nào cần thiết cho một công ty muốn bắt đầu sử dụng Phrasee?
Thành thật mà nói, không cần nhiều dữ liệu để bắt đầu với chúng tôi. Bước đầu tiên là xác định một khu vực dự án phù hợp. Ví dụ, đây có thể là các dòng tiêu đề cho email quảng cáo hàng tuần. Lý tưởng nhất, điều này sẽ có một lượng khán giả tương đối lớn và giao tiếp sẽ được thường xuyên. Một khi dự án đã được xác định, chúng tôi cần thông tin về chủ đề và giọng điệu của thương hiệu để xây dựng mô hình ngôn ngữ. Phrasee cần kết quả hiệu suất trên cơ sở liên tục. Vì giải pháp của chúng tôi sử dụng học máy, điều quan trọng là chúng tôi phải đo lường và theo dõi các chỉ số chính theo thời gian. Thông tin này được cung cấp lại cho hệ thống của chúng tôi để nó có thể liên tục tối ưu hóa cho sự tương tác.
Có điều gì khác bạn muốn chia sẻ về Phrasee?
Khi Parry, Victoria và tôi bắt đầu Phrasee năm năm trước, chúng tôi chắc chắn rằng chỉ là vấn đề thời gian trước khi nhiều công ty khởi nghiệp khác xuất hiện với các sản phẩm tương tự. Kế hoạch của chúng tôi là có một bước chạy trước đối thủ và luôn đi trước một bước. Tuy nhiên, chúng tôi đã ngạc nhiên về sự thiếu vắng các đối thủ trong không gian này. Mọi người khác đang ở đâu? Tôi nghĩ có một vài lý do cho điều này, nhưng một trong những lý do chính là ngôn ngữ rất khó. Tôi nghi ngờ những người khác đã cố gắng tạo ra các sản phẩm tương tự nhưng thất bại sớm trong các giai đoạn R&D. Điều này là minh chứng cho sự độc đáo của công nghệ của chúng tôi.












