Phỏng vấn
Pedro Alves, CEO và Người sáng lập của Ople.ai – Loạt phỏng vấn

Pedro Alves là CEO và Người sáng lập của Ople.ai, một nền tảng trao quyền cho các nhà phân tích và chuyên gia chủ đề với phân tích dự đoán mạnh mẽ. Nền tảng này được trang bị kiến thức và chuyên môn của các nhà khoa học dữ liệu hàng đầu thế giới để người dùng có thể tập trung vào những gì họ thực sự giỏi: tạo ra tác động kinh doanh.
Điều gì ban đầu thu hút bạn đến với khoa học dữ liệu?
Vào năm 2001, tôi đã thấy tiềm năng lớn trong học máy và trí tuệ nhân tạo. Trong khi học khoa học máy tính như một sinh viên năm nhất, và quyết định lĩnh vực nào để theo đuổi, tôi nghĩ: OK, AI/ML là một lĩnh vực của khoa học máy tính mà tôi nghĩ là thú vị – bạn có thể giúp dự đoán sự kiện trong bất kỳ lĩnh vực nào. Cho dù bạn đang trong sinh học, y học, hoặc tài chính, nếu bạn có học máy và AI, bạn có thể tiến bộ đáng kể trong các lĩnh vực đó. Tôi luôn nghĩ rằng toán học đằng sau nó là thú vị.
Khi tôi vào trường sau đại học, tôi quyết định rằng cách tốt nhất để cải thiện chuyên môn của tôi trong học máy sẽ là học cách áp dụng nó. Tôi luôn rất thực tế; tôi không muốn học lý thuyết chỉ vì lý thuyết. Tôi chọn học học máy vì nó áp dụng cho lĩnh vực sinh học và protein học. Tất cả công việc sau đại học của tôi đều trong sinh học tính toán, nhưng trọng tâm là học máy.
Không lâu sau, tôi vào ngành chăm sóc sức khỏe, nơi tôi thấy tiềm năng lớn cho các ứng dụng AI/ML. Đó là khi tôi bắt đầu thấy các vấn đề mà AI có trong thực tế, bên ngoài học thuật. Tôi đã trải qua thực tế của AI và học cách nó đã được áp dụng không hiệu quả trong thế giới thực, và không phải vì các vấn đề kỹ thuật. Vì vậy, tôi sau đó trở nên thu hút vào việc giải quyết vấn đề.
Bạn trước đây là trưởng nhóm khoa học dữ liệu tại Banjo, nơi bạn đã giải quyết các thách thức trong lĩnh vực mạng xã hội. Bạn có thể thảo luận về một số thách thức đó không?
Là một công ty, chúng tôi sẽ phát hiện các sự kiện được ghi lại trên mạng xã hội, cụ thể là các sự kiện cần được nhấn mạnh như một nguy cơ tiềm ẩn, như một vụ tai nạn ô tô gần đó hoặc một tòa nhà đang cháy. Chúng tôi sẽ giúp đánh dấu những sự kiện này, để chúng tôi có thể giúp huy động các đội ứng phó đầu tiên. Chúng tôi đang sử dụng mạng xã hội vì lợi ích tốt.
Nhiều sự kiện như vậy là hiếm, liên quan đến dữ liệu mạng xã hội. Ví dụ, có rất nhiều vụ tai nạn xảy ra mỗi ngày ở bất kỳ thành phố nào, nhưng khi bạn đang xem xét khối lượng dữ liệu mạng xã hội, một bức ảnh về vụ tai nạn ô tô trở nên nhỏ bé. Hãy xem xét hàng triệu bức ảnh về những chú chó con, ảnh về thức ăn, hàng triệu bức ảnh tự chụp, và sau đó là một bức ảnh về vụ tai nạn ô tô, tất cả trong khoảng vài phút. Về cơ bản, tại Banjo, chúng tôi đang tìm kiếm chiếc kim trong đống rơm.
Vì vậy, một trong những thách thức sẽ phát sinh là liên quan đến tầm nhìn máy tính. Mặc dù tầm nhìn máy tính đã khá tốt vào thời điểm đó, nhưng khi bạn cố gắng tìm một trong số hàng triệu, thậm chí một tỷ lệ lỗi nhỏ cũng có thể hoàn toàn làm giảm khả năng phát hiện những sự kiện hiếm này.
Ví dụ, có một tập dữ liệu công khai mà khi được sử dụng để đào tạo mạng nơ-ron sẽ khiến chúng không thể nhận dạng màu sắc. Ngay cả khi một bức ảnh trong tập dữ liệu có màu sắc, và mạng nơ-ron đang xem tất cả RGB, nó không sử dụng màu sắc như một dấu hiệu. Hãy xem một chiếc xe cảnh sát truyền thống và một chiếc taxi truyền thống – cả hai đều là cùng một mẫu xe cơ bản và một mảnh máy móc ở trên (tức là còi cảnh sát trên xe cảnh sát hoặc tín hiệu miễn phí/bận trên taxi). Nhưng, nếu bạn nhìn vào màu sắc, sự khác biệt giữa hai chiếc xe là rõ ràng. Bởi vì trường hợp này, chúng tôi đã có thể hiểu rằng việc tạo ra một tập dữ liệu phù hợp là rất quan trọng.
Vào năm 2017, bạn sau đó đã ra mắt Ople. Câu chuyện khởi nguồn đằng sau startup này là gì?
Tôi muốn các công ty nhận được ROI vững chắc từ việc triển khai AI. Theo Gartner, giữa 80 đến 90 phần trăm dự án AI không bao giờ thấy ánh sáng ban ngày. Điều này không liên quan gì đến các khía cạnh kỹ thuật, như độ chính xác của mô hình. Nó thường liên quan đến văn hóa công ty hoặc các khía cạnh thủ tục trong công ty.
Điều này có thể là do thiếu sự giao tiếp đầy đủ giữa nhóm khoa học dữ liệu và người dùng kinh doanh, dẫn đến các mô hình dự đoán điều gì đó mà nhóm kinh doanh không cần vì nhóm khoa học dữ liệu không hiểu cần xây dựng gì. Hoặc, nếu họ xây dựng mô hình đúng, thì khi nhóm khoa học dữ liệu hoàn thành, nhóm kinh doanh không tận dụng các dự đoán. Trong hầu hết các công ty, các bộ phận như bán hàng, tiếp thị và hậu cần là những người thực sự nên sử dụng AI, nhưng đó là nhóm khoa học dữ liệu hiểu các mô hình. Khi những nhóm này không hiểu các mô hình được xây dựng cho họ, họ có xu hướng không tin tưởng vào dự đoán và do đó, không sử dụng chúng.
Vì vậy, nếu AI không thay đổi cách công ty kinh doanh, thì ý nghĩa là gì?
Chúng tôi muốn tạo ra một nền tảng giúp giải quyết vấn đề này – chúng tôi muốn giúp nhóm khoa học dữ liệu hoặc các nhà phân tích kinh doanh, nhà phân tích dữ liệu, ai tham gia vào quá trình này của công ty – xây dựng các dự án đúng và giúp nhân viên hiểu và tin tưởng vào các mô hình. Nếu chúng tôi giải quyết được điều đó, thì tôi tin rằng khoa học dữ liệu cuối cùng có thể có giá trị thực sự cho các công ty.
Bạn đã tuyên bố rằng các nhà khoa học dữ liệu đang mất thời gian quý báu khi thực hiện các nhiệm vụ có thể được tự động hóa với AI. Một số ví dụ về các nhiệm vụ nên được tự động hóa là gì?
Một nhà khoa học dữ liệu thường mất vài tháng để hoàn thành một mô hình, và một khi hoàn thành, công ty sẽ triển khai mô hình đó, mặc dù nó có thể không chính xác nhất có thể. Trong những tháng sau khi triển khai mô hình, nhà khoa học dữ liệu sẽ tiếp tục làm việc trên nó để cố gắng làm tăng độ chính xác của mô hình bằng các lượng nhỏ. Đây thường là nơi nhiều nhà khoa học dữ liệu dành thời gian của họ khi họ có thể dành thời gian cho các nhiệm vụ khác, chẳng hạn như đảm bảo nhân viên hiểu, tin tưởng và sử dụng các mô hình AI đã triển khai. Tất cả thời gian dành cho các nhiệm vụ như kỹ thuật tính năng, đào tạo mô hình, điều chỉnh tham số và lựa chọn thuật toán, cố gắng tăng độ chính xác của mô hình, có thể dễ dàng được tự động hóa với AI.
Bạn có thể mô tả học siêu là gì và cách Ople áp dụng nó không?
Trước khi tôi đến với học siêu, điều quan trọng là phải hiểu lớp học đầu tiên của học máy. Hãy nói, bạn có một tập dữ liệu dự đoán khi nào máy móc sẽ hỏng trên sàn nhà máy. Máy sẽ thông báo cho nhân viên rằng nó sắp hỏng, để họ có thể thực hiện bảo trì dự phòng. Điều này được coi là lớp học đầu tiên.
Học siêu, còn được gọi là “học để học”, là sự hiểu biết sâu hơn về quá trình học tập. Vì vậy, khi bạn đang đào tạo mô hình của mình để dự đoán lỗi máy, bạn có một mô hình khác quan sát. Ví dụ, mô hình thứ hai có thể giúp các doanh nghiệp hiểu哪 các tham số mô hình dự đoán bảo trì đang học tốt, và哪 các tham số không hoạt động tốt. Khi bạn thực hiện học siêu, bạn sẽ xây dựng các mô hình hiệu quả hơn, nhanh hơn.
Quan điểm của bạn về dữ liệu tổng hợp là gì?
Dữ liệu tổng hợp có thể rất khó làm việc, nếu không được thực hiện đúng cách.
Hãy nói, bạn có dữ liệu hồ sơ y tế – bạn có 20 bệnh nhân, và đối với những bệnh nhân đó, bạn có tuổi tác, giới tính, cân nặng, chiều cao, huyết áp, danh sách thuốc, v.v. Có thể tạo ra dữ liệu tổng hợp với học máy dựa trên những hồ sơ y tế này. Tuy nhiên, nếu bạn chỉ dựa vào học máy hoặc thống kê, bạn có thể kết thúc với dữ liệu tổng hợp không hợp lý. Nó có thể tạo ra một sự kết hợp ngẫu nhiên của các giá trị như một đứa trẻ 3 tuổi cao 6 feet hoặc một người cao 4 feet nặng 1.000 pound. Mặc dù AI/ML là đáng tin cậy trong nhiều trường hợp, nhưng dữ liệu tổng hợp được sử dụng cho hồ sơ y tế sẽ cần phải có sự tham gia của bác sĩ.
Vì vậy, bạn sẽ có một chuyên gia y tế tham gia để tạo ra các tham số, như “nếu người này ở độ tuổi này, thì phạm vi chiều cao và cân nặng thực tế là gì”, hoặc “nếu họ đang dùng thuốc này, thì những thuốc nào họ không nên dùng?” Quá trình này sẽ trở nên một nhiệm vụ khổng lồ và quá phức tạp để lập bản đồ tất cả các khả năng, vì chúng liên quan đến hồ sơ y tế của từng bệnh nhân.
Trong lĩnh vực hình ảnh, tuy nhiên, dữ liệu tổng hợp có thể dễ hiểu và tạo ra hơn. Hãy nói bạn có một bức ảnh về một chiếc xe, và chiếc xe nằm ở góc trên bên trái. Bạn không cần phải là một chuyên gia để biết rằng chiếc xe đó có thể nằm ở góc dưới bên trái, trên bên phải hoặc ở trung tâm. Không chỉ người ta có thể chỉ một máy ảnh theo nhiều cách, mà họ cũng có thể sắp xếp lại bức ảnh. Di chuyển焦 điểm của bức ảnh, để chiếc xe nằm ở tất cả các góc khác nhau, là tạo ra dữ liệu tổng hợp – một phương pháp khác đơn giản là sử dụng旋转.
Bạn có thể đưa ra một số ví dụ về cách Ople đã giúp các doanh nghiệp với nhu cầu dữ liệu của họ không?
Ople.AI cung cấp cho các doanh nghiệp khả năng sử dụng phân tích dữ liệu sâu sắc ở tất cả các cấp độ của tổ chức và cung cấp cho nhân viên của họ cơ hội để mở khóa giá trị của AI, chỉ với một vài cú nhấp chuột. Không giống như các tổ chức phụ thuộc vào một nhóm nhỏ các nhà khoa học dữ liệu để diễn giải và triển khai AI, Nền tảng Ople.AI trang bị cho nhân viên ở các bộ phận khác nhau với các công cụ để truy cập thông tin từ dữ liệu của họ, và do đó, tăng hiệu quả hàng ngày của họ.
Với điều đó được nói, một chướng ngại vật lớn mà các tổ chức thường phải đối mặt khi triển khai AI là khả năng giải thích mô hình. Điều quan trọng là các doanh nghiệp phải cung cấp AI mà nhân viên của họ có thể hiểu, và quan trọng hơn, tin tưởng. Khả năng giải thích mô hình giúp với điều đó. Mục tiêu của chúng tôi với Nền tảng Ople.AI là cung cấp cho nhân viên, những người có thể không phải là chuyên gia AI hoặc công nghệ, cơ hội để dễ dàng hiểu cách các mô hình đưa ra dự đoán và tại sao. Tạo khả năng giải thích mô hình sẽ tạo ra kết quả mạnh mẽ cho các doanh nghiệp trong dài hạn.
Ngoài ra, còn có nhiều giá trị hơn mà một mô hình có thể mang lại cho các công ty ngoài việc đưa ra dự đoán. AI có thể khám phá ra các vấn đề tiềm ẩn hoặc các lĩnh vực có thể được tận dụng. Chúng tôi gọi đó là khả năng giải thích dữ liệu – đó là các cách khác nhau mà một mô hình có thể chia sẻ thông tin thông minh về dữ liệu có giá trị cho một công ty. Đây là một cách lớn mà AI có thể giúp các doanh nghiệp, và đó là một lĩnh vực chúng tôi đang phát triển, liên quan đến sự cạnh tranh của chúng tôi.
Cảm ơn vì cuộc phỏng vấn, những người đọc muốn tìm hiểu thêm nên truy cập Ople.ai.












