Phỏng vấn
Patrick M. Pilarski, Tiến sĩ – Chủ tịch CIFAR AI (Amii) – Loạt Phỏng vấn

Tiến sĩ Patrick M. Pilarski là Chủ tịch CIFAR Trí tuệ Nhân tạo, cựu Chủ tịch Nghiên cứu Canada về Trí tuệ Máy móc cho Phục hồi, và là Phó giáo sư tại Bộ phận Y học Vật lý và Phục hồi, Khoa Y, Đại học Alberta.
Năm 2017, Tiến sĩ Pilarski đồng sáng lập văn phòng nghiên cứu quốc tế đầu tiên của DeepMind, nằm ở Edmonton, Alberta, nơi ông từng là đồng lãnh đạo văn phòng và Nhà khoa học Nghiên cứu Cấp cao cho đến năm 2023. Ông là Thành viên và Thành viên Hội đồng quản trị của Viện Trí tuệ Máy móc Alberta (Amii), đồng lãnh đạo Phòng thí nghiệm BLINC và là nhà điều tra chính của Phòng thí nghiệm Học tăng cường và Trí tuệ Nhân tạo (RLAI) và Mạng công nghệ Phục hồi Thần kinh và Cơ học (SMART) tại Đại học Alberta.
Tiến sĩ Pilarski là tác giả hoặc đồng tác giả của hơn 120 bài báo được đánh giá ngang hàng, là Thành viên Cấp cao của IEEE, và đã được hỗ trợ bởi các khoản trợ cấp nghiên cứu cấp tỉnh, quốc gia và quốc tế.
Chúng tôi đã ngồi xuống để phỏng vấn tại hội nghị Upper Bound năm 2023 về Trí tuệ Nhân tạo được tổ chức tại Edmonton, AB và do Amii (Viện Trí tuệ Máy móc Alberta) tổ chức.
Bạn đã tìm thấy mình trong lĩnh vực AI như thế nào? Điều gì thu hút bạn đến với ngành này?
Đây là hai câu hỏi riêng biệt. Về những gì thu hút tôi đến với AI, có một điều gì đó đẹp về cách phức tạp có thể xuất hiện và cách cấu trúc có thể xuất hiện từ phức tạp. Trí tuệ chỉ là một trong những ví dụ tuyệt vời về điều đó, vì vậy cho dù nó đến từ sinh học hay cách chúng ta nhìn thấy hành vi tinh vi xuất hiện trong máy móc, tôi nghĩ có một điều gì đó đẹp về điều đó. Đó luôn là điều thu hút tôi từ rất lâu, và hành trình dài và quanh co của tôi để làm việc trong lĩnh vực AI mà tôi đang làm việc bây giờ, đó là máy móc học thông qua thử nghiệm và sai lầm, hệ thống tăng cường học tập tương tác với con người trong khi cả hai đều được ngâm trong dòng chảy của kinh nghiệm, đã đến thông qua nhiều giai đoạn khác nhau.
Tôi đã nghiên cứu cách máy móc và con người có thể tương tác về mặt thiết bị sinh học và công nghệ sinh học, những thứ như chi giả và prosthesis.
Tôi đã xem xét cách AI có thể được sử dụng để hỗ trợ chẩn đoán y tế, cách chúng ta có thể sử dụng trí tuệ máy móc để bắt đầu hiểu các mẫu dẫn đến bệnh tật hoặc cách các bệnh khác nhau có thể xuất hiện về mặt ghi lại trên máy. Nhưng tất cả đều là một phần của hành trình dài này để thực sự bắt đầu đánh giá cao cách bạn có thể nhận được hành vi phức tạp từ các nền tảng đơn giản. Và đó là điều tôi thực sự yêu thích, đặc biệt là về học tăng cường, đó là ý tưởng máy móc có thể nhúng mình vào dòng chảy thời gian và học từ kinh nghiệm của chính nó để thể hiện hành vi phức tạp và nắm bắt các hiện tượng phức tạp thực sự trong thế giới xung quanh nó. Đó đã là một lực đẩy chính.
Về mặt cơ học, tôi thực sự đã làm rất nhiều đào tạo y học thể thao và những thứ như vậy từ thời trung học. Tôi đã nghiên cứu y học thể thao và bây giờ tôi đang làm việc trong một môi trường nơi tôi xem xét cách trí tuệ máy móc và công nghệ phục hồi kết hợp lại để hỗ trợ mọi người trong cuộc sống hàng ngày. Đó là một hành trình rất thú vị, giống như sự tò mò về các hệ thống phức tạp và sự phức tạp, và sau đó là sự thực tế về cách chúng ta bắt đầu suy nghĩ về cách con người có thể được hỗ trợ tốt hơn, sống cuộc sống họ muốn sống.
Bạn đã được dẫn dắt đến lĩnh vực giả lập như thế nào?
Điều thực sự thú vị về các lĩnh vực như y học thể thao là việc nhìn vào cơ thể con người và cách nhu cầu độc đáo của ai đó, cho dù đó là thể thao hay khác, thực sự có thể được hỗ trợ bởi những người khác, bởi các thủ tục và quy trình. Các chi giả và công nghệ giả lập là về việc xây dựng thiết bị, xây dựng hệ thống, xây dựng công nghệ giúp mọi người sống cuộc sống họ muốn sống. Hai điều này thực sự gắn kết chặt chẽ. Thật thú vị khi được quay lại và thấy một số sở thích ban đầu của mình đã được thực hiện, và đặc biệt là khi đồng lãnh đạo một phòng thí nghiệm nơi chúng tôi xem xét… Và đặc biệt là các hệ thống học máy mà làm việc trong một cách kết hợp chặt chẽ, người mà chúng được thiết kế để hỗ trợ.
Bạn đã thảo luận trước đó về cách một giả lập thích nghi với người dùng thay vì người dùng thích nghi với giả lập. Bạn có thể nói về học máy đằng sau điều này?
Tuyệt đối. Là nền tảng trong lịch sử sử dụng công cụ, con người đã thích nghi với công cụ của mình và sau đó chúng ta đã thích nghi công cụ của mình với nhu cầu mà chúng ta có. Và vì vậy, có một quá trình lặp lại của việc chúng ta thích nghi với công cụ của mình. Chúng ta đang ở một điểm chuyển đổi quan trọng nơi lần đầu tiên, chúng ta có thể tưởng tượng xây dựng công cụ mang lại một số đặc điểm của trí tuệ con người. Công cụ sẽ thực sự thích nghi và cải thiện trong khi được sử dụng bởi một người. Các công nghệ cơ bản hỗ trợ học tập liên tục. Hệ thống có thể học tập liên tục từ một dòng kinh nghiệm liên tục. Trong trường hợp này, học tăng cường và các cơ chế dướipin nó, những thứ như học tập sự khác biệt thời gian, thực sự quan trọng để xây dựng hệ thống có thể liên tục thích nghi trong khi tương tác với một người và trong khi được sử dụng bởi một người hỗ trợ họ trong cuộc sống hàng ngày.
Bạn có thể định nghĩa học tập sự khác biệt thời gian?
Tuyệt đối, điều tôi thực sự thích về điều này là chúng ta có thể nghĩ về các công nghệ cốt lõi, học tập sự khác biệt thời gian và các thuật toán học dự đoán cơ bản dướipin nhiều điều chúng ta làm việc trong phòng thí nghiệm. Bạn có một hệ thống mà, giống như chúng ta, đang làm một dự đoán về tương lai sẽ như thế nào với sự tôn trọng một số tín hiệu, với sự tôn trọng một thứ như phần thưởng tương lai là những gì chúng ta thường thấy. Nhưng bất kỳ tín hiệu nào khác bạn có thể tưởng tượng như, tôi đang sử dụng bao nhiêu lực ngay bây giờ? Sẽ nóng bao nhiêu? Tôi sẽ có bao nhiêu chiếc bánh rán vào ngày mai? Những điều này là những thứ có thể tưởng tượng được. Và vì vậy, thuật toán cốt lõi thực sự đang xem xét sự khác biệt giữa dự đoán của tôi về những gì sẽ xảy ra ngay bây giờ và dự đoán của tôi về những gì sẽ xảy ra trong tương lai cùng với bất kỳ tín hiệu nào tôi đang nhận được.
Bao nhiêu lực tôi đang sử dụng khi một cánh tay robot đang nâng một cốc cà phê hoặc một cốc nước? Điều này có thể đang xem xét sự khác biệt giữa dự đoán về lượng lực tôi sẽ sử dụng ngay bây giờ hoặc lượng lực tôi sẽ sử dụng trong một khoảng thời gian trong tương lai. Và sau đó so sánh nó với dự đoán của tôi về tương lai và lực tôi thực sự đang sử dụng. Đặt tất cả những thứ này lại với nhau, và bạn sẽ nhận được lỗi này, lỗi sự khác biệt thời gian. Đó là sự tích lũy tuyệt vời của dự đoán mở rộng theo thời gian và sự khác biệt giữa chúng, mà bạn có thể sử dụng để cập nhật cấu trúc của chính máy học.
Và vì vậy, một lần nữa, đối với học tăng cường truyền thống dựa trên phần thưởng, điều này có thể đang xem xét việc cập nhật cách máy móc hoạt động dựa trên phần thưởng tương lai mà bạn có thể nhận thức được. Đối với nhiều điều chúng ta làm, nó đang xem xét các tín hiệu khác, sử dụng các hàm giá trị tổng quát, đó là sự thích nghi của quá trình học tăng cường để các tín hiệu khác có thể áp dụng cho hoạt động của máy móc.
Bạn thường nói về một giả lập gọi là Cairo Toe trong các bài trình bày của bạn. Điều gì có thể học được từ nó?
Tôi thích sử dụng ví dụ về Cairo Toe, một giả lập 3000 năm tuổi. Tôi làm việc trong lĩnh vực giả lập thần kinh, chúng ta hiện thấy rất nhiều hệ thống robot tiên tiến có thể trong một số trường hợp có cùng mức độ kiểm soát hoặc mức độ kiểm soát như các bộ phận sinh học. Và thế nhưng, tôi quay lại một chiếc giả lập gỗ được cách điệu hóa từ 3000 năm trước. Tôi nghĩ điều gì đó hay là nó là một ví dụ về con người mở rộng mình với công nghệ. Đó là điều chúng ta đang thấy ngay bây giờ trong lĩnh vực giả lập thần kinh và tương tác giữa con người và máy móc là không phải một điều gì đó kỳ lạ, mới mẻ hoặc kỳ dị. Chúng ta đã luôn là những người sử dụng công cụ, động vật không phải con người cũng sử dụng công cụ. Có rất nhiều cuốn sách tuyệt vời về điều này, đặc biệt là của Frans de Waal, “Are We Smart Enough to Know How Smart Animals Are?“.
Sự mở rộng của chính chúng ta, sự tăng cường và cải tiến của chính chúng ta thông qua việc sử dụng công cụ là không phải một điều gì đó mới, mà là một điều gì đó cổ xưa. Đó là một điều gì đó đã xảy ra từ thời gian và ký ức trong mảnh đất mà chúng ta đang đứng ngay bây giờ bởi những người đã sống ở đây. Điều thú vị khác về Cairo Toe là bằng chứng, ít nhất từ các báo cáo học thuật về nó, cho thấy nó đã được thích nghi nhiều lần trong suốt quá trình tương tác với người dùng. Họ thực sự đã đi vào và tùy chỉnh nó và thay đổi nó, sửa đổi nó trong quá trình sử dụng.
Sự hiểu biết của tôi, nó không chỉ là một công cụ cố định được gắn vào một người trong suốt cuộc đời của họ, mà nó là một công cụ cố định được gắn nhưng cũng được sửa đổi. Đó là một ví dụ về cách, một lần nữa, ý tưởng rằng công cụ được thích nghi trong quá trình sử dụng của chúng là một điều gì đó cũng rất cổ xưa. Đó không phải là một điều gì đó mới, và có rất nhiều bài học chúng ta có thể học được từ sự thích nghi cùng nhau của con người và công cụ trong nhiều, nhiều năm.
Bạn đã đề cập trước đó về con đường phản hồi giữa giả lập và con người, bạn có thể giải thích về con đường phản hồi?
Chúng ta cũng đang ở một thời điểm đặc biệt về cách chúng ta đang xem xét mối quan hệ giữa một người và máy móc nhằm hỗ trợ họ trong cuộc sống hàng ngày. Khi ai đó đang sử dụng một chi giả, chẳng hạn như ai đó với sự khác biệt về chi, ai đó với việc cắt cụt đang sử dụng một chi giả. Thông thường, họ sẽ sử dụng nó rất nhiều như một công cụ, như một phần mở rộng của cơ thể, nhưng chúng ta sẽ thấy họ phụ thuộc rất nhiều vào những gì chúng ta coi là con đường kiểm soát. Đó là một số cảm giác về bánh xe hoặc ý định của họ đang được truyền xuống thiết bị, mà sau đó được giao nhiệm vụ để tìm ra nó là gì, và sau đó thực hiện theo đó, cho dù đó là mở và đóng tay, hoặc uốn cong khuỷu tay hoặc tạo ra một nắm tay để抓 một chiếc chìa khóa. Chúng ta thường không thấy mọi người nghiên cứu hoặc xem xét con đường phản hồi.
Vì vậy, một số lượng lớn các chi giả mà bạn có thể thấy được triển khai thương mại, con đường thông tin chảy từ thiết bị trở lại người có thể là sự kết nối cơ học, cách họ thực sự cảm nhận lực của chi và hành động theo đó. Nó có thể là họ nghe thấy tiếng động của động cơ hoặc họ xem khi họ nhặt một chiếc cuff và di chuyển nó trên bàn hoặc họ nắm lấy nó từ một phần khác của không gian làm việc của họ. Và vì vậy, những con đường đó là cách truyền thống để làm điều đó. Có những điều tuyệt vời đang xảy ra trên toàn cầu để xem xét cách thông tin có thể được truyền tải tốt hơn từ một chi giả trở lại người sử dụng nó. Đặc biệt là ngay cả ở Edmonton, có rất nhiều công việc thực sự cool đang sử dụng việc tái tạo dây thần kinh, tái tạo dây thần kinh mục tiêu và những thứ khác để hỗ trợ con đường đó. Nhưng nó vẫn là một lĩnh vực nghiên cứu mới nổi để suy nghĩ về cách học máy hỗ trợ tương tác liên quan đến con đường phản hồi.
Làm thế nào học máy có thể hỗ trợ một hệ thống có thể nhận thức và dự đoán nhiều về thế giới của nó thực sự truyền tải thông tin đó một cách rõ ràng và hiệu quả trở lại người sử dụng nó. Làm thế nào học máy có thể hỗ trợ điều đó? Tôi nghĩ đây là một chủ đề tuyệt vời, bởi vì nếu bạn có cả con đường phản hồi và con đường kiểm soát, cả hai con đường đều đang thích nghi và cả thiết bị được sử dụng bởi người và người đó đều đang xây dựng các mô hình của nhau. Bạn có thể làm một điều gì đó gần như kỳ diệu. Bạn có thể gần như truyền tải thông tin miễn phí. Nếu bạn có cả hai hệ thống đó thực sự được điều chỉnh tốt cho nhau, họ đã xây dựng một mô hình rất mạnh mẽ của nhau và họ có một sự thích nghi cả về con đường kiểm soát và con đường phản hồi, bạn có thể hình thành các quan hệ đối tác rất chặt chẽ giữa con người và máy móc có thể truyền tải một lượng lớn thông tin với rất ít nỗ lực và rất ít băng thông.
Và điều đó mở ra những lĩnh vực hoàn toàn mới về sự phối hợp giữa con người và máy móc, đặc biệt là trong lĩnh vực giả lập thần kinh. Tôi thực sự nghĩ rằng đây là một thời điểm rất kỳ diệu cho chúng ta để bắt đầu nghiên cứu lĩnh vực này.
Bạn có nghĩ rằng những điều này sẽ được in 3D trong tương lai hay bạn nghĩ rằng việc sản xuất sẽ tiến hành như thế nào?
Tôi không cảm thấy như mình là người tốt nhất để suy đoán về cách nó có thể xảy ra. Tôi có thể nói rằng, chúng ta đang thấy một sự tăng trưởng lớn trong các nhà cung cấp thương mại của các thiết bị giả lập thần kinh sử dụng sản xuất phụ gia, in 3D, và các hình thức sản xuất phụ gia khác để tạo ra các thiết bị của họ. Điều này cũng thực sự tuyệt vời khi thấy, rằng nó không chỉ là một nguyên mẫu sử dụng sản xuất phụ gia hoặc in 3D, mà in 3D đang trở thành một phần không thể thiếu của cách chúng ta cung cấp thiết bị cho các cá nhân và cách chúng ta tối ưu hóa các thiết bị đó cho chính xác những người đang sử dụng chúng.
Sản xuất phụ gia hoặc sản xuất tùy chỉnh, việc lắp đặt giả lập tùy chỉnh xảy ra trong các bệnh viện mọi lúc. Đây là một phần tự nhiên của việc cung cấp dịch vụ chăm sóc cho những người có sự khác biệt về chi và cần công nghệ hỗ trợ hoặc các công nghệ phục hồi khác. Tôi nghĩ chúng ta đang bắt đầu thấy rằng nhiều việc tùy chỉnh đó đang bắt đầu kết hợp vào việc sản xuất thiết bị, và không chỉ để lại cho các nhà cung cấp dịch vụ chăm sóc. Và đó cũng là một điều thực sự thú vị. Tôi nghĩ có một cơ hội tuyệt vời cho các thiết bị không chỉ trông giống như tay hoặc được sử dụng như tay, mà các thiết bị rất chính xác đáp ứng nhu cầu của người sử dụng chúng, cho phép họ thể hiện bản thân theo cách họ muốn thể hiện, và để họ sống cuộc sống họ muốn sống theo cách họ muốn sống, không chỉ theo cách chúng ta nghĩ một tay nên được sử dụng trong cuộc sống hàng ngày.
Bạn đã viết hơn 120 bài báo. Có một bài báo nào nổi bật với bạn mà chúng ta nên biết?
Có một bài báo gần đây được xuất bản trên tạp chí Neural Computing Applications, nhưng nó đại diện cho phần nổi của sự suy nghĩ mà chúng ta đã đưa ra trong hơn một thập kỷ nay, về các khuôn khổ cho cách con người và máy móc tương tác, đặc biệt là cách con người và thiết bị giả lập tương tác. Đó là ý tưởng về thủ đô giao tiếp.
Và bài báo này đưa ra quan điểm của chúng tôi về cách dự đoán được học và duy trì trong thời gian thực bởi một thiết bị giả lập, chẳng hạn như, người sử dụng có thể hình thành cơ bản là một nguồn lực, có thể hình thành một nguồn lực mà cả hai bên có thể dựa vào. Hãy nhớ, trước đó tôi đã nói, chúng ta có thể làm một điều gì đó thực sự tuyệt vời khi chúng ta có một con người và một máy móc đang xây dựng các mô hình của nhau, thích nghi trong thời gian thực dựa trên kinh nghiệm, và bắt đầu truyền tải thông tin trong một kênh hai chiều. Như một phần phụ, vì chúng ta sống trong một thế giới kỳ diệu nơi có các bản ghi và bạn có thể cắt những thứ ra khỏi nó.
Nó基本 là như魔法.
Đúng vậy. Nó nghe như魔法. Nếu chúng ta quay lại những người nghĩ như Ashby, W. Ross Ashby, vào những năm 1960 và cuốn sách “Introduction of Cybernetics” đã nói về cách chúng ta có thể khuếch đại trí tuệ con người. Và ông thực sự nói rằng nó đến từ việc khuếch đại khả năng của một người để chọn giữa một trong nhiều lựa chọn. Và điều này được thực hiện có thể bằng cách khuếch đại khả năng của một người để chọn giữa một trong nhiều lựa chọn. Và điều này được thực hiện có thể bằng cách có một hệ thống mà một người đang tương tác, chẳng hạn như một máy móc, nơi có một kênh giao tiếp mở giữa chúng. Vì vậy, nếu chúng ta có kênh giao tiếp đó mở, nếu nó là hai chiều, và nếu cả hai hệ thống đều xây dựng nguồn lực dưới dạng dự đoán và những thứ khác, thì bạn có thể bắt đầu thấy chúng thực sự phù hợp và trở thành hơn tổng của các bộ phận. Bạn có thể nhận được nhiều hơn so với những gì họ đang đưa vào.
Và tôi nghĩ đây là lý do tại sao tôi coi đây là một trong những bài báo thú vị nhất của chúng tôi, bởi vì nó thực sự đại diện cho một sự thay đổi trong suy nghĩ. Nó đại diện cho một sự thay đổi trong cách suy nghĩ về các thiết bị giả lập thần kinh như các hệ thống có khả năng hoạt động, các hệ thống mà chúng ta không chỉ mô tả khả năng hoạt động, mà còn dựa vào để có thể thích nghi với chúng. Nguồn lực giao tiếp mà cho phép chúng ta nhân lên khả năng tương tác với thế giới, cho phép mọi người sống cuộc sống họ muốn sống, không chỉ nghĩ về thiết bị giúp họ sống cuộc sống hàng ngày.
Các ứng dụng nào bạn sẽ thấy cho các giao diện máy móc não với những gì bạn vừa thảo luận?
Một trong những ứng dụng yêu thích của tôi là một công nghệ được gọi là chuyển mạch thích nghi. Chuyển mạch thích nghi dựa trên kiến thức rằng nhiều hệ thống chúng ta tương tác hàng ngày phụ thuộc vào chúng ta chuyển giữa nhiều chế độ hoặc chức năng. Cho dù tôi đang chuyển giữa các ứng dụng trên điện thoại của mình hoặc tôi đang cố gắng tìm ra cài đặt đúng trên máy khoan của mình hoặc cho dù tôi đang điều chỉnh các công cụ khác trong cuộc sống của mình, chúng ta chuyển giữa nhiều chế độ hoặc chức năng mọi lúc, nghĩ lại về Ashby, khả năng của chúng ta để chọn giữa nhiều lựa chọn. Vì vậy, trong chuyển mạch thích nghi, chúng ta sử dụng học tập sự khác biệt thời gian để cho phép một chi giả học được chức năng động cơ nào mà một người có thể muốn sử dụng và khi họ muốn sử dụng nó. Thực sự là một tiền đề rất đơn giản là, chỉ việc tôi với tay đến một cốc và đóng tay.
Thực sự, một hệ thống nên có thể xây dựng dự đoán thông qua kinh nghiệm rằng trong tình huống này, tôi có khả năng sẽ sử dụng chức năng mở và đóng tay. Tôi sẽ mở và đóng tay. Và sau đó, trong tương lai, trong các tình huống tương tự, để có thể dự đoán điều đó. Và khi tôi đang điều hướng trong đám mây các chế độ và chức năng, cho tôi nhiều hơn hoặc ít hơn những gì tôi muốn mà không cần phải tìm kiếm tất cả các lựa chọn đó. Và đây là một ví dụ rất đơn giản về việc xây dựng nguồn lực giao tiếp. Bạn có một hệ thống mà thực sự đang xây dựng dự đoán thông qua tương tác, những dự đoán về người đó, máy móc đó, mối quan hệ của họ trong tình huống đó tại thời điểm đó. Và nguồn lực chung đó cho phép hệ thống tái cấu hình giao diện kiểm soát của nó trên máy bay, để người đó nhận được những gì họ muốn và khi họ muốn. Và thực sự, trong một tình huống mà hệ thống rất chắc chắn về chức năng động cơ nào mà một người có thể muốn, nó thực sự có thể chọn chức năng đó cho họ khi họ đang đi vào.
Và điều thú vị là, người đó luôn có khả năng nói, “À, đây là những gì tôi thực sự muốn,” và chuyển sang một chức năng động cơ khác. Trong một cánh tay robot, điều đó có thể là các loại nắm tay khác nhau, cho dù đó là tạo hình nắm để抓 một tay nắm cửa, nhặt một chiếc chìa khóa hoặc bắt tay ai đó. Những điều đó là các chế độ chức năng khác nhau, các mẫu nắm khác nhau. Thực sự thú vị khi hệ thống có thể bắt đầu xây dựng sự đánh giá cao về những gì phù hợp trong tình huống nào.












