Phỏng vấn
Anton Dolgikh, Trưởng bộ phận AI, Chăm sóc sức khỏe và Khoa học đời sống tại DataArt – Loạt bài phỏng vấn

Anton Dolgikh lãnh đạo các dự án định hướng AI và ML trong lĩnh vực Chăm sóc sức khỏe và Khoa học đời sống tại Dữ liệuArt và điều hành các nhà phát triển giáo dục và đào tạo tập trung vào việc giải quyết các vấn đề kinh doanh bằng các phương pháp ML. Trước khi làm việc tại DataArt, Dolgikh làm việc tại Khoa Hệ thống Phức hợp tại Đại học Libre de Bruxelles, một trường đại học nghiên cứu tư nhân hàng đầu của Bỉ.
Điều gì ban đầu đã truyền cảm hứng cho bạn theo đuổi AI và khoa học đời sống như một nghề nghiệp?
Niềm đam mê tìm kiếm mối liên hệ giữa hiện tượng và sự kiện. Tôi luôn thích đọc. Tôi yêu sách. Ở trường đại học, tôi khám phá ra một nguồn thông tin mới – các bài báo. Ở một thời điểm nào đó, dường như việc có được một bức tranh hoàn chỉnh, kết tinh được sự thật đẹp đẽ từ một khối thông tin là điều gần như không thể. Và đây là AI. Tất nhiên, thống kê, học máy và khoa học tự nhiên với AI đứng đầu đều đóng vai trò xây dựng cầu nối giữa cơn khát kiến thức của bộ não con người và một thế giới nơi tất cả các quy luật đều được biết đến và không có hộp đen.
Bạn hiện đang giáo dục và đào tạo các nhà phát triển tập trung vào việc giải quyết các vấn đề kinh doanh bằng các phương pháp ML. Có lĩnh vực học máy cụ thể nào mà bạn tập trung vào nhiều hơn, chẳng hạn như học sâu không?
Đúng vậy, học sâu là một công cụ rất phổ biến và, thành thật mà nói, mạnh mẽ; chúng ta không thể thờ ơ với nó. Cá nhân tôi thích cách giải thích Bayesian của các thuật toán cổ điển, hoặc thậm chí là sự kết hợp giữa mạng thần kinh và cách tiếp cận Bayes - ví dụ: Bộ mã hóa tự động biến thể Bayesian. Nhưng tôi tin rằng điều quan trọng nhất để dạy những người mới học ML không phải là sử dụng máy móc ML như một chiếc hộp đen ma thuật một cách mù quáng, mà là nhận thức được các nguyên tắc cơ bản đằng sau mỗi và mọi phương pháp. Một kỹ năng cần phải có là khả năng giải thích các dự đoán thu được cho đối tượng doanh nghiệp.
Vào tháng 2019 năm XNUMX, bạn đã viết một bài báo có tên là 'Chúng ta đã sẵn sàng cho các bác sĩ X quang máy và những sai lầm của họ chưa?'. Trong bài báo, bạn đã nêu ra những ưu và nhược điểm của việc chấp nhận kết quả từ các bác sĩ X quang máy so với các bác sĩ X quang con người. Nếu bạn phải lựa chọn giữa một con người và một máy móc cung cấp cho bạn kết quả, bạn sẽ chọn cái nào và tại sao?
Tôi thích một bác sĩ X quang con người hơn. Không phải vì tôi có một số kiến thức đặc biệt mà AI rất dễ mắc lỗi và các quyết định về bản chất là sai lầm. Không, đó là vấn đề về sự đồng cảm và bản chất tâm lý. Tôi muốn hỗ trợ các bác sĩ nhân loại trong giai đoạn khó khăn này. Hơn nữa, tôi tin rằng trong tương lai gần nhất, chúng ta sẽ chỉ thấy AI tăng cường khả năng của con người.
Gần đây bạn đã viết một bài báo trắng có tên là 'Tác động của trí tuệ nhân tạo đến tuổi thọ.' Trong bài báo này, bạn đã tuyên bố rằng AI nên được xem như một công cụ để tìm kiếm tuổi thọ cao hơn. Một số phương pháp hứa hẹn hơn mà AI có thể áp dụng cho nhiệm vụ kéo dài tuổi thọ của con người là gì?
Ngày nay, công cụ mới của AI đang bắt đầu hoạt động trong các phòng thí nghiệm khoa học ngang bằng với các công cụ và phương pháp cổ điển. Bản thân thực tế này đã đầy hứa hẹn. AI ở đây để trợ giúp chứ không phải thay thế chúng ta trong cuộc đấu tranh đối phó với lượng dữ liệu khổng lồ tràn ngập không chỉ các phòng thí nghiệm mà thậm chí cả cuộc sống cá nhân của chúng ta.
Cũng được thảo luận trong cùng một bài báo trắng là tuyên bố của Giám đốc AI của Tổ chức nghiên cứu Biogerontology và Giám đốc điều hành của Insilico Medicine, Tiến sĩ Alex Zhavoronkov, rằng việc tăng tuổi thọ lên 150 năm không phải là một mục tiêu viển vông. Bạn có tin rằng một đứa trẻ sinh năm 2020 sẽ có thể sống đến 120, thậm chí 150 tuổi?
Tôi muốn tin. Là một nhà khoa học nhờ giáo dục và niềm tin, tôi phải đưa ra quyết định dựa trên thực tế, dựa trên sự hiểu biết về tiến trình của các phương pháp khoa học trong khu vực. Chúng ta đã có một bước nhảy vọt ấn tượng trong lĩnh vực di truyền học, công nghệ sinh học và y học nói chung, và điều này củng cố niềm tin của tôi. Và đừng quên rằng một phần quan trọng của sự thành công trong việc tăng tuổi thọ là môi trường lành mạnh và lối sống lành mạnh, vì vậy chúng ta phải nỗ lực vì điều này.
Cũng trong bài báo này, bạn đề cập đến khả năng tải lên tâm trí (thuyết siêu nhân). Bạn có tin rằng điều này cuối cùng có thể trở thành hiện thực không, và nó khiến bạn cảm thấy thế nào?
Tôi đã nghĩ rất nhiều về nó. Thành thật mà nói, nó làm cho tôi cảm thấy thất vọng. Tôi nghĩ rằng chúng ta liên kết tính cách với những gì chúng ta nhìn thấy trong gương và đối với tôi, thật khó để tách tính cách của tôi ra khỏi cơ thể. Tuy nhiên, điều này không có nghĩa là không thể. Và, vâng, tôi tin rằng việc tải lên tâm trí sớm hay muộn sẽ trở nên khả thi. Hậu quả khó lường trước hơn nhiều.
Bạn hiện là Trưởng bộ phận AI, Chăm sóc sức khỏe và Khoa học Đời sống tại DataArt. Một số dự án thú vị nhất mà DataArt hiện đang thực hiện là gì?
Chúng tôi có một dự án dành riêng cho việc phát triển thuốc mới. Nó truyền cảm hứng về cách các phương pháp tính toán đã phát triển để thúc đẩy và định hướng sự tiến bộ trong hóa dược và dược học. Chúng tôi cũng đã nỗ lực rất nhiều trong việc áp dụng AI để trích xuất thông tin từ các văn bản y tế như báo cáo thử nghiệm lâm sàng, bài báo y tế và diễn đàn chuyên ngành. Đó là công việc khó khăn, nhưng nó đưa chúng ta đến gần hơn với việc số hóa dịch vụ chăm sóc sức khỏe và tôi thấy điều này thật thú vị.
Là một người yêu sách cuồng nhiệt, tôi cũng cần hỏi những cuốn sách bạn giới thiệu?
- Giu-đê ngọc trai “Quan hệ nhân quả: Mô hình, Lập luận và Suy luận“. Tiêu đề là tự giải thích – cuốn sách nói về mối quan hệ nhân quả. Nếu (một ngày nào đó) chúng ta muốn có một AI thực sự, chúng ta phải dạy nó lý luận về nhân quả;
- Nếu bạn quan tâm đến các phương pháp thực tiễn và nguyên nhân thì tác phẩm cơ bản của Daphne Koller và Nir Friedman “Mô hình đồ họa xác suất: Nguyên tắc và kỹ thuật” sẽ là sự lựa chọn phù hợp;
- Chúng tôi mong đợi AI mạnh mẽ có thể hiểu được chúng tôi. Vì vậy, chúng ta phải dạy ngôn ngữ cho nó. Xử lý ngôn ngữ tự nhiên giải quyết vấn đề hiểu ngôn ngữ tự nhiên. Tôi có hai tiêu đề trong đầu đã giúp tôi rất nhiều:
- Yoav Goldberg, Các phương pháp mạng nơ-ron trong xử lý ngôn ngữ tự nhiên (Tổng hợp các bài giảng Công nghệ ngôn ngữ của con người), 2017
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze Giới thiệu về Truy xuất Thông tin, 2009
- Không chắc cuốn sách tiếp theo dành riêng cho AI, nhưng nó thể hiện cách tiếp cận phi tiêu chuẩn đối với số liệu thống kê và dự đoán sẽ hữu ích cho bất kỳ nhà nghiên cứu AI nào: Bertrand S. Clarke, Jennifer L. Clarke Thống kê dự đoán: Phân tích và suy luận ngoài các mô hình
- Và tôi sẽ kết thúc danh sách bằng một cuốn sách khoa học viễn tưởng: Stanislav Lem, Nhật ký ngôi sao
Có điều gì khác mà bạn muốn chia sẻ về DataArt không?
Dữ liệuArt là một ví dụ tuyệt vời về xu hướng gần đây hướng tới số hóa hầu hết mọi khía cạnh của cuộc sống và hoạt động. Xu hướng này làm tăng trách nhiệm trong việc phát triển phần mềm bởi vì ngày nay không chỉ có việc xây dựng một trang web cho một cửa hàng, chẳng hạn, trong trường hợp đó, một sai lầm của nhà phát triển sẽ gây ra hậu quả tối thiểu. Ngày nay, sai lầm của một nhà phát triển có thể trở thành một thảm họa quốc gia hoặc toàn thế giới nếu nó liên quan đến một chương trình kiểm soát hoạt động của một nhà máy hạt nhân chẳng hạn. Cách tiếp cận có trách nhiệm của DataArt đối với việc phát triển phần mềm theo nghĩa rộng giúp tôi tin tưởng vào những gì chúng tôi phát triển và tôi rất tự hào là một phần của công ty cũng như công việc mà chúng tôi đang làm.
Đối với một dự án kéo dài hàng giờ khác gần đây, năm ngoái DataArt đã tung ra một ứng dụng nguyên mẫu có tên là 'SkinCareAI', ứng dụng này sẽ phân tích hình ảnh da để phát hiện các dấu hiệu ban đầu của khối u ác tính. Với những tiến bộ mới nhất trong công nghệ máy học (ML), SkinCareAI được phát triển bởi chuyên gia DataArt ML, Andrey Sorokin cho thử thách Cộng tác hình ảnh da quốc tế (ISIC).
Để tìm hiểu thêm về một số dự án và nghiên cứu điển hình khác của chúng tôi, vui lòng truy cập DataArt's Khoa học sức khỏe và đời sống .