Штучний інтелект
PSBench в Університеті Міссурі: Новий рівень довіри для відкриття білків з використанням штучного інтелекту

Штучний інтелект вирішив одну з найбільш стійких загадок біології: як білки складаються у свої складні тривимірні форми. Але коли галузь перейшла від передбачення до застосування, нове питання стало більш нагальним, ніж будь-коли:
Коли ми можемо довіряти моделі?
Дослідники в Університеті Міссурі вважають, що вони зробили значний крок до відповіді на це питання. Університет оголосив про випуск PSBench, величезної нової бази даних, що містить 1,4 мільйона моделей структури білків з оцінками якості. Під керівництвом Цзяньліна ‘Джека’ Чена, відмінного професора біоінформатики, цей проєкт призначений не для генерації нових структур, а для їх оцінки.
Ця відмінність може виявитися критичною для майбутнього медицини, що базується на штучному інтелекті.
Нова пляма в білковому штучному інтелекті
Проблема складання білків залишилася нерозв’язаною понад пів століття. Все змінилося, коли AlphaFold від Google DeepMind продемонстрував майже експериментальну точність у передбаченні багатьох структур білків. Ця революція була настільки трансформативною, що передбачення білкової структури з використанням штучного інтелекту було визнано однією з частин Нобелівської премії з хімії 2024 року.
Після цього системи передбачення розширилися за межі окремих білків до комплексів, інтерфейсів та біомолекулярних взаємодій. База даних структур білків AlphaFold тепер містить сотні мільйонів передбачених структур, перетворюючи те, що раніше було дефіцитом, на щось майже надлишкове.
Але надлишок вводить нову проблему.
Модель передбаченої структури білка може виглядати переконливою, навіть елегантною. Однак тонкі помилки, особливо на поверхнях зв’язування чи гнучких регіонах, можуть стати різницею між життєздатною мішенню для ліків та дорогим тупиком. Внутрішні метрики довіри, такі як pLDDT та передбачена похибка, забезпечують корисну допомогу, але вони залишаються сигналами, згенерованими моделлю. Вони оцінюють невизначеність зсередини.
PSBench підходить до проблеми ззовні.
Що робить PSBench іншим
Натомість будівництва ще однієї передбачувальної системи, PSBench функціонує як великомасштабна платформа оцінки. База даних складається з 1,4 мільйона моделей структури білків, отриманих з спільних зусиль, таких як Критична оцінка передбачення структури білків (CASP), довгостроковий золотий стандарт для експериментів з моделювання білків. Ці моделі поєднуються з оцінками точності, які дозволяють дослідникам тренувати та тестувати незалежні системи штучного інтелекту, здатні оцінювати надійність структури.
По суті, PSBench дозволяє моделям штучного інтелекту оцінювати інші моделі штучного інтелекту.
Ця можливість стає дедалі важливішою, оскільки галузь переходить від питання «Чи можемо ми передбачити структуру?» до питання «Чи достатньо надійна ця структура, щоб керувати експериментами?»
Команда Чена має глибокі корені в цій еволюції. У 2012 році під час попереднього конкурсу CASP його група була однією з перших, хто продемонстрував, що глибоке навчання може суттєво покращити моделювання структури білків. Через понад десятиліття PSBench відображає наступну фазу цього шляху: уточнення, як передбачення оцінюються, а не генеруються.
Ця робота була представлена на NeurIPS 2025, підкреслюючи, як тісно дослідження машинного навчання та структурної біології тепер пов’язані.
AlphaFold у 2026 році: Від складання до взаємодій
Тим часом, ширша екосистема продовжує розвиватися. Останнє покоління моделей AlphaFold розширюється за межі окремих ланцюгів до моделювання взаємодій між білками, ДНК, РНК та малими молекулами. Бази даних виросли до безпрецедентного масштабу, а спільні внески прискорюють охоплення мікробних, вірусних та людських протеомів.
Когда ці інструменти дозрівають, дослідники все частіше розглядають передбачені структури як точки відліку для генерації гіпотез. Експериментальна верифікація все ще має велике значення, але штучний інтелект тепер визначає порядок того, що перевіряється першим.
Саме тому оцінка якості має таку велику вагу.
Якщо системи штучного інтелекту генерують більше структурних гіпотез, ніж лабораторії можуть перевірити, то можливість розрізняти ці гіпотези — точно та об’єктивно — стає фундаментальною інфраструктурою.
Вплив на відкриття ліків
Білки є функціональними двигунами біології. Їх тривимірні форми визначають, як вони взаємодіють, сигналізують та регулюють життєві процеси. Коли структури неправильно інтерпретуються, особливо у терапевтичних контекстах, наслідки можуть розгортатися через роки розробки.
Покращуючи навчання та оцінку систем оцінки якості моделей, PSBench може допомогти зменшити помилкову впевненість у помилкових передбаченнях. Більш надійна оцінка структури означає краще пріоритезування мішеней, більш ефективне використання лабораторних ресурсів та потенційно швидші шляхи до терапій для складних захворювань, таких як Альцгеймера та рак.
Важливо, що PSBench не замінює передбачувальні інструменти, такі як AlphaFold. Натомість він доповнює їх, додаючи рівень довіри до екосистеми, яка швидко розширюється в потужності та масштабі.
Ріст наукового рівня довіри
Штучний інтелект у біології вступив у нову фазу. Перший етап був про розв’язання передбачення. Другий етап був про масштабування доступу. Емерджентний третій етап — про верифікацію, оцінку та управління.
PSBench представляє цей зсув.
Когда системи штучного інтелекту стають центральними для біомедичної відкриття, можливість оцінювати їхні виходи з суворістю визначатиме, наскільки впевнено дослідники можуть будувати на них. У галузі, де точність на рівні ангстремів може впливати на рішення вартістю мільярдів доларів, довіра не є опціональною.
Якщо AlphaFold допоміг розблокувати структуру життя у масштабі, PSBench може допомогти забезпечити, що те, що ми розблокуємо, є досить міцним, щоб стояти на ньому.












