Штучний інтелект

Дослідники використовують алгоритми обробки природної мови для розуміння трансформації білків

Published October 11, 2020

Updated April 28, 2026

Daniel Nelson

Дослідники університету Меріленду недавно застосували техніки обробки природної мови та алгоритми машинного навчання, щоб отримати уявлення про те, як молекули білків переходять з однієї форми в іншу. Недавня стаття, опублікована в журналі Nature Communications, є першим випадком використання алгоритму штучного інтелекту для вивчення динаміки біомолекулярних систем щодо трансформації білків.

Молекули білків можуть мати різні форми, але механізми, які спонукають білок переходити з однієї форми в іншу, ще частково загадкові. Функція молекули білка визначається її формою, і краще розуміння механізмів, які впливають на форму/структуру білка, може дозволити вченим розробити цілеву терапію та визначити причини захворювань.

Біологічні молекули не є нерухомими, вони постійно рухаються в відповідь на події в їхньому середовищі. Екологічний тиск може змусити молекули переходити в різні форми, часто досить раптово. Молекула може раптово змінити свою форму, в процесі, який дуже схожий на розмотування пружини. Різні частини молекули розгортаються і згортаються, і дослідники вивчили проміжні стадії між різними молекулярними формами.

За даними Phys.org, Пратюш Тіварі був старшим автором статті і є асистентом професора хімічного та біохімічного факультету та Інституту фізичної науки і технологій Меріленду. За словами Тіварі, обробку природної мови можна використовувати для моделювання того, як молекули трансформуються та адаптуються. Тіварі зазначає, що молекули мають певну “мову”, яку вони говорять, а рухи, які роблять молекули, можуть бути перекладені на абстрактну мову. Коли цей процес відображення руху молекул на мовні закономірності здійснюється, техніки обробки природної мови та алгоритми штучного інтелекту можна використовувати для “створення біологічно правдивих історій з отриманих абстрактних слів”.

Коли молекула переходить з однієї форми в іншу форму, перехід відбувається дуже швидко. Перехід може тривати лише трільйонну частину секунди. Швидкість переходу робить його важким для вчених визначити, які параметри впливають на розгортання білка за допомогою методів, таких як спектроскопія або навіть потужні мікроскопи. Для визначення тих параметрів, які впливають на розгортання білків, Тіварі та інші члени дослідницької групи створили фізичні моделі, які симулювали білки. Булі використані складні статистичні моделі для створення симуляцій білків, які імітують форму, траєкторію та рух молекул. Моделі були потім передані алгоритму машинного навчання на основі методів обробки природної мови.

Моделі обробки природної мови, які використовувалися для навчання системи машинного навчання, були дуже схожі на алгоритми, які використовуються в системах передбачуваного тексту Gmail. Симульовані білки були оброблені як мова, де рухи молекул перекладалися на “букви”. Букви потім з’єднувалися в слова та речення. Алгоритми машинного навчання могли вивчити граматичні та синтаксичні правила білкової структури, визначаючи, які форми/рухи слідують за іншими формами/рухами. Алгоритми могли потім бути використані для передбачення того, як певні білки розгортаються та які форми вони приймають.

Дослідники використали довготривалу короткочасну пам’ять (LSTM) мережу для аналізу білкових речень. Дослідницька група також відстежувала математику, на якій була заснована мережа, моніторячи параметри, коли мережа вивчала динаміку молекулярної трансформації. За результатами дослідження, мережа використовувала логіку, схожу на статичний фізичний концепт, відомий як шляхова ентропія. Якщо це відкриття підтвердиться, воно потенційно може привести до покращення мереж LSTM. Тіварі пояснив, що відкриття знімає частину “чорної скриньки” LSTM, дозволяючи дослідникам краще зрозуміти, які параметри можна налаштувати для оптимальної продуктивності.

Як тестовий випадок для свого алгоритму, дослідники проаналізували біомолекулу під назвою рибосвітч. Рибосвітч вже був проаналізований за допомогою спектроскопії, і коли рибосвітч був проаналізований за допомогою системи машинного навчання, передбачені форми рибосвітчу збігалися з тими, які були відкриті спектроскопією.

Тіварі сподівається, що їхні відкриття дозволять дослідникам розробити цілеву терапію з меншою кількістю побічних ефектів. Як пояснив Тіварі через Phys.org:

“Ви хочете мати потужні ліки, які дуже сильно зв’язуються, але тільки з тим, до чого ви хочете, щоб вони зв’язувалися. Ми можемо досягти цього, якщо зможемо зрозуміти різні форми, які може приймати дана біомолекула, оскільки ми можемо створити ліки, які зв’язуються тільки з однією з цих конкретних форм у відповідний час і тільки протягом часу, який ми хочемо.”

Daniel Nelson

Блогер і програміст з спеціалізацією у темах Machine Learning і Deep Learning. Даніель сподівається допомогти іншим використовувати силу штучного інтелекту для соціальної добробути.

Unite.AI

Дослідники використовують алгоритми обробки природної мови для розуміння трансформації білків

You may like