Штучний інтелект

Комп’ютер здатний ідентифікувати 200 видів птахів за одну фотографію

Published November 4, 2019

Updated April 27, 2026

Alex McFarland

Дослідники з університету Дюка використали машинне навчання, щоб навчити комп’ютер ідентифікувати до 200 різних видів птахів. Комп’ютеру потрібно лише одна фотографія, щоб завершити процес ідентифікації. Для людини часто потрібно роки спостереження за птахами, щоб бути能够 ідентифікувати різні види один від одного.

Дослідження було проведено під керівництвом студента аспірантури університету Дюка Чаофана Чена та студента бакалаврату Оскара Лі. У ньому також брали участь інші члени команди лабораторії прогнозного аналізу під керівництвом професора університету Дюка Синтії Рудін.

АІ показує свій розум

Хоча процес ідентифікації вражаючий, є більш важливий аспект розвитку. АІ能够 показати свій розум, що дозволяє навіть нез досвідченому спостерігачу за птахами зрозуміти процес.

Глибока нейронна мережа, або алгоритми, що базуються на роботі мозку, були навчені на 11 788 фотографіях. Фотографії включали 200 різних видів птахів, включаючи все, від качок до колібрі.

Команда дослідників не потребувала спеціально навчати мережу для ідентифікації дзьобів або пір’я крил. Натомість мережа能够 взяти фотографію птаха та ідентифікувати певні закономірності в зображенні. Потім вона能够 взяти ці закономірності та ідентифікувати попередні закономірності, які вона вже зустрічала в типових ознаках видів.

За словами команди, мережа створює серію теплових карт, які ідентифікують певні ознаки. Наприклад, вона能够 розрізнити звичайного повзика та повзика з капюшоном, а також різні ознаки, такі як маска на голові та жовтий живіт. Потім вона показує, що ці ознаки призвели до ідентифікації.

На відміну від інших систем

Нейронна мережа能够 ідентифікувати правильний вид до 84% часу. Це подібно до деяких з найкращих систем. Відмінність полягає в тому, що ці системи не пояснюють процес мислення, як це робить ця система.

За словами Рудін, найбільш революційний аспект цього проекту полягає в тому, що він забезпечує візуалізацію того, що глибокі нейронні мережі бачать, коли дивляться на зображення.

Ця технологія також зараз використовується на соціальних медіа-сайтах, щоб ідентифікувати підозрюваних злочинців у камерах спостереження, та допомогти автономним транспортним засобам ідентифікувати світлофори та пішоходів.

Програмне забезпечення глибокого навчання часто не потребує бути явно запрограмованим, щоб навчатися з даних, що не є випадком для традиційного програмного забезпечення. Однак процес не завжди зрозумілий або показаний, тому часто важко пояснити, як алгоритми “думають”, коли класифікують зображення.

У майбутньому

Рудін та інші зараз працюють над новими моделями глибокого навчання для АІ, рухаючи галузь вперед. Нові моделі能够 пояснити свій розум та процес ідентифікації. Це допомагає дослідникам бачити від початку до кінця, і це робить його легшим для ідентифікації причини помилки або проблеми.

Рудін та її команда будуть працювати над використанням алгоритму в медичній сфері. Він能够 ідентифікувати певні проблемні області в медичних зображеннях, таких як мамограми. Це допоможе медичним фахівцям виявити злоякісні пухлини, кальцифікації та інші ознаки раку молочної залози.

За словами Рудін, мережа імітує той спосіб, яким лікарі роблять діагноз.

“Це випадковий розум”, – сказала Рудін. “Ми сподіваємося, що зможемо краще пояснити лікарям або пацієнтам, чому їхнє зображення було класифіковано мережею як злоякісне або доброякісне.”

Команда представить доповідь, що включає їхнє дослідження, на Тридцять третій конференції з обробки нейронної інформації (NeurlIPS2019) у Ванкувері 12 грудня.

Дослідження також включає авторів Даніеля Тао та Аліну Барнер з університету Дюка та Джонатана Су в лабораторії Лінкольна Массачусетського технологічного інституту.

Alex McFarland

Алекс Макфарленд - журналіст та письменник з питань штучного інтелекту, який досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та виданнями з штучного інтелекту у світі.

Unite.AI

Комп’ютер здатний ідентифікувати 200 видів птахів за одну фотографію

АІ показує свій розум

На відміну від інших систем

У майбутньому

You may like