Искусственный интеллект

Компьютер способен идентифицировать 200 видов птиц по одной фотографии

Published November 4, 2019

Updated April 27, 2026

Alex McFarland

Исследователи из Университета Дьюка использовали машинное обучение, чтобы научить компьютер идентифицировать до 200 различных видов птиц. Компьютеру требуется только одна фотография, чтобы завершить процесс идентификации. Для человека часто требуется годы наблюдения за птицами, чтобы быть в состоянии идентифицировать разные виды друг от друга.

Исследование было проведено под руководством аспиранта кафедры компьютерных наук Университета Дьюка Чаофана Чена, а также студента-старшеклассника Оскара Ли. В работе также участвовали другие члены команды лаборатории прогностического анализа под руководством профессора Университета Дьюка Синтии Рудин.

ИИ, демонстрирующий свою логику

Хотя процесс идентификации впечатляет, есть более важный аспект разработок. ИИ может показать свою логику, что позволяет даже непрофессиональному наблюдателю за птицами понять процесс.

Глубокая нейронная сеть, или алгоритмы, основанные на работе мозга, были обучены на 11 788 фотографиях. Фотографии включали 200 различных видов птиц, включая все, от уток до колибри.

Команда исследователей не должна была специально обучать сеть идентифицировать клювы или перья крыльев. Вместо этого сеть может взять фотографию птицы и определить определенные закономерности в изображении. Затем она может взять эти закономерности и определить предыдущие закономерности, которые она уже встретила в типичных характеристиках видов.

По словам команды, сеть затем создает серию тепловых карт, которые определяют определенные характеристики. Например, она может различать обычную славку и славку в капюшоне, а также различные особенности, такие как маскированный головной убор и желтый живот. Затем она показывает, что именно эти особенности привели к идентификации.

В отличие от других систем

Нейронная сеть смогла идентифицировать правильный вид до 84% времени. Это похоже на некоторые из лучших систем. Разница в том, что эти системы не объясняют процесс мышления, как это делает данная система.

По словам Рудин, наиболее революционный аспект этого проекта заключается в том, что он обеспечивает визуализацию того, что глубокие нейронные сети видят, когда они смотрят на изображение.

Эта технология в настоящее время также используется на сайтах социальных сетей для идентификации подозреваемых в преступлениях на камерах видеонаблюдения и помощи автономным транспортным средствам в идентификации светофоров и пешеходов.

Программное обеспечение глубокого обучения часто не требует явной программирования, чтобы учиться на данных, что не является случаем для традиционного программного обеспечения. Однако процесс не всегда ясен или показан, поэтому часто бывает трудно объяснить, как алгоритмы “думают”, когда классифицируют изображение.

В будущем

Рудин и другие в настоящее время работают над новыми моделями глубокого обучения для ИИ, продвигая эту область вперед. Новые модели могут объяснить свою логику и процесс идентификации. Это помогает исследователям видеть все от начала до конца, и это делает проще выявление причины ошибки или проблемы.

Рудин и ее команда будут работать над использованием алгоритма в медицинской области. Он может идентифицировать определенные проблемные области в медицинских изображениях, таких как маммограммы. Это поможет медицинским специалистам обнаружить уплотнения, кальцификации и другие признаки рака груди.

По словам Рудин, сеть имитирует способ, которым врачи ставят диагноз.

“Это основано на случае”, – сказала Рудин. “Мы надеемся, что сможем лучше объяснить врачам или пациентам, почему их изображение было классифицировано сетью как злокачественное или доброкачественное”.

Команда представит статью, включая их исследования, на Тридцать третьей конференции по обработке нейронной информации (NeurlIPS2019) в Ванкувере 12 декабря.

Исследование также включает авторов Даниэля Тао и Алину Барнер из Университета Дьюка и Джонатана Су из лаборатории Линкольна Массачусетского технологического института.

Alex McFarland

Алекс Макфарленд - журналист и писатель в области искусственного интеллекта, исследующий последние разработки в этой области. Он сотрудничал с многочисленными стартапами и изданиями в области искусственного интеллекта во всем мире.

Unite.AI

Компьютер способен идентифицировать 200 видов птиц по одной фотографии

ИИ, демонстрирующий свою логику

В отличие от других систем

В будущем

You may like