Здравоохранение

Определение опьянения с помощью машинного обучения анализа глаз

опубликованный Июль 7, 2021

Мартин Андерсон

Исследователи из Германии и Чили разработали новую систему машинного обучения, способную оценить, находится ли человек в состоянии алкогольного опьянения, на основе изображений его глаз в ближнем инфракрасном диапазоне.

Команда исследованиями направлена на разработку систем «пригодности к службе» в реальном времени, способных оценивать готовность человека к выполнению критически важных задач, таких как вождение или управление механизмами, и использует новый и обученный с помощью царапин детектор объектов, который может выделять компоненты глаза субъекта из одного изображения и оценивать их по базе данных, которая включает изображения глаз в состоянии алкогольного опьянения и в несостоянии алкогольного опьянения.

You Only Look Once (YOLO) выделяет глаза субъекта, после чего структура разделяет экземпляры и выполняет сегментацию, чтобы разбить изображение глаза на составные части. Источник: https://arxiv.org/pdf/2106.15828.pdf

Функция «Только посмотри один раз» (YOLO) выделяет глаза субъекта, после чего фреймворк разделяет экземпляры и выполняет сегментацию, чтобы разбить изображение глаза на составные части.. Источник: https://arxiv.org/pdf/2106.15828.pdf

Первоначально система захватывает и индивидуализирует изображение каждого глаза с помощью функции «Только один раз посмотреть» (YOLO) структура обнаружения объектов. После этого используются две оптимизированные сети для разбиения изображений глаз на семантические области – Criss Cross сеть внимания (CCNet), выпущенная в 2020 году Хуачжунским университетом науки и технологий, и Плотная сеть10 алгоритм сегментации, также разработанный несколькими исследователями новой статьи в Чили.

Семантический конвейер DenseNet10. Источник: https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6

Сегментация, полученная из изображений глаза в ближнем инфракрасном диапазоне. Источник: https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6

Эти два алгоритма используют только 122,514 210,732 и XNUMX XNUMX параметра соответственно — скромные затраты по сравнению с некоторыми из более крупных наборов функций в аналогичных моделях и нарушение общей тенденции к увеличению объемов данных в рамках машинного обучения.

База данных пьяных

Чтобы информировать систему машинного обучения, исследователи разработали оригинальную базу данных, включающую 266 человек в состоянии алкогольного опьянения и 765 человек в состоянии опьянения.

Образцы из полученной базы данных лиц в состоянии алкогольного опьянения и не в состоянии алкогольного опьянения.

Испытуемые должны были встать перед двумя оригинальными камерами Iritech, линейки Gemini/Venus, лицом к устройству и быть записанными трезвыми. После этого они выпили 200 мл алкоголя и были повторно захвачены с 15-минутными интервалами по мере повышения уровня алкоголя в их крови, вплоть до последнего сеанса через 60 минут после употребления алкоголя.

В результате было создано 21,309 XNUMX изображений, которые затем были аннотированы с помощью библиотеки Python. изображение.

Подготовка данных для реального мира

Несмотря на использование передовых инструментов, этот рабочий процесс не был в полной мере автоматизированным — ручная маркировка изображений глаз была описана исследователями как «очень трудоемкий и трудоемкий процесс», и заняла более года.

Данные были активно дополнены серией методов, разработанных для ухудшения и проверки системы, имитирующих возможные реальные условия, включая снежинки, пуассоновский шум (для имитации ухудшения качества изображения сенсора при слабом освещении), размытие, брызги и дождь. Кроме того, использование инфракрасной съемки устраняет необходимость в идеальных условиях освещения, которые невозможно гарантировать в экономичных и практичных условиях.

Эта изнурительная работа в конечном итоге окупилась за счет уровня точности захвата и сегментации глаз 98,60%.

Сегментация радужной оболочки методом наименьшего среднего квадрата.

Тестирование

Структура сегментации была протестирована на пяти платформах: Озирис, ДипВОГ, DenseNet10 (см. выше), CCNet (см. выше) и Гранд-Среднее. Во всех случаях анализ показал успешные результаты корреляции расширения зрачков с уровнем алкогольного опьянения, хотя гибридный подход с использованием DenseNet и CCNet оказался наиболее эффективным.

Исследователи ожидают, что их работа в конечном итоге может быть включена в стандартный NIR-датчик радужной оболочки глаза, и отмечают, что геркулесовы усилия по созданию базы данных для опьяненных глаз, вероятно, принесут пользу этому сектору биометрических исследований.

Тестирование потребительского и промышленного опьянения посредством оценки зрения

Новое исследование основано на ряде известных работ, включая основополагающую работу 2015 года, написанную исследователями из Бразилии и США, в которой был предложен систематический и рационализированный метод оценки степени опьянения по реакции зрачков. Авторы этой работы отметили, что алкоголь снижает эффективность работы мозга и ухудшает ночное зрение на 25% и время реакции на 30%, причём степень тяжести этого явления варьируется в зависимости от индивидуальной толерантности.

Источник: https://pixellab.group/publication/2015/pinheiro2015/pinheiro2015.pdf.

Основной проблемой распространения таких технологий является переносимость. Еще в 2003 году британская исследовательская компания Hampton Knight предложенный система оценки интоксикации с помощью анализа глаз, хотя в то время она стоила 10,000 XNUMX фунтов стерлингов.

Предварительный 2012 г. проведенное исследование из Нью-Дели и США также исследовали возможность использования систематических методов искусственного интеллекта для получения оценки интоксикации на основе изображений глаз, хотя и с меньшим успехом, чем текущее исследование. Это исследование также предоставило ценный набор данных (IITD Iris Under Alcohol Influence) для работы в этой области.

Тем не менее, недавние инновации в граничных вычислениях и оптимизированные аппаратные ресурсы мобильного машинного обучения открывают поле для гораздо большего количества мобильных приложений для предварительной проверки на опьянение, включая автомобильные датчики, которые потенциально могут добавить проверку радужной оболочки к текущим методам, которые представляют интерес. к системе обнаружения алкоголя у водителя для обеспечения безопасности (ДАДСС) разрабатываемая в США структура, которая на сегодняшний день опирается на датчики содержания алкоголя в коже и оценку содержания паров алкоголя в воздухе в автомобиле.

В 2020 докладе подсчитано, что внедрение технологий этого типа может спасти 11,000 XNUMX жизней в год только в США.

Похожие темы:Компьютерное зрение глаза здоровье безопасность

Мартин Андерсон

Автор статей о машинном обучении, специалист по синтезу человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.
Личный сайт: Мартинандерсон.ай
Контактное лицо: [электронная почта защищена]
Твиттер: @manders_ai