Connect with us

Определение опьянения с помощью анализа глаз с использованием машинного обучения

Здравоохранение

Определение опьянения с помощью анализа глаз с использованием машинного обучения

mm

Исследователи из Германии и Чили разработали новую основу машинного обучения, способную оценивать, находится ли человек в состоянии опьянения, на основе ближних инфракрасных изображений его глаз.

Исследование исследования направлено на разработку систем реального времени ‘годности для службы’, способных оценивать готовность человека выполнять критические задачи, такие как вождение или эксплуатация машин, и использует новую и обученную с нуля систему обнаружения объектов, которая может индивидуализировать компоненты глаза субъекта из одного изображения и оценить их по базе данных, включающей изображения глаз опьяненных и неопьяненных людей.

You Only Look Once (YOLO) индивидуализирует глаза субъекта, после чего основа разделяет экземпляры и выполняет сегментацию, чтобы разбить изображение глаза на его составные части. Source: https://arxiv.org/pdf/2106.15828.pdf

You Only Look Once (YOLO) индивидуализирует глаза субъекта, после чего основа разделяет экземпляры и выполняет сегментацию, чтобы разбить изображение глаза на его составные части. Source: https://arxiv.org/pdf/2106.15828.pdf

Первоначально система захватывает и индивидуализирует изображение каждого глаза с помощью основы обнаружения объектов You-Only-Look-Once (YOLO). После этого используются две оптимизированные сети для разбиения изображений глаз на семантические регионы – сеть внимания Criss Cross (CCNet), выпущенная в 2020 году Университетом науки и технологии Хуачжун, и алгоритм сегментации DenseNet10, также разработанный некоторыми исследователями новой статьи в Чили.

Семантический конвейер DenseNet10. Source: https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6

Сегментация, полученная из ближних инфракрасных изображений глаз. Source: https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6

Две алгоритма используют только 122 514 и 210 732 параметра соответственно – это скудная трата, по сравнению с некоторыми более крупными наборами функций в подобных моделях, и противоречит общей тенденции к более высоким объемам данных в рамках машинного обучения.

База данных пьяных

Для информирования основы машинного обучения исследователи разработали оригинальную базу данных, включающую 266 опьяненных субъектов и 765 трезвых субъектов.

Образцы из полученной базы данных опьяненных и неопьяненных субъектов.

Образцы из полученной базы данных опьяненных и неопьяненных субъектов.

Субъекты должны были стоять перед двумя камерами Iritech, серии Gemini/Venus, лицом к устройству, и быть записанными в трезвом состоянии. После этого они потребляли 200 мл алкоголя и были повторно захвачены через 15-минутные интервалы, пока их уровень алкоголя в крови не повысился, до последней сессии через 60 минут после потребления алкоголя.

Это произвело 21 309 изображений, которые затем были аннотированы с помощью библиотеки Python imgaug.

Подготовка данных для реального мира

Это не была высокоавтоматизированная рабочая программа, несмотря на использование передовых инструментов – ручная маркировка изображений глаз была описана исследователями как ‘очень требовательный и трудоемкий процесс’, и заняла более года.

Данные были агрессивно дополнены серией методов, предназначенных для ухудшения и проверки системы, имитирующих возможные реальные условия, включая снежинки, шум Пуассона (для имитации низкосветового деградации датчика), размытие, брызги и эффекты дождя. Кроме того, использование инфракрасного захвата устраняет необходимость в идеальных условиях освещения, которые не могут быть гарантированы в экономически и практически эффективных развертываниях.

Эта изнурительная работа в конечном итоге окупилась с уровнем точности 98,60% для захвата и сегментации глаз.

Сегментация радужной оболочки с помощью метода наименьших квадратов.

Сегментация радужной оболочки с помощью метода наименьших квадратов.

Тестирование

Фреймворк сегментации был протестирован на пяти платформах: Osiris, DeepVOG, DenseNet10 (см. выше), CCNet (см. выше) и Grand-Mean. Во всех случаях анализ показал успешные результаты для корреляции расширения зрачка с уровнем опьянения, хотя гибридный подход, использующий DenseNet и CCNet, оказался наиболее эффективным.

Исследователи预двидят, что их работа может быть включена в стандартный датчик радужной оболочки ближнего инфракрасного диапазона, и отмечают, что геркулесовое усилие по созданию базы данных глаз опьяненных людей, скорее всего, будет полезно для этого сектора биометрических исследований.

Потребительское и промышленное тестирование опьянения через оценку глаз

Новое исследование основано на некоторых заметных предыдущих работах, включая семинальную статью 2015 года исследователей из Бразилии и США, которая предложила систематический и рационализированный метод оценки опьянения из реакции зрачка.

Источник: https://pixellab.group/publication/2015/pinheiro2015/pinheiro2015.pdf

Источник: https://pixellab.group/publication/2015/pinheiro2015/pinheiro2015.pdf

Основная проблема для распространения таких технологий заключается в портативности. Already в 2003 году британская исследовательская компания Hampton Knight предложила систему для оценки опьянения через анализ глаз – хотя она стоила 10 000 фунтов стерлингов в то время.

Предварительное исследование 2012 года из Нью-Дели и США также исследовало возможность использования систематических методов ИИ для получения оценки опьянения из изображений глаз, хотя с меньшим успехом, чем текущее исследование. Это исследование также внесло ценный вклад в базу данных (IITD Iris Under Alcohol Influence) в этом поле.

Однако недавние инновации в области вычислений на краю и оптимизированных мобильных аппаратных ресурсов машинного обучения открывают поле для гораздо более мобильных приложений предварительных проверок на опьянение, включая датчики в автомобилях, которые потенциально могут добавить проверку радужной оболочки к текущим методам, представляющим интерес для системы обнаружения алкоголя в водителе (DADSS) в США – которая до сих пор полагалась на кожно-алкогольные датчики и оценку воздуха в автомобиле на наличие алкогольного пара.

Отчет 2020 года оценил, что принятие технологий этого типа может спасти 11 000 жизней в год только в США.

Писатель о машинном обучении, специалист в области синтеза человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.