Zdrowie
Określanie zatrucia za pomocą analizy oczu opartej na uczeniu maszynowym

Naukowcy z Niemiec i Chile opracowali nowe ramy uczenia maszynowego, które są w stanie ocenić, czy dana osoba jest pod wpływem alkoholu, na podstawie obrazów jej oczu wykonanych w bliskiej podczerwieni.
naukowe ma na celu opracowanie systemów czasu rzeczywistego umożliwiających ocenę gotowości danej osoby do wykonywania kluczowych zadań, takich jak prowadzenie pojazdów lub obsługiwanie maszyn, i wykorzystuje nowatorski, wyszkolony przez zarysowanie detektor obiektów, który może zindywidualizować elementy oka z pojedynczego obrazu i porównaj je z bazą danych zawierającą obrazy oczu osób nietrzeźwych i nietrzeźwych.

You Only Look Once (YOLO) indywidualizuje oczy obiektu, po czym struktura oddziela instancje i przeprowadza segmentację, aby rozbić obraz oka na części składowe. Źródło: https://arxiv.org/pdf/2106.15828.pdf
Początkowo system przechwytuje i indywidualizuje obraz każdego oka za pomocą funkcji Ty-Tylko-Patrz-Raz (YOLO) struktura wykrywania obiektów. Następnie wykorzystywane są dwie zoptymalizowane sieci do podziału obrazów oka na obszary semantyczne – tzw Criss Krzyż sieć uwagi (CCNet) opublikowana w 2020 r. przez Uniwersytet Naukowo-Technologiczny w Huazhong oraz GęstaSieć10 algorytm segmentacji, również opracowany przez kilku badaczy zajmujących się publikacją w Chile.

Segmentacja uzyskana z obrazów oka w bliskiej podczerwieni. Źródło: https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6
Obydwa algorytmy wykorzystują odpowiednio tylko 122,514 210,732 i XNUMX XNUMX parametrów, co stanowi niewielki wydatek w porównaniu z niektórymi większymi zestawami funkcji w podobnych modelach i przełamuje ogólną tendencję w kierunku większych ilości danych w ramach ML.
Baza danych pijaków
Aby wykorzystać ramy uczenia maszynowego, badacze opracowali oryginalną bazę danych zawierającą 266 osób nietrzeźwych i 765 trzeźwych.

Próbki z uzyskanej bazy danych osób nietrzeźwych i nietrzeźwych.
Badani musieli stanąć przed dwiema kamerami Iritech firmy Gemini/Venus, stanąć twarzą w twarz z urządzeniem i zostać nagrani na trzeźwo. Następnie wypili 200 ml alkoholu i byli ponownie przechwytywani w 15-minutowych odstępach, gdy ich poziom alkoholu we krwi wzrastał, aż do ostatniej sesji po 60 minutach od spożycia alkoholu.
W rezultacie powstało 21,309 XNUMX obrazów, które następnie opatrzono adnotacjami przy użyciu biblioteki Python obrazek.
Przygotowanie danych dla świata rzeczywistego
Nie był to proces wysoce zautomatyzowany, pomimo zastosowanych zaawansowanych narzędzi – ręczne etykietowanie obrazów oczu zostało przez badaczy opisane jako „bardzo wymagający i czasochłonny proces” i trwało ponad rok.
Dane zostały intensywnie wzbogacone za pomocą szeregu metod mających na celu degradację i wyzwanie dla systemu, odwzorowując możliwe warunki rzeczywiste, w tym płatki śniegu, szum Poissona (w celu symulacji degradacji czujnika przy słabym świetle), rozmycie, rozpryski i efekty deszczu. Poza tym wykorzystanie przechwytywania podczerwieni eliminuje potrzebę idealnych warunków oświetleniowych, których nie można zagwarantować w ekonomicznych i praktycznych zastosowaniach.
Ta wyczerpująca praca ostatecznie opłaciła się, zapewniając poziom dokładności przechwytywania wzroku i segmentacji wynoszący 98,60%.
Testowanie
Struktura segmentacji została przetestowana na pięciu platformach: Ozyrys, Głębokie VOG, DenseNet10 (patrz wyżej), CCNet (patrz wyżej) oraz Wielka średnia. We wszystkich przypadkach analiza wykazała pomyślne wyniki w zakresie korelacji rozszerzenia źrenic z poziomem upojenia alkoholowego, chociaż podejście hybrydowe z wykorzystaniem DenseNet i CCNet okazało się najskuteczniejsze.
Naukowcy spodziewają się, że ich prace będą mogły zostać ostatecznie wykorzystane w standardowym czujniku tęczówki NIR i zauważają, że Herkulesowy wysiłek polegający na stworzeniu bazy danych o oczach osób nietrzeźwych prawdopodobnie przyniesie korzyści temu sektorowi badań biometrycznych.
Testy zatrucia konsumenckiego i przemysłowego poprzez ocenę wzroku
Nowe badanie opiera się na znaczącej wcześniejszej literaturze, w tym na przełomowym artykule badaczy z Brazylii i USA z 2015 roku, w którym zaproponowano systematyczną i zracjonalizowaną metodę oceny zatrucia na podstawie reakcji źrenic. Naukowcy na potrzeby tego artykułu zaobserwowali, że alkohol zmniejsza wydajność mózgu i pogarsza widzenie w nocy o 25%, a czas reakcji o 30%, przy czym stopień nasilenia zależy od indywidualnego poziomu tolerancji.

Źródło: https://pixellab.group/publication/2015/pinheiro2015/pinheiro2015.pdf
Podstawowym problemem rozpowszechniania takich technologii jest przenośność. Już w 2003 roku brytyjska firma badawcza Hampton Knight oferowany system oceny zatrucia na podstawie analizy wzroku – choć wówczas kosztował 10,000 XNUMX funtów szterlingów.
Wstępnie 2012r „The Puzzle of Monogamous Marriage” z New Delhi i USA również zbadali możliwość stosowania systematycznych technik sztucznej inteligencji w celu uzyskania oceny stanu odurzenia na podstawie obrazów ocznych, choć z mniejszym sukcesem niż obecne badania. Badanie to wniosło także cenny zbiór danych (IITD Iris Under Alcohol Influence) do zbioru prac w tej dziedzinie.
Jednakże najnowsze innowacje w dziedzinie obliczeń brzegowych i zoptymalizowane zasoby sprzętowe do mobilnego uczenia maszynowego otwierają pole dla znacznie bardziej mobilnych zastosowań kontroli stanu nietrzeźwości przed rozpoczęciem aktywności, w tym czujników samochodowych, które mogłyby potencjalnie dodać kontrolę tęczówki do obecnie interesujących metod. do systemu wykrywania alkoholu kierowcy ze względów bezpieczeństwa (DADS) opracowywane w USA ramy, które dotychczas opierały się na czujnikach obecności alkoholu w skórze i ocenie powietrza w pojazdach pod kątem oparów alkoholu.
2020 raport szacuje się, że przyjęcie technologii tego typu mogłoby w samych Stanach Zjednoczonych uratować życie 11,000 XNUMX osób rocznie.