Kunstmatige intelligentie
Computer kan 200 soorten vogels identificeren vanuit één foto

Onderzoekers van de Duke University hebben machine learning gebruikt om een computer te trainen om tot 200 verschillende soorten vogels te identificeren. De computer heeft slechts één foto nodig om het identificatieproces te voltooien. Voor een mens zijn vaak jaren van vogels kijken nodig om verschillende soorten van elkaar te kunnen onderscheiden.
Het onderzoek werd geleid door Duke-computerscience Ph.D.-student Chaofan Chen, samen met undergraduate Oscar Li. Het werd ook gewerkt door andere teamleden van de Prediction Analysis Lab onder leiding van Duke-professor Cynthia Rudin.
A.I. Laat Zijn Denken Zien
Terwijl het identificatieproces indrukwekkend is, is er een belangrijker aspect van de ontwikkelingen. De A.I. kan zijn denken laten zien, waardoor zelfs een onervaren vogelaar het proces kan begrijpen.
Het deep neural network, of algoritmes die gebaseerd zijn op de werking van de hersenen, werden getraind met 11.788 foto’s. De foto’s omvatten 200 verschillende soorten vogels, van eenden tot kolibries.
Het team van onderzoekers hoefde het netwerk niet specifiek te trainen om snavels of vleugelveren te identificeren. In plaats daarvan kan het netwerk een foto van een vogel nemen en bepaalde patronen in het beeld identificeren. Het kan dan die patronen nemen en patronen identificeren die het eerder heeft aangetroffen in typische soortkenmerken.
Volgens het team creëert het netwerk vervolgens een reeks heatmaps die bepaalde kenmerken identificeren. Bijvoorbeeld, het kan het verschil zien tussen een gewone fitis en een kapfitis, samen met verschillende kenmerken zoals een gemaskerd hoofd en een gele buik. Het laat dan zien dat deze kenmerken hebben geleid tot de identificatie.
Anders Dan Andere Systemen
Het neurale netwerk kon de juiste soort identificeren tot 84% van de tijd. Dit is vergelijkbaar met sommige van de best presterende systemen. Het verschil is dat die systemen het denkproces niet uitleggen zoals dit.
Volgens Rudin is het meest revolutionaire aspect van dit project dat het visualisatie biedt voor wat diepe neurale netwerken zien wanneer ze naar een beeld kijken.
Deze technologie wordt ook momenteel gebruikt op sociale mediasites, om verdachte criminelen in bewakingscamera’s te identificeren, en om autonome voertuigen te helpen verkeerslichten en voetgangers te identificeren.
Deep learning-software heeft vaak geen expliciete programmering nodig om van data te leren, wat niet het geval is voor traditionele software. Echter, het proces is niet altijd duidelijk of wordt getoond, dus het is vaak moeilijk om uit te leggen hoe de algoritmes “denken” wanneer ze een beeld classificeren.
In De Toekomst
Rudin en anderen werken momenteel aan nieuwe deep learning-modellen voor A.I., waardoor het veld vooruit gaat. De nieuwe modellen kunnen hun redenering en identificatieproces uitleggen. Dit helpt de onderzoekers om van begin tot eind te zien, en het maakt het gemakkelijker om de reden achter een fout of probleem te identificeren.
Rudin en haar team zullen werken aan het gebruik van het algoritme in de medische sector. Het kan bepaalde probleemgebieden binnen medische beelden zoals mammogrammen identificeren. Dit zou medische professionals helpen om knobbels, calcificaties en andere tekenen van borstkanker te detecteren.
Volgens Rudin imiteert het netwerk de manier waarop artsen een diagnose stellen.
“Het is gebaseerd op casuïstiek”, zei Rudin. “We hopen dat we beter kunnen uitleggen aan artsen of patiënten waarom hun beeld door het netwerk is geclassificeerd als kwaadaardig of goedaardig.”
Het team zal een paper presenteren met hun onderzoek op de Thirty-third Conference on Neural Information Processing Systems (NeurlIPS2019) in Vancouver op 12 december.
De studie omvat ook auteurs Daniel Tao en Alina Barnerr van Duke en Jonathan Su bij MIT Lincoln Laboratory.












