Kunstmatige intelligentie
Onderzoekers creëren systeem om informatie te extraheren uit COVID-19-artikelen

Een groep onderzoekers aan de Universiteit van het Baskenland heeft een prototype ontwikkeld voor VIGICOVID, dat een automatisch informatiesysteem is voor het extraheren van informatie uit wetenschappelijke artikelen over COVID-19. Het systeem gebruikt natuurlijke taalvragen om antwoorden te krijgen over COVID-19.
Het project met VIGICOVID werd uitgevoerd door het HiTZ Centre van de UPV/EHU, de NLP & IR Group van de UNED en de Artificial Intelligence and Languages Technologies Unit van Elhuyar.
Het onderzoek werd gepubliceerd in het tijdschrift Knowledge-Based Systems.
Verandering van het informatiezoekeparadigma
Eneko Agirre is hoofd van het HiTZ Centre van de UPV/EHU.
“Het informatiezoekeparadigma verandert dankzij kunstmatige intelligentie,” zei Agirre. “Tot nu toe, wanneer je op internet informatie zocht, voerde je een vraag in en moest je het antwoord zoeken in de documenten die het systeem weergaf. Maar in overeenstemming met het nieuwe paradigma, worden systemen die het antwoord rechtstreeks geven zonder dat je het hele document hoeft te lezen, steeds meer gebruikelijk.”
Xabier Saralegi is een onderzoeker bij Elhuyar.
“De gebruiker vraagt geen informatie op met trefwoorden, maar stelt een vraag rechtstreeks.”
Het systeem gebruikt twee afzonderlijke stappen om antwoorden te zoeken.
“Ten eerste, haalt het documenten op die het antwoord op de gestelde vraag kunnen bevatten door een technologie te gebruiken die trefwoorden combineert met directe vragen. Daarom hebben we neurale architectuur onderzocht,” zei Dr. Saralegi.
Diepe neurale architectuur
Het team gebruikte een diepe neurale architectuur die werd gevoed met voorbeelden.
“Dat betekent dat zoekmodellen en vraag-antwoordmodellen worden getraind met behulp van diepe machine learning,” vervolgde hij.
De set met documenten wordt eerst geëxtraheerd voordat deze opnieuw wordt verwerkt door een vraag- en antwoordsysteem, waardoor specifieke antwoorden kunnen worden verkregen.
“We hebben de motor gebouwd die de vragen beantwoordt; wanneer de motor een vraag en een document krijgt, kan deze detecteren of het antwoord al dan niet in het document staat, en als het wel zo is, vertelt het ons exact waar het is,” zei Dr. Agirre.
Volgens de onderzoekers waren ze tevreden met de resultaten van hun werk.
“Van de technieken en evaluaties die we in onze experimenten hebben geanalyseerd, hebben we die genomen die het prototype de beste resultaten geven,” vervolgde Dr. Agirre. “We hebben een andere manier van zoeken ontwikkeld voor situaties waarin informatie dringend nodig is, en dit vergemakkelijkt het proces van informatiegebruik. Op onderzoeksgebied hebben we aangetoond dat de voorgestelde technologie werkt en dat het systeem goede resultaten oplevert.”
“Ons resultaat is een prototype van een basisonderzoeksproject. Het is geen commercieel product,” voegde Saralegi toe.
Met dat gezegd hebbende, kunnen dit soort prototypes in korte tijd worden gemodelleerd, wat betekent dat het misschien niet lang zal duren voordat er een commercieel product is.












