Connect with us

Jak OpenScholar przejmuje kontrolę nad przeglądami literatury napędzanymi przez sztuczną inteligencję

Sztuczna inteligencja

Jak OpenScholar przejmuje kontrolę nad przeglądami literatury napędzanymi przez sztuczną inteligencję

mm

W coraz szybciej rozwijającym się świecie nauki i innowacji, pozostawanie na bieżąco z najnowszymi badaniami może wydawać się przegraną walką. Z milionami nowych prac akademickich publikowanych każdego roku, badacze, analitycy i decydenci mają trudności z nadążaniem za tempem. Jednak jeden uporczywy problem stoi na przeszkodzie w skalowaniu tego procesu za pomocą sztucznej inteligencji: hallucynacje cytowań. Dopóki teraz.

OpenScholar, nowe narzędzie open-source opracowane przez badaczy z University of Washington i Allen Institute for AI, zmienia zasady przeglądów literatury naukowej. W przeciwieństwie do typowych dużych modeli językowych (LLM), które często fałszują odniesienia lub błędnie przypisują twierdzenia, OpenScholar opiera swoje odpowiedzi na rzeczywistych pracach akademickich – wraz z dokładnymi cytowaniami.

I nie jest to tylko niszowy projekt. W niedawnych ocenach odpowiedzi OpenScholar były konsekwentnie oceniane jako bardziej faktualnie dokładne niż te z niektórych z najpotężniejszych modeli komercyjnych na rynku. Czasami nawet przewyższając ludzi.

Inteligencka sposób czytania literatury

Podczas gdy wiele narzędzi AI excels w brzmieniu płynnym i pewnym, często wpadają w dobrze znany pułapkę: hallucynacje – generowanie fałszywych informacji lub cytowań do badań, które nie istnieją. Ten problem stał się poważną wadą w naukowych i profesjonalnych środowiskach, gdzie dokładność jest najważniejsza. OpenScholar rozwiązuje ten problem bezpośrednio, łącząc kompaktowy model języka z kuratoryjną biblioteką 45 milionów prac naukowych o otwartym dostępie. Każda odpowiedź, którą generuje, opiera się na weryfikowalnych źródłach z tej bazy danych, eliminując ryzyko sfałszowanych odniesień.

Kluczem jest to, jak wyszukuje. Zbudowany na ramach retrieval augmented generation (RAG), OpenScholar najpierw wyszukuje odpowiednie prace z jego zindeksowanej bazy danych, gdy użytkownik zadaje pytanie. Następnie klasyfikuje te źródła według użyteczności, a następnie generuje odpowiedź opartą na wybranym materiale – wraz z prawdziwymi cytowaniami. Wbudowany mechanizm sprzężenia zwrotnego pozwala modelowi udoskonalić swoją początkową odpowiedź, poprawiając zarówno dokładność, jak i wyrazistość.

To oparcie się na dowodach oznacza, że użytkownicy nie tylko otrzymują płynną odpowiedź – otrzymują również weryfikowalną odpowiedź.

Otwarty, dostępny i zaskakująco potężny

To, co naprawdę wyróżnia OpenScholar, to jego otwarta natura. Jest bezpłatny w użyciu, może być uruchomiony lokalnie i jest zaprojektowany do integracji lub modyfikacji przez badaczy i deweloperów. W przeciwieństwie do wielu platform komercyjnych, nie ma opłat subskrypcyjnych ani zablokowanych funkcji. Dla instytucji lub zespołów z ograniczeniami budżetowymi jest to zmiana gry.

Pomimo uruchomienia na mniejszym modelu języka, OpenScholar okazał się bardzo konkurencyjny. W testach porównawczych, porównujących jego odpowiedzi z odpowiedziami z dużych, własnościowych modeli, eksperci często preferowali odpowiedzi OpenScholar. W rzeczywistości, gdy przetestowano go w porównaniu z odpowiedziami napisanymi przez ludzkich badaczy, OpenScholar wytrzymał – i w niektórych przypadkach recenzenci uznali jego odpowiedzi za bardziej kompletnie i lepiej udokumentowane.

Ten wynik jest jeszcze bardziej imponujący, biorąc pod uwagę różnicę w kosztach. OpenScholar może dostarczyć wysokiej jakości wsparcie w przeglądzie literatury przy ułamku kosztów korzystania z komercyjnych LLM z dodatkowymi narzędziami badawczymi.

Ograniczenia za kurtyną

Jak każde narzędzie AI, OpenScholar nie jest pozbawiony wad. Ponieważ opiera się wyłącznie na bazach danych o otwartym dostępie, nie może uzyskać dostępu do czasopism zaporowych lub treści opartej na subskrypcji – przeszkodę w dziedzinach, w których wiele badań nie jest swobodnie dostępnych. System ten również nie posiada nuansów, aby zawsze wybrać najbardziej wpływowe lub reprezentatywne prace, czasami ujawniając badania, które mogą być tylko przypadkowo istotne.

Inną zastrzeżeniem jest to, że OpenScholar nie ocenia jakości badań, które cytuje. Traktuje wszystkie prace o otwartym dostępie równie, bez rozróżniania między pracami przeglądanymi przez peerów a wstępnymi wydrukami, które mogą się różnić pod względem rygoru. Na razie ta odpowiedzialność nadal spoczywa na użytkowniku.

Wgląd w przyszłość

Pomimo tych ograniczeń, OpenScholar reprezentuje znaczący krok naprzód w integracji sztucznej inteligencji w procesie naukowym. Poprzez priorytetowanie przejrzystości, przystępności i wierności cytowań, oferuje plan dla narzędzi AI, które wspomagają – a nie podważają – rygor naukowy.

Zespół za OpenScholar planuje już następne kroki, w tym bardziej elastyczne wersje narzędzia, które mogą korzystać z własnych bibliotek subskrypcyjnych użytkownika lub plików lokalnych. Są również plany wprowadzenia głębszych możliwości rozumowania, umożliwiających AI wykonywanie wieloetapowych wyszukiwań lub syntezę szerszych narracji w pracach.

Na razie OpenScholar otworzył drzwi do bardziej odpowiedzialnej i dostępnej formy badań wspomaganych przez AI. I w świecie, który tonie w danych, ale desperacko potrzebuje klarowności, to nie jest małe zwycięstwo.

Antoine jest wizjonerskim liderem i współzałożycielem Unite.AI, z niezachwianą pasją do kształtowania i promowania przyszłości sztucznej inteligencji i robotyki. Jako serialowy przedsiębiorca, uważa, że sztuczna inteligencja będzie tak samo przełomowa dla społeczeństwa, jak elektryczność, i często zachwycany jest potencjałem technologie przełomowych i AGI. Jako futurysta, poświęca się badaniu, jak te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platformy skupiającej się na inwestowaniu w najnowocześniejsze technologie, które przeobrażają przyszłość i zmieniają całe sektory.