Connect with us

Inteligență artificială

Înspre o știință automatizată a scrierii

mm

Dimineața aceasta, răsfoind secțiunile de știință computerizată de pe Arxiv, așa cum fac mai multe dimineți, am dat peste o lucrare recentă lucrare de la Universitatea Federală din Ceara, Brazilia, care oferă un nou cadru de procesare a limbajului natural pentru a automatiza rezumarea și extragerea datelor de bază din articolele științifice.

Deoarece acesta este mai mult sau mai puțin ceea ce fac eu în fiecare zi, lucrarea mi-a adus aminte de un comentariu de pe un thread de scriitori de pe Reddit la începutul acestui an – o prognoză în sensul că scrierea științifică va fi printre primele locuri de muncă jurnalistice care vor fi preluate de învățarea automată.

Să fiu clar – eu cred absolut că scriitorul științific automatizat vine, și că toate provocările pe care le prezint în acest articol sunt fie solubile acum, fie vor fi în curând. În cazul în care este posibil, ofer exemple pentru aceasta. În plus, nu mă adresez dacă scriitorii științifici AIs actuale sau din viitorul apropiat vor putea să scrie coerent; pe baza nivelului actual de interes în acest sector al PNL, presupun că această provocare va fi în cele din urmă soluționată.

Mai degrabă, mă întreb dacă un sistem de scriere științifică AI va putea identifica povești științifice relevante în conformitate cu (foarte variatele) rezultate dorite ale editorilor.

Nu cred că este iminent; pe baza răsfoirii titlurilor și / sau a copiilor a aproximativ 2000 de noi articole științifice despre învățarea automată în fiecare săptămână, am o abordare mai cinică asupra gradului în care articolele academice pot fi descompuse algoritmic, fie pentru scopuri de indexare academică, fie pentru jurnalism științific. Ca de obicei, este vorba despre oameni care se pun în cale.

Cerințe pentru scriitorul științific automatizat

Să considerăm provocarea de a automatiza raportarea științifică despre cercetarea academică recentă. Pentru a fi corect, ne vom limita în mare parte la categoriile CS ale domeniului Arxiv foarte popular și fără plată Arxiv de la Universitatea Cornell, care are cel puțin o serie de caracteristici sistematice și șablonizate care pot fi introduse într-un flux de extragere a datelor.

Să presupunem, de asemenea, că sarcina de față, așa cum este și lucrarea nouă din Brazilia, este de a parcurge titlurile, rezumatele, metadatele și (dacă se justifică) conținutul corpului de noi articole științifice în căutarea constantelor, parametrilor fiabili, token-urilor și informațiilor de domeniu reducibile și care pot fi puse în aplicare.

Acesta este, într-adevăr, principiul pe care se bazează noi cadre care câștigă teren în domeniile raportării cutremurelor, scrierii sportive, jurnalismului financiar și acoperirii sănătății, și un punct de plecare rezonabil pentru jurnalistul științific bazat pe IA.

… (restul conținutului)

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.