Facebooktwitterrssyoutube
A
A

Ústřední knihovna Univerzity Karlovy

AI-asistované nástroje pro vyhledávání (v) odborných publikací(ch)

Začátkem roku jsme si představili volně dostupné pomocníky a užitečné služby, které pomáhají vyhledávat odbornou literaturu nebo s ní efektivně pracovat. Tentokrát se zaměříme na volně dostupné nástroje, které ke své práci využívají umělou inteligenci (AI). 

S dramaticky rostoucím počtem dostupných odborných periodik, článků a publikací si musí člověk dávat pozor nejen na to jak publikovat, kde nepublikovat a kam (ne)jezdit na konference, ale už i jen na to, aby se pod záplavou obsahu neztratil. Jednu cestu, jak se v akademickém oceánu neutopit, nabízí AI-asistované nástroje, z nichž si několik níže představíme. 


CoCites

CoCites je nástroj, který používá co-citací (=kocitace, pararelní citace -> frekvence, s jakou jsou dva články citovány společně v referenčních seznamech jiných článků) k vyhledání všech dostupných relevantních článků pouze pomocí klíčových slov, bez nutnosti sestavovat komplexní vyhledávací dotaz. [1]  

Pomocí toho nástroje můžete po přihlášení vyhledávat články, které citují vámi dotazovaný článek, a extrahovat všechny tituly z jejich seznamů citací/referencí. CoCites spočítá, jak často se každý titul objevuje ve všech referenčních seznamech, a řadí je v sestupném pořadí. Nástroj tedy najde články, které jsou často citovány společně s dotazovaným článkem, což ho činí ideálním pro vyhledávání podkladů pro:  

  • Projekty, jejichž cílem je najít podobné články: scientific reviews, včetně systematických hodnocení, meta-analýz a rapid reviews [2] 
  • Nalezení nejznámějších nebo klíčových článků o specializovaných tématech: výsledky vyhledávání CoCites jsou uvedeny s počtem citací článků.  

Nástroj je užitečný zejména pro výzkum na témata, která jsou mimo uživatelovu odbornost, nebo pro novináře, kteří hledají odborníky na specializovaná témata. 

CoCites je dostupný jako rozšíření do prohlížečů Google Chrome a Mozilla Firefox, po jehož instalaci se objeví jako prokliknutelné tlačítko v rozhraní databáze PubMed. Pokud je tlačítko šedé, znamená to, že daný článek není indexovaný v citační databázi. Pokud je modré, článek byl nalezen a můžete analyzovat související citované články.

Nástroj nedávno přešel z betaverze a nabízí nyní i další funkcionality, jako např.: 

  • Kocitační vyhledávání pomocí více článků  
  • Vyhledávání nedávno publikovaných článků pomocí citačního vyhledávání 
  • Filtrovat výsledky pomocí podobnosti 
  • Ukládat výsledky vyhledávání pro opětovné využití a úpravy 

CovidScholar

Jedním z nejnovějších AI asistovaných nástrojů je CovidScholar, který vznikl z náhlé potřeby prohledávat velké množství článků a nalézt ty, týkající se právě Covidu-19. Nástroj využívá zpracování přirozeného jazyka, aby které zachytil nejen samotné klíčové slovo Covid, ale i drobnosti, jako jsou jen podobné léky nebo výzkumné metodiky, které můžou vést k relevantnímu výzkumu. [4]

CovidScholar umožňuje výsledky vyhledávání přehledně filtrovat dle různých faset a flitrů. 


Dimensions

Dimensions je volně dostupná platforma, která mění způsob, jakým je výzkum objevován, zpřístupňován a vyhodnocován. Databáze nabízí jednu z nejrozsáhlejších sbírek propojených dat na jedné platformě – v počtu záznamů znatelně předčí např. stálice Scopus a WoS, které čerpají data převážně z Crossref. [5] Na platformě lze nalézt vše od grantů, publikací, datových souborů a klinických zkoušek, až po patenty, koncepční a politické dokumenty. Protože Dimensions mapuje celý životní cyklus výzkumu, je možné sledovat výzkum komplexně — od financování přes publikovaný výstup až po jeho dopad. Publikační data sbírá nástroj ze služeb Crossref a Unpwaywall. Údaje o grantech pochází přímo od poskytovatelů financí na vědu a výzkum. [6] 

Vyhledané výsledky lze filtrovat dle roku vydání, autorů, jestli jsou publikovány v open access, atd. Nalezené články lze sdílet na sociálních sítích, exportovat data pro bibliometrické mapování ve VOSviewer nebo CiteSpace a taktéž data pro citační manažery ve formátech BibTeX a RIS. 

Rozhraní integruje altmetriky, ale nabízí i vlastní indikátory, jako Dimensions citation Badge, FCR (field citation ratio) a RCR (relative citation ratio).

Dimensions nabízí také API rozhraní v doménově specifickém jazyku (programovací jazyk, který je prostřednictvím vhodné abstrakce a výrazového slovníku zaměřen na omezenou, konkrétní problémovou doménu[7]) pro složitější analýzy – např. možnost vytvořit si vlastní indikátory uzpůsobené Vaší organizaci.

K dispozici je i verze Dimensions Plus, která v rámci institucionálního předplatného nabízí mimo jiné přístup k plným textům, podporu 24/7 a možnost současně prohledávat všechny druhy obsahu — ve volné verzi je možné prohledávat pouze publikace a datasety.


Iris.ai

Iris.ai využívá umělé inteligence a zpracování přirozeného jazyka ke kontrole rozsáhlých sbírek výzkumných prací nebo patentů, aby svým uživatelům umožnila vyhledat správné dokumenty, identifikovat a extrahovat jejich klíčová data a poznatky. [8]

Uživatel Iris pomocí 300–500 slovního popisu problému nebo adresy URL už existujícího článku vrátí služba mapu tisíců vhodných dokumentů vizuálně seskupených podle témat. Výsledkem je rychlý, a přesto přesný přehled toho, co by mělo být relevantní pro určitou výzkumnou otázku.

Iris nabízí také nástroj Focus, který umožňuje zúžit velký korpus na kratší seznam zásadní literatury vygenerované z uživatelského dotazu.

Výsledky obou typů vyhledávání je vždy možné exportovat v CSV a BIBTEX formátech.

Ve volné verzi nástroje je prohledáváno 70 milionů open acess článků, premium verze nabízí napojení i na jiné repositáře. [9]

Pro využití nástroje je nutné vytvořit si zdarma účet.


Scite

Scite (neplést si s textovým editorem SciTE/SCIntilla) je volně dostupná platforma pro vyhledávání a hodnocení vědeckých článků pomocí systému Smart Citations (chytré citování). Smart Citations umožňuje prostřednictvím hlubokého učení (subdisciplína strojového učení postavená na velkém počtu vrstvených umělých neuronových sítí)[10] odhalit kontext citací u konkrétního článku, tedy zda (a kolikrát) se za citací skrývá podpůrný nebo sporný důkaz daného tvrzení, případně i jestli je článek pouze zmíněn bez podání důkazu o jeho platnosti.

U každé citace se zobrazí výňatek z citovaného článku, takže je možné rychle vidět, jak a v jaké části je vyhledaný článek citován, bez nutnosti přečíst celý článek. Tento úryvek z citovaného článku vám umožní také prozkoumat související články (pokud existují) kliknutím na další podtržené citace (ty, které nejsou zvýrazněny modrou barvou).

Jelikož se jedná o automatický proces, který může chybovat, je přihlášeným uživatelům umožněno nahlásit chybně klasifikovanou citaci kliknutím na ikonu vlaječky vedle dané citace. Nahlášenou citaci následně zkontrolují alespoň dva nezávislí odborníci na dané téma a v případě, že se skutečně jedná o chybu, ji zpravidla do 24 hodin manuálně opraví.

Nepřihlášeným uživatelům se vygeneruje maximálně 10 citací pro jeden vyhledaný článek, pro kompletní výčet je nutné založit si na platformě zdarma účet. Tento účet umožňuje uživateli mimo jiné označit vyhledané články za své, tím si je uložit na profilu pro snadnější pozdější analýzu kontextu citací.

Scite je dostupný také jako rozšíření do prohlížečů Google Chrome a Mozilla Firefox, které umožňuje analyzovat indexované články kdekoliv, bez nutnosti vyhledávat je v rozhraní jednotlivě.

Scite také nabízí plug-in do Zotera, který umožňuje na první pohled vidět, jak byl každý článek ve vaší knihovně Zotero podporován, zpochybňován nebo zmiňován jinými články.


Semantic Scholar

Semantic Scholar je volně dostupný nástroj, který pomocí umělé inteligence prohledává vědeckou literaturu. Nástroj sémanticky — na základě významu zadaného dotazu, nikoliv jako v případě lexikálního vyhledávání, kdy se hledají přesné shody — prohledává více než 180 milionů vědeckých a odborných článků. [11]

Nástroj podporuje jak tradiční fasetová omezení výsledků (typ publikaci, časové rozmezí), tak i možnost zobrazit pouze výsledky, které obsahují plný text v PDF nebo např. Videomateriál.

Nástroj běží ve stolních i mobilních verzích prohlížečů Mozilla Firefox, Microsoft Edge, Google Chrome, Apple Safari a Opera.

K datům ze Semantic Scholar lze také přistupovat automatizovaně pomocí API, samozřejmě s nutností zdroj správně ocitovat v případě jejich publikace. [12]


Závěrem

Umělá inteligence asi zatím lidského vědce ještě nenahradí, ale může Vám pomoci získat nové poznatky z více článků, než by si mohli přečíst za celý Váš život. AI však může udělat víc než jen ušetřit vědcům čas – dokáže totiž zachytit latentní vědecké znalosti z textu a vytvářet spojení mezi obrovským objemem textu, která by jinak lidem unikla. [13]

Znáte a používáte nějaký jiný nástroj využívající umělou inteligenci, který Vám pomáhá poprat se se záplavou odborné literatury? Dejte nám o něm vědět na admin-eiz@cuni.cz!


Použité zdroje

[1] JANSSENS, Anna Caecilia Josephina Wilhelmina.  CoCites: A citation-based method for searching scientific literature [online]. Atlanta: Longstocking, LLC., 2020 [cit. 2020-11-12]. Dostupné z: https://www.cocites.com

[2] Tamtéž

[3] Tamtéž

[4] About COVIDScholar. Covid Scholar [online]. Berkeley, 2020 [cit. 2020-11-12]. Dostupné z: https://www.covidscholar.org/about

[5] MARTÍN-MARTÍN, Alberto, Mike THELWALL, Enrique ORDUNA-MALEA a Emilio DELGADO LÓPEZ-CÓZAR. Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics [online]. [cit. 2020-11-19]. ISSN 0138-9130. Dostupné z: doi:10.1007/s11192-020-03690-4

[6] Why did we build Dimensions?. Dimensions [online]. Digital Science & Research Solutions, 2020 [cit. 2020-11-10]. Dostupné z: https://www.dimensions.ai/why-dimensions

[7] Doménově specifický jazyk. In: Wikipedie: Otevřená encyklopedie [online]. San Francisco (CA): Wikimedia Foundation, 2001- [cit. 2020-11-10]. Dostupné z: https://cs.wikipedia.org/wiki/Dom%C3%A9nov%C4%9B_specifick%C3%BD_jazyk

[8] Iris.ai [online]. Gothenburg, 2015 [cit. 2020-11-12]. Dostupné z: https://iris.ai

[9] Tamtéž

[10] MATOUŠEK, Jan. Hluboké učení pro každého? Neuronové sítě a spol. Datamind [online]. Data Mind, 2009, 14. března 2018 [cit. 2020-11-10]. Dostupné z: http://www.datamind.cz/cz/blog/hluboke-uceni-neuronove-site

[11] Scaling the Scientific Literature Graph. Semantic Scholar [online]. 2015 [cit. 2020-11-10]. Dostupné z: https://pages.semanticscholar.org/about-us

[12] Semantic Scholar API. Semantic Scholar [online]. 2015 [cit. 2020-11-10]. Dostupné z: http://s2-public-api-prod.us-west-2.elasticbeanstalk.com

[13] TSHITOYAN, Vahe, John DAGDELEN, Leigh WESTON, et al. Unsupervised word embeddings capture latent knowledge from materials science literature.  Nature [online]. 2019, 571(7763), 95-98 [cit. 2020-11-12]. ISSN 0028-0836. Dostupné z: doi:10.1038/s41586-019-1335-8

Aktuality, E-zdroje and tagged . Post.