Semanttinen tutkija

Article

August 18, 2022

Semantic Scholar on tekoälyn tukema akateemisten julkaisujen hakukone, joka on kehitetty Allen Institute for AI:ssa ja julkaistiin julkisesti marraskuussa 2015. Se käyttää luonnollisen kielen prosessoinnin edistysaskeleita tiivistelmien laatimiseen tieteellisistä kirjoituksista. Semantic Scholar -tiimi tutkii aktiivisesti tekoälyn käyttöä luonnollisen kielen prosessoinnissa, koneoppimisessa, ihmisen ja tietokoneen välisessä vuorovaikutuksessa ja tiedonhaussa. Semantic Scholar aloitti tietokantana, joka ympäröi tietotekniikan, geotieteen ja neurotieteen aiheita. Vuonna 2017 järjestelmä kuitenkin alkoi sisällyttää biolääketieteellistä kirjallisuutta osakseen. Marraskuusta 2021 alkaen ne sisältävät nyt julkaisuja kaikilta tieteenaloilta.

Tekniikka

Semantic Scholar tarjoaa yhden lauseen yhteenvedon tieteellisestä kirjallisuudesta. Yksi sen tavoitteista oli vastata haasteeseen, joka liittyy lukuisten nimikkeiden ja pitkien tiivistelmien lukemiseen mobiililaitteilla. Se pyrkii myös varmistamaan, että vuosittain julkaistavat kolme miljoonaa tieteellistä artikkelia saavuttavat lukijat, sillä arvioiden mukaan vain puolet tästä kirjallisuudesta luetaan koskaan. Tekoälyä käytetään paperin olemuksen vangitsemiseen, luoden sen "abstrakti" tekniikan avulla. Projektissa käytetään koneoppimisen, luonnollisen kielen käsittelyn ja konenäön yhdistelmää lisätäkseen semanttisen analyysin kerroksen perinteisiin viittausanalyysimenetelmiin ja poimiakseen papereista asiaankuuluvat luvut, taulukot, kokonaisuudet ja tapahtumapaikat.Toisin kuin Google Scholar ja PubMed, Semantic Scholar on suunniteltu tuomaan esiin paperin tärkeimmät ja vaikutusvaltaisimmat elementit. Tekoälyteknologia on suunniteltu tunnistamaan piilotetut yhteydet ja linkit tutkimusaiheiden välillä. Kuten aiemmin mainitut hakukoneet, Semantic Scholar hyödyntää myös graafirakenteita, joita ovat Microsoft Academic Knowledge Graph, Springer Nature's SciGraph ja Semantic Scholar Corpus.Jokaiselle Semantic Scholarin isännöimälle artikkelille on määritetty yksilöllinen tunniste nimeltä Semantic Scholar Corpus ID ( lyhennetty S2CID). Seuraava merkintä on esimerkki: Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (maaliskuu 2020). "COVID-19:n lisääntymisluku on korkeampi verrattuna SARS-koronavirukseen". Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356. Semantic Scholarin käyttö on ilmaista, eikä se toisin kuin vastaavat hakukoneet (eli Google Scholar) etsi maksumuurin takana olevaa materiaalia.Yhdessä tutkimuksessa verrattiin Semantic Scholarin hakukykyjä systemaattisesti ja löydettiin hakukoneen tarkkuudella 98,88 %, kun tietoja yritetään löytää. Samassa tutkimuksessa tarkasteltiin muita Semantic Scholar -toimintoja, mukaan lukien työkalut metatietojen kartoittamiseen sekä useita lainaustyökaluja.

Käyttäjien ja julkaisujen määrä

Tammikuussa 2018 vuoden 2017 hankkeen jälkeen, johon lisättiin biolääketieteen artikkeleita ja aihetiivistelmiä, Semantic Scholar -korpus sisälsi yli 40 miljoonaa tietojenkäsittelytieteen ja biolääketieteen julkaisua. Maaliskuussa 2018 Doug Raymond, joka kehitti koneoppimisaloitteita Amazon Alexa -alustalle, palkattiin johtamaan Semantic Scholar -projektia. Elokuussa 2019 mukana olevien papereiden metatietojen (ei todellisten PDF-tiedostojen) määrä oli kasvanut yli 173 miljoonaan Microsoft Academic Graph -tietueiden lisäämisen jälkeen. Vuonna 2020 Semantic Scholarin ja University of Chicago Press Journalsin yhteistyö tuo kaikki University of Chicago Pressin alla julkaistut artikkelit saataville Semantic Scholar -korpukseen. Vuoden 2020 lopussa Semantic Scholar oli indeksoinut 190 miljoonaa paperia. Vuonna 2020 Semantic Scholarin käyttäjiä oli seitsemän miljoonaa kuukaudessa.

Katso myös

Viittausanalyysi – Asiakirjojen viittausten esiintymistiheyden, kuvioiden ja kaavioiden tutkiminen Citation index – julkaisujen väliset lainaukset Tiedon talteenotto – Tiedon luominen strukturoiduista ja jäsentämättömistä lähteistä Luettelo akateemisista tietokannoista ja hakukoneista Scientom