Semantisk lærd

Article

August 18, 2022

Semantic Scholar er en kunstig intelligensstøttet søkemotor for akademiske publikasjoner utviklet ved Allen Institute for AI og offentlig utgitt i november 2015. Den bruker fremskritt innen naturlig språkbehandling for å gi sammendrag for vitenskapelige artikler. Semantic Scholar-teamet forsker aktivt på bruken av kunstig intelligens i naturlig språkbehandling, maskinlæring, menneske-datamaskin-interaksjon og informasjonsinnhenting.Semantic Scholar begynte som en database rundt emnene datavitenskap, geovitenskap og nevrovitenskap. Imidlertid begynte systemet i 2017 å inkludere biomedisinsk litteratur i korpuset. Fra november 2021 inkluderer de nå publikasjoner fra alle vitenskapsfelt.

Teknologi

Semantic Scholar gir en setningssammendrag av vitenskapelig litteratur. Et av målene var å møte utfordringen med å lese en rekke titler og lange sammendrag på mobile enheter. Den søker også å sikre at de tre millioner vitenskapelige artikler som publiseres årlig når leserne siden det anslås at bare halvparten av denne litteraturen noen gang blir lest. Kunstig intelligens brukes til å fange essensen av en artikkel, og generere den gjennom en "abstraktiv" teknikk. Prosjektet bruker en kombinasjon av maskinlæring, naturlig språkbehandling og maskinsyn for å legge til et lag med semantisk analyse til de tradisjonelle metodene for siteringsanalyse, og for å trekke ut relevante figurer, tabeller, enheter og arenaer fra artikler. I motsetning til Google Scholar og PubMed, Semantic Scholar er designet for å fremheve de viktigste og mest innflytelsesrike elementene i en artikkel. AI-teknologien er designet for å identifisere skjulte forbindelser og koblinger mellom forskningsemner. I likhet med de tidligere siterte søkemotorene, utnytter Semantic Scholar også grafstrukturer, som inkluderer Microsoft Academic Knowledge Graph, Springer Nature's SciGraph og Semantic Scholar Corpus. Hver oppgave som arrangeres av Semantic Scholar er tildelt en unik identifikator kalt Semantic Scholar Corpus ID ( forkortet S2CID). Følgende oppføring er et eksempel: Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (mars 2020). "Det reproduktive antallet av COVID-19 er høyere sammenlignet med SARS-koronaviruset." Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.Semantic Scholar er gratis å bruke og i motsetning til lignende søkemotorer (dvs. Google Scholar) søker ikke etter materiale som ligger bak en betalingsmur. En studie sammenlignet søkeevnene til Semantic Scholar gjennom en systematisk tilnærming, og fant søkemotoren skal være 98,88 % nøyaktig når du forsøker å avdekke dataene. Den samme studien undersøkte andre Semantic Scholar-funksjoner, inkludert verktøy for å kartlegge metadata samt flere siteringsverktøy.

Antall brukere og publikasjoner

Fra januar 2018, etter et 2017-prosjekt som la til biomedisinske artikler og emnesammendrag, inkluderte Semantic Scholar-korpuset mer enn 40 millioner artikler fra informatikk og biomedisin. I mars 2018 ble Doug Raymond, som utviklet maskinlæringsinitiativer for Amazon Alexa-plattformen, ansatt for å lede Semantic Scholar-prosjektet. Fra august 2019 hadde antallet inkluderte papirmetadata (ikke de faktiske PDF-ene) vokst til mer enn 173 millioner etter tillegg av Microsoft Academic Graph-postene. I 2020 gjorde et partnerskap mellom Semantic Scholar og University of Chicago Press Journals alle artikler publisert under University of Chicago Press tilgjengelig i Semantic Scholar-korpuset. På slutten av 2020 hadde Semantic Scholar indeksert 190 millioner papirer. I 2020 nådde brukerne av Semantic Scholar syv millioner i måneden.

Se også

Siteringsanalyse – Undersøkelse av frekvens, mønstre og grafer for siteringer i dokumenter Sitasjonsindeks – Indeks over siteringer mellom publikasjoner Kunnskapsutvinning – Skapelse av kunnskap fra strukturerte og ustrukturerte kilder Liste over akademiske databaser og søkemotorer Scientom