Semantisch geleerde

Article

July 5, 2022

Semantic Scholar is een door kunstmatige intelligentie ondersteunde zoekmachine voor academische publicaties, ontwikkeld door het Allen Institute for AI en openbaar uitgebracht in november 2015. Het maakt gebruik van vooruitgang in de verwerking van natuurlijke taal om samenvattingen voor wetenschappelijke artikelen te leveren. Het Semantic Scholar-team doet actief onderzoek naar het gebruik van kunstmatige intelligentie in natuurlijke taalverwerking, machinaal leren, mens-computerinteractie en het ophalen van informatie. Semantic Scholar begon als een database rond de onderwerpen informatica, geowetenschappen en neurowetenschappen. In 2017 is het systeem echter begonnen met het opnemen van biomedische literatuur in zijn corpus. Vanaf november 2021 bevatten ze publicaties uit alle wetenschapsgebieden.

Technologie

Semantic Scholar geeft een samenvatting van wetenschappelijke literatuur in één zin. Een van de doelen was om de uitdaging aan te gaan van het lezen van talloze titels en lange samenvattingen op mobiele apparaten. Het probeert er ook voor te zorgen dat de drie miljoen wetenschappelijke artikelen die jaarlijks worden gepubliceerd de lezers bereiken, aangezien naar schatting slechts de helft van deze literatuur ooit wordt gelezen. Kunstmatige intelligentie wordt gebruikt om de essentie van een artikel vast te leggen en deze te genereren door middel van een 'abstractieve' techniek. Het project gebruikt een combinatie van machine learning, natuurlijke taalverwerking en machine vision om een ​​laag semantische analyse toe te voegen aan de traditionele methoden van citatieanalyse en om relevante figuren, tabellen, entiteiten en locaties uit papers te extraheren. In tegenstelling tot Google Scholar en PubMed, Semantic Scholar is ontworpen om de belangrijkste en meest invloedrijke elementen van een paper te benadrukken. De AI-technologie is ontworpen om verborgen verbanden en verbanden tussen onderzoeksthema's te identificeren. Net als de eerder geciteerde zoekmachines, maakt Semantic Scholar ook gebruik van grafiekstructuren, waaronder de Microsoft Academic Knowledge Graph, Springer Nature's SciGraph en het Semantic Scholar Corpus. Elke paper die wordt gehost door Semantic Scholar krijgt een unieke identificator toegewezen, de Semantic Scholar Corpus ID ( afgekort S2CID). De volgende invoer is een voorbeeld: Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (maart 2020). "Het reproductieve aantal van COVID-19 is hoger in vergelijking met het SARS-coronavirus". Tijdschrift voor reisgeneeskunde. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.Semantic Scholar is gratis te gebruiken en zoekt in tegenstelling tot vergelijkbare zoekmachines (d.w.z. Google Scholar) niet naar materiaal dat zich achter een betaalmuur bevindt. zoekmachine om 98,88% nauwkeurig te zijn bij een poging om de gegevens te achterhalen. Dezelfde studie onderzocht andere Semantic Scholar-functies, waaronder tools om metadata te onderzoeken, evenals verschillende citatietools.

Aantal gebruikers en publicaties

In januari 2018 omvatte het Semantic Scholar-corpus, na een project uit 2017 waarin biomedische papers en onderwerpsamenvattingen werden toegevoegd, meer dan 40 miljoen papers uit de informatica en de biogeneeskunde. In maart 2018 werd Doug Raymond, die machine learning-initiatieven ontwikkelde voor het Amazon Alexa-platform, ingehuurd om het Semantic Scholar-project te leiden. Vanaf augustus 2019 was het aantal opgenomen metadata van papers (niet de eigenlijke PDF's) gegroeid tot meer dan 173 miljoen na de toevoeging van de Microsoft Academic Graph-records. In 2020 heeft een samenwerking tussen Semantic Scholar en de University of Chicago Press Journals alle artikelen die zijn gepubliceerd onder de University of Chicago Press beschikbaar gemaakt in het Semantic Scholar-corpus. Eind 2020 had Semantic Scholar 190 miljoen papers geïndexeerd. In 2020 bereikten gebruikers van Semantic Scholar zeven miljoen per maand.

Zie ook

Citaatanalyse – Onderzoek van de frequentie, patronen en grafieken van citaties in documenten Citatie-index – Index van citaties tussen publicaties Kennisextractie - Creatie van kennis uit gestructureerde en ongestructureerde bronnen Lijst van academische databases en zoekmachines Scientom