Semantischer Gelehrter

Article

July 5, 2022

Semantic Scholar ist eine auf künstlicher Intelligenz basierende Suchmaschine für wissenschaftliche Veröffentlichungen, die am Allen Institute for AI entwickelt und im November 2015 veröffentlicht wurde. Sie nutzt Fortschritte in der Verarbeitung natürlicher Sprache, um Zusammenfassungen für wissenschaftliche Arbeiten bereitzustellen. Das Team von Semantic Scholar erforscht aktiv den Einsatz künstlicher Intelligenz in der Verarbeitung natürlicher Sprache, maschinellem Lernen, Mensch-Computer-Interaktion und Informationsabruf. Semantic Scholar begann als Datenbank rund um die Themen Informatik, Geowissenschaften und Neurowissenschaften. Im Jahr 2017 begann das System jedoch, biomedizinische Literatur in sein Korpus aufzunehmen. Sie umfassen seit November 2021 Publikationen aus allen Wissenschaftsbereichen.

Technologie

Semantic Scholar bietet eine Zusammenfassung der wissenschaftlichen Literatur in einem Satz. Eines seiner Ziele war es, die Herausforderung anzugehen, zahlreiche Titel und lange Abstracts auf mobilen Geräten zu lesen. Es soll auch sicherstellen, dass die drei Millionen jährlich veröffentlichten wissenschaftlichen Arbeiten Leser erreichen, da schätzungsweise nur die Hälfte dieser Literatur jemals gelesen wird.Künstliche Intelligenz wird verwendet, um die Essenz einer Arbeit zu erfassen und sie durch eine "abstrakte" Technik zu erzeugen. Das Projekt verwendet eine Kombination aus maschinellem Lernen, Verarbeitung natürlicher Sprache und maschinellem Sehen, um den traditionellen Methoden der Zitationsanalyse eine Ebene der semantischen Analyse hinzuzufügen und relevante Zahlen, Tabellen, Entitäten und Orte aus Papieren zu extrahieren. Im Gegensatz zu Google Scholar und PubMed, Semantic Scholar wurde entwickelt, um die wichtigsten und einflussreichsten Elemente einer Arbeit hervorzuheben. Die KI-Technologie soll versteckte Verbindungen und Verknüpfungen zwischen Forschungsthemen erkennen. Wie die zuvor genannten Suchmaschinen nutzt auch Semantic Scholar Graphstrukturen, zu denen der Microsoft Academic Knowledge Graph, SciGraph von Springer Nature und das Semantic Scholar Corpus gehören. abgekürzt S2CID). Der folgende Eintrag ist ein Beispiel: Liu, Yin; Gayle, Albert A.; Wilder-Smith, Annelies; Rocklöv, Joacim (März 2020). „Die Fortpflanzungszahl von COVID-19 ist höher als beim SARS-Coronavirus“. Zeitschrift für Reisemedizin. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.Semantic Scholar kann kostenlos verwendet werden und sucht im Gegensatz zu ähnlichen Suchmaschinen (z. B. Google Scholar) nicht nach Material, das sich hinter einer Paywall befindet Suchmaschine zu 98,88 % genau, wenn sie versucht, die Daten aufzudecken. In derselben Studie wurden weitere Funktionen von Semantic Scholar untersucht, darunter Tools zur Erhebung von Metadaten sowie mehrere Zitationstools.

Anzahl der Benutzer und Veröffentlichungen

Ab Januar 2018 umfasste das Semantic Scholar-Korpus nach einem Projekt aus dem Jahr 2017, das biomedizinische Artikel und Themenzusammenfassungen hinzufügte, mehr als 40 Millionen Artikel aus den Bereichen Informatik und Biomedizin. Im März 2018 wurde Doug Raymond, der maschinelle Lerninitiativen für die Amazon Alexa-Plattform entwickelt hat, mit der Leitung des Semantic Scholar-Projekts beauftragt. Bis August 2019 war die Anzahl der enthaltenen Papiermetadaten (nicht die eigentlichen PDFs) nach dem Hinzufügen der Microsoft Academic Graph-Datensätze auf mehr als 173 Millionen angewachsen. Im Jahr 2020 machte eine Partnerschaft zwischen Semantic Scholar und den University of Chicago Press Journals alle Artikel, die unter der University of Chicago Press veröffentlicht wurden, im Korpus von Semantic Scholar verfügbar. Ende 2020 hatte Semantic Scholar 190 Millionen Artikel indexiert. Im Jahr 2020 erreichten die Nutzer von Semantic Scholar sieben Millionen pro Monat.

Siehe auch

Zitationsanalyse – Untersuchung der Häufigkeit, Muster und Graphen von Zitaten in Dokumenten Zitationsindex – Index der Zitate zwischen Veröffentlichungen Wissensextraktion – Erzeugung von Wissen aus strukturierten und unstrukturierten Quellen Liste wissenschaftlicher Datenbanken und Suchmaschinen Scientom