Szemantikai tudós

Article

August 18, 2022

A Semantic Scholar egy mesterséges intelligencia által támogatott keresőmotor akadémiai publikációkhoz, amelyeket az Allen Institute for AI-ben fejlesztettek ki, és 2015 novemberében adták ki nyilvánosan. A természetes nyelvi feldolgozás fejlődését használja fel a tudományos közlemények összefoglalására. A Semantic Scholar csapata aktívan kutatja a mesterséges intelligencia természetes nyelvi feldolgozásban, gépi tanulásban, ember-számítógép interakcióban és információkeresésben való felhasználását. A Semantic Scholar a számítástechnika, a geotudomány és az idegtudomány témáit körülvevő adatbázisként indult. 2017-ben azonban a rendszer elkezdte bevonni az orvosbiológiai szakirodalmat a korpuszba. 2021 novemberétől a tudomány minden területéről tartalmaznak publikációkat.

Technológia

A Semantic Scholar egymondatos összefoglalót nyújt a tudományos irodalomról. Egyik célja az volt, hogy megbirkózzon azzal a kihívással, hogy számos címet és terjedelmes absztraktot olvassanak el mobileszközökön. Arra is törekszik, hogy az évente megjelenő hárommillió tudományos közlemény eljusson az olvasókhoz, mivel a becslések szerint ennek az irodalomnak csak a felét olvassák el. A mesterséges intelligenciát arra használják, hogy megragadják a dolgozat lényegét, és azt "absztrakciós" technikával hozzák létre. A projekt a gépi tanulás, a természetes nyelvi feldolgozás és a gépi látás kombinációját használja fel, hogy szemantikai elemzést adjon a hagyományos idézetelemzési módszerekhez, és releváns ábrákat, táblázatokat, entitásokat és helyszíneket vonjon ki a papírokból. A Google-lal ellentétben A Scholar és a PubMed, a Semantic Scholar célja, hogy kiemelje a dolgozat legfontosabb és legbefolyásosabb elemeit. Az AI technológiát úgy tervezték, hogy azonosítsa a rejtett kapcsolatokat és kapcsolatokat a kutatási témák között. A korábban idézett keresőmotorokhoz hasonlóan a Semantic Scholar is kihasználja a gráfstruktúrákat, amelyek magukban foglalják a Microsoft Academic Knowledge Graph-ot, a Springer Nature's SciGraph-ot és a Semantic Scholar Corpus-t. A Semantic Scholar által üzemeltetett minden egyes tanulmányhoz egyedi azonosító, a Semantic Scholar Corpus ID ( rövidítve S2CID). A következő bejegyzés egy példa: Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (2020. március). "A COVID-19 szaporodási száma magasabb a SARS-koronavírushoz képest." Journal of Travel Medicine. 27. (2) bekezdése alapján. doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356. A Semantic Scholar ingyenesen használható, és a hasonló keresőmotorokkal (azaz a Google Scholarral) ellentétben nem keres olyan anyagokat, amelyek fizetőfal mögött vannak. Egy tanulmány a Semantic Scholar keresési képességeit hasonlította össze szisztematikus megközelítéssel, és megállapította, hogy a keresőmotor 98,88%-os pontosságú legyen, amikor megpróbálja feltárni az adatokat. Ugyanez a tanulmány más Semantic Scholar-funkciókat is megvizsgált, beleértve a metaadatok felmérésére szolgáló eszközöket, valamint számos hivatkozási eszközt.

Felhasználók és publikációk száma

2018 januárjában egy 2017-es projektet követően, amely orvosbiológiai tanulmányokat és téma-összefoglalókat egészített ki, a Semantic Scholar korpusz több mint 40 millió számítástechnikai és biomedicinális dolgozatot tartalmazott. 2018 márciusában Doug Raymondot, aki gépi tanulási kezdeményezéseket fejlesztett ki az Amazon Alexa platformhoz, felvették a Semantic Scholar projekt vezetésére. 2019 augusztusára a Microsoft Academic Graph rekordjainak hozzáadását követően több mint 173 millióra nőtt a benne foglalt dokumentumok metaadatok (nem a tényleges PDF-ek) száma. 2020-ban a Semantic Scholar és a University of Chicago Press Journals együttműködése révén a University of Chicago Press alatt megjelent összes cikk elérhetővé vált a Semantic Scholar korpuszban. 2020 végén a Semantic Scholar 190 millió papírt indexelt. 2020-ban a Semantic Scholar felhasználói elérte a havi hétmilliót.

Lásd még

Idézetelemzés – A dokumentumokban található hivatkozások gyakoriságának, mintázatainak és grafikonjainak vizsgálata Citation index – Publikációk közötti hivatkozások mutatója Tudáskinyerés – Tudásteremtés strukturált és strukturálatlan forrásokból Akadémiai adatbázisok és keresőmotorok listája Scientom