Семантиц Сцхолар

Article

July 5, 2022

Семантиц Сцхолар је претраживач академских публикација подржан вештачком интелигенцијом развијен на Аллен институту за вештачку интелигенцију и јавно објављен у новембру 2015. Користи напредак у обради природног језика да би пружио сажетке за научне радове. Тим Семантиц Сцхолар-а активно истражује употребу вештачке интелигенције у обради природног језика, машинском учењу, интеракцији човека и рачунара и проналажењу информација. Семантиц Сцхолар је почео као база података која окружује теме рачунарске науке, геонауке и неуронауке. Међутим, 2017. године систем је почео да укључује биомедицинску литературу у свој корпус. Од новембра 2021. сада обухватају публикације из свих области науке.

Технологија

Семантиц Сцхолар даје сажетак научне литературе у једној реченици. Један од његових циљева био је да одговори на изазов читања бројних наслова и дугачких сажетака на мобилним уређајима. Такође настоји да обезбеди да три милиона научних радова који се објављују годишње дођу до читалаца, јер се процењује да се само половина ове литературе икада прочита. Вештачка интелигенција се користи да би се ухватила суштина рада, генеришући је помоћу "апстрактне" технике. Пројекат користи комбинацију машинског учења, обраде природног језика и машинског вида како би додао слој семантичке анализе традиционалним методама анализе цитата и извукао релевантне фигуре, табеле, ентитете и места из радова. За разлику од Гоогле-а Сцхолар и ПубМед, Семантиц Сцхолар је дизајниран да истакне најважније и најутицајније елементе рада. АИ технологија је дизајнирана да идентификује скривене везе и везе између тема истраживања. Попут претходно цитираних претраживача, Семантиц Сцхолар такође користи структуре графова, које укључују Мицрософт Ацадемиц Кновледге Грапх, Спрингер Натуре'с СциГрапх и Семантиц Сцхолар Цорпус. Сваком раду који хостује Семантиц Сцхолар се додељује јединствени идентификатор који се зове Семантиц Сцхолар Цорпус ИД ( скраћено С2ЦИД). Следећи унос је пример: Лиу, Јинг; Гаиле, Алберт А; Вајлдер-Смит, Анелис; Роклов, Јоаким (март 2020). „Репродуктивни број ЦОВИД-19 је већи у поређењу са САРС коронавирусом. Часопис за медицину путовања. 27 (2). дои:10.1093/јтм/тааа021. ПМИД 32052846. С2ЦИД 211099356.Семантиц Сцхолар је слободан за коришћење и за разлику од сличних претраживача (тј. Гоогле Сцхолар) не претражује материјал који се налази иза паивалл-а. Једна студија је упоредила могућности претраживања Семантиц Сцхолар-а кроз систематски приступ и открила претраживач да буде 98,88% тачан када покушава да открије податке. Иста студија је испитала друге функције Семантиц Сцхолар-а, укључујући алате за истраживање метаподатака, као и неколико алата за цитирање.

Број корисника и публикација

Од јануара 2018. године, након пројекта из 2017. који је додао биомедицинске радове и сажетке тема, корпус Семантиц Сцхолар обухватао је више од 40 милиона радова из рачунарства и биомедицине. У марту 2018. године, Даг Рејмонд, који је развио иницијативе за машинско учење за платформу Амазон Алека, ангажован је да води пројекат Семантиц Сцхолар. Од августа 2019, број укључених метаподатака радова (не стварних ПДФ-ова) порастао је на више од 173 милиона након додавања записа Мицрософт Ацадемиц Грапх. 2020. године, партнерство између Семантиц Сцхолар-а и Университи оф Цхицаго Пресс Јоурналс учинило је све чланке објављене у часопису Университи оф Цхицаго Пресс доступним у корпусу Семантиц Сцхолар-а. На крају 2020. Семантиц Сцхолар је индексирао 190 милиона радова. У 2020. корисници Семантиц Сцхолар-а су достигли седам милиона месечно.

Види такође

Анализа цитата – Испитивање учесталости, образаца и графикона цитата у документима Индекс цитираности – Индекс цитата између публикација Екстракција знања – Стварање знања из структурираних и неструктурираних извора Списак академских база података и претраживача Сциентом